“市面上的AI教程都在追求全自动化,但我却反其道而行之。”
生财YouTube深海圈@萧炎,他发现,没有人工参与的作品始终缺乏“人味”,而真正的爆款往往源于对脚本的“微创新”。
他坚持“一个人就是一支电影团队”的理念,利用 Gemini 3.5 + 即梦/Banana Pro + 可灵 2.6 的组合,摸索出一套在10分钟内完成高质量爆款复刻的全流程。

大家好,我是萧炎,Youtube深海圈的小伙伴。
这篇文章的实质内容就是:Gemini 3.5 + 即梦/Banana Pro +可灵2.6 爆款视频全流程实战。
最终目标:“一个人就是一支电影团队”。一个人就能在10分钟内完成爆款视频复刻、脚本微创新,可制作成全自动化。
但是不建议做成全自动化,没有人工参与的作品创作,始终没有人味,而这篇文章能够体现出“人味”的环节就是修改脚本,大胆结合爆款视频,使用AI去创新,尤其是使用Gemini去创作。这是本篇文章的核心理念!
市面上有关Youtube项目的工具和教程应接不暇、琳琅满目。但是适合我使用的内容少之又少,主要存在以下几点问题:
❖
缺乏广泛性的案例解析、制作演示
❖
缺乏详细的提示词调试过程演示
❖
缺乏多维度的痛点解决方案
❖
过度追求全自动化操作
我也是“从零开始做Youtube项目”,所以我知道新人、小白、大佬们的真实想法和需求。无非就是如何平衡“质量、收益、速度、价格”的关系。
我的观念是“一开始就是用质量P的模型,会让你更加持久,当然高价也能筛选掉很多人”。付出多少钱,就能翻倍赚回多少钱。
本篇文章初步从大家的实际痛点和实际需求出发,在@一卒教练@壹欧壹圈友@轻舟教练的精华帖基础上整理、拓展而出。
Part 1
提示词功能
以下这些案例视频均可由Lovart、可灵2.6、即梦4.03.0模型生成。推荐使用Agent模式进行生成。
01
建立对标素材库
支持“仅拆解对标视频”,这个提示词中的一个功能就是“快速协助我们拆解对标视频”。
仅需提供一个Youtube视频链接或者上传本地视频,即可生成对标视频拆解报告,在回复的内容基础上还支持继续追问,可以给你提供许多意想不到的改编思路。

此模式的优势在于:
❖
可以帮助我们快速筛选对标视频,并进行分类。
例如:可以筛选出故事转折类脚本、真人IP脚本等视频。
❖
可以帮助我们快速提取出原视频中的爆款IP形象。
例如:可以提取出KPOP中的爆款IP形象。
❖
可以帮助我们快速获取到可落地实践的改编思路。
例如:把真人视频中的脚本迁移至KPOP IP中,并且能够提出脚本微创新的建议。
02
微创新爆款脚本
可根据脚本内容,提出差异化建议,且这些建议可以拓展思路。
在原爆款视频的基础上进行微创新,增加差异化,参数设置如下:
参数设置
1
2 ==== 必填项 (Essential) ====
3 图片比例:9:16
4 目标风格:与原视频风格严格保持一致
5 ==== 选填项 (Optional) ====
6 图片生成工具(分镜):Banana Pro
7 营销带货植入(YouTube联盟):蜜雪冰城饮品,请严格宣传蜜雪冰城
8 爆款要素融合与多源指令:将视频中的星巴克元素替换成图片中的白色雪王元素,要突出蜜雪冰城这个产品特征
9 分镜数量:严格原视频保持一致
10 固定脚本模式:是
11 角色替换:将视频中的星巴克元素替换成图片中的白色雪王,要突出蜜雪冰城这个产品特征
12 场景替换:与原视频场景保持一致
13 剧情/爆点微调:与原视频严格保持一致
14 目标受众:与原视频严格保持一致
而微创新的思路就来自于提示词生成的差异化建议。

03
快速复制形式爆款脚本
Youtube平台有类似几秒的视频,脚本不长且没有连贯逻辑,要么就要求我们快速复刻。
该提示词中兼容生成Veo3、sora模型提示词。但是由于Sora、Veo这两个模型是属于音画同步的模型,故更适合生成一致性较强的长视频,比如能够生成1分钟的长视频,此方法后续会在文章中进行更新。
04
适用于带货联盟广告视频
使用Banana Pro模型可以生成带有产品图的视频分镜。
例1:带货耐克的鞋子,可以将耐克鞋子自然融入进剧情脚本中。我们可以在参数中明确耐克鞋子在视频中的分量,也可以强调重要性。

生成视频的参数设置很简单,就只需要上传参考视频,回复以下内容:
参数设置
1 ==== 必填项 (Essential) ====
2 图片比例:16:9
3 目标风格:超写实主义电影风格,现实风格
4 ==== 选填项 (Optional) ====
5 图片生成工具(分镜):Banana Pro
6 营销带货植入(YouTube联盟):穿着耐克鞋子,头戴阿迪达斯帽子,身穿李宁女士运动背心
7 分镜数量:15
8 固定脚本模式:是
9 角色替换:使用原视频中的女主角,性感,我会同时上传参考图
10 场景替换:内蒙古大草原
11 目标受众:与原视频高度一致
05
一键生成高点击率封面图
高转化率(CTR)的Youtube封面会提升视频的播放率和完播率。因此该提示词也会根据脚本自动生成相应主题的爆款封面。

由于Youtube Short视频中封面图的重要性并没有长视频Video中的封面图强,我们需要把生成封面图的经历放在长视频封面图上,该提示词能够自动生成与原视频风格一致的封面图。
同时,提供四种不同逻辑的封面(复刻、对比、文字、猎奇)能让用户进行 A/B 测试,最大化 CTR。
封面图示例提示词如下:
封面提示词
1 [中文提示词]: 1. 画面主体:@雪王号列车(白色毛绒包裹的高铁,车头巨大的雪王笑脸涂装,车身系着红色丝绒蝴蝶结),正向镜头驶来;2. 构图与复刻:严格复刻原视频列车进站的对角线构图,车头特写;3. 视觉语言:红白对比色,高明度;4. 背景:@上海地标合集(上海火车站月台,虚化背景);5. 风格:CGI广告风格,虚假户外广告(FOOH),3D角色动画,超写实渲染,8k分辨率。
2 [EN Prompt]: /imagine prompt: Close-up of @Prop(Snow King Train), a high-speed train wrapped in white fluffy fur with a giant Snow King face on the front, red velvet bow ties, driving towards camera at 45 degree angle. Background: @Environment(Shanghai Train Station Platform). Style: CGI advertising, FOOH, hyper-realistic, 3D animation, bright lighting, high contrast red and white, 8k resolution, Octane render --ar 9:16 --v 6.0
支持复刻原视频封面图爆点:
代码块
1 核心成功范式: “毛绒质感列车” + “熟悉的地标” + “巨大的品牌Logo”。
2 复刻策略: 严格复刻原视频的列车进站构图,但将绿色毛绒换成白色雪王毛绒,车头是大大的雪王笑脸,增加视觉冲击力。
3 视觉语言与符号学策略:
4 色彩语言: 大面积的白色(纯洁/雪)+ 点缀红色(热情/品牌色),在深色背景下极其醒目。
5 构图引导: 列车呈45度角冲向镜头,产生视觉压迫感和动态感。
6 底层心理学逻辑: 利用**[好奇心](这是真的列车吗?)和[萌系治愈]**(毛茸茸的东西让人想摸)。
7 文字策略:
8 规则A (若 9:16): 严禁添加文字。
生成的效果如下(9:16):




生成的效果如下(16:9):

06
快速制作原创中、英文MV
音乐MV赛道是目前热门赛道,因此需要很多分镜去支撑整个剧情。
这个提示词支持生成MV模式,即支持超过99个分镜生成。在生成分镜视频的时候,也会生成相应的背景音乐和主题音乐,且可避开版权风险。

在制作MV分镜的时候,可以结合shorts、Video视频的脚本进行修改,在原对话框中继续输入以下提示词:
提示词
1 请将原视频的脚本修改成MV脚本,MV的分镜数为99分镜,并生成对应的Suno音乐和歌词(中英文)。
Part 2
实操演示
接下来,在本章中我将会使用图文的形式给大家演示一遍使用方法。
注意:在生成内容的时候,可以继续与AI对话,以实现自己的目标。
演示所用的对标视频链接:
代码块
1https://www.youtube.com/shorts/9e5c2j8Hg1A
01
获取AI回复
打开Google AI studio网站,选择Gemini 3.0 Pro,在对话框中粘贴提示词。

02
选择模式
根据自身的实际需求,选择适合的模式。若只拆解视频,则只需回复:
回复内容
1 ==== 模式选择 (Mode Selection) ====
2 仅分析爆款视频模式:是
3
4视频链接https://www.youtube.com/shorts/9e5c2j8Hg1A
回复得到以下内容(篇幅有限,截图部分结果图):

对标素材库搭建时大家的一个痛点,主要体现在:
1.对标视频如何选择?
2.对标视频如何拆解?
2.拆解后的内容如何利用?
选择对标视频
因为我在深海圈的风向标群里,所以我能第一时间看到大家分享的风向标,而圈友们分享的风向标大多数可以直接作为对标视频使用。
这就是参加深海圈的一个好处,即不用自己去盲目查找对标视频。
我选择对标视频的原则:
❖
视频的确有看点。
❖
视频的互动数据很好。
❖
频道能够持续更新。
假设我在深海圈风向标的群中看见了某个不错的视频,我便会把这个视频收藏起来。然后初步浏览一遍该视频和对应的频道。
因为圈友们在分享视频的时候,往往会同步分享出该视频或者该频道的推荐理由。我一个人至多做三个赛道,群里有很多圈友,所有在做的赛道有好多。
所以在风向标群里,查找对标视频简直是"轻而易举"。

拆解对标视频
找好对标视频之后,最关键的一件事就是”需要及时对对标视频“进行拆解。而我提供的这个提示词支持直接粘贴youtube对标视频链接实现拆解,并生成完整的对标拆解报告。
对标拆解报告所包含的内容如下:
❖
原片深度拆解
❖
市场与同质化诊断
❖
合规性与风险红线
❖
重构战略
❖
资产清单
具体的操作流程如下:
第一步:打开Google AI studio网址,选择Gemini 3模型,将提示词粘贴进对话框中。

第二步:等待Gemini回复,粘贴对标视频链接,并根据回复的内容输入参数。举例演示:
代码块
1 我的对标视频链接为:https://www.youtube.com/shorts/9e5c2j8Hg1A
因为仅需要拆解视频,不需要重新生成脚本,故我仅需要回复以下内容:
代码块
1 ==== 模式选择 (Mode Selection) ====
2 仅分析爆款视频模式:是
3
4 对标视频链接:https://www.youtube.com/shorts/9e5c2j8Hg1A

第三步:初步阅读生成的内容,了解大致的视频情况。(注意:生成的内容仅供参考,请适当选择使用。)
你会得到一份完整的《拆解报告》,在这份《拆解报告》中你可以看到以下内容:

如果对拆解出来的内容有任何疑问,或者需要让AI更进一步拆解深层次的内容,你可以继续在同一个对话框中和AI对话,输入并发送你的需求和想法。
例如:
差异化方向
1 我需要你帮我列出三个增加差异化的改编方向,请完整输出全部内容。

详细的潜在风险点
1 我需要你帮我分析这个视频中潜在的违规风险点。

参考图单独生成
1 请帮我生成该视频中的角色参考图提示词,请完整输出。

第四步:将生成的内容复制、粘贴进飞书文档中,并将原视频中的角色参考图进行生成,同时保存进飞书文档中。

注意:在拆解对标视频的结果中,及时把参考图的提示词进行保存。
利用对标视频
我们拆解对标视频,以及制作对标素材库的目的终究是为了“复刻视频”服务,那么我们就要使用起来。
在《拆解报告》中我得到了对“原视频的深度拆解”内容,主要有以下内容:

这部分内容可以快速帮助我了解整个视频的脚本走向,而增加视频脚本差异化的前提就是要知道:
❖
爆款视频的脚本结构是什么样的?
❖
爆款视频的画面感是怎样的?
❖
爆款视频的封面是怎样的?
除了直接让AI生成差异化的建议以外,我通常会把该部分内容直接复制给另外一个对话中,生成新的脚本。
Part 3
风险点检查
最近几个月Youtube平台对内容的质量管控严格,主要管控以下三点:
❖
将儿童置于危险场所。
❖
内容画面、脚本同质化。
❖
血腥暴力、嘲笑自然灾害。
我在提示词中做了严格检查和限制,这样提示词在生成脚本的时候,会可以避开此类违规点。
而我们寻找对标频道或者对标视频的最终目的就是去模仿这些视频的内容。所以我们在做视频过程中难免会遇到以下问题:
❖
我既想要出现儿童,又要避免违规,该怎么做?
❖
我既想要模仿爆款视频,但是又不能被判定同质化,该怎么办?
❖
我既想要画面刺激精彩,又想要避免过于夸张,我又该怎么办?
所以我在调试这个提示词前,我仔细分析了其中的痛点,根据圈友在航海日志中的描述,整理了需求。
“儿童违规”是最近比较热门的违规点。我不建议视频中出现儿童!但是儿童作为流量爆款密码,在很多情况下不得不出现。
YouTube 对儿童内容的审核遵循“零容忍”和“宁错杀不放过”的原则。违规不仅指真实的虐待,也包含“看起来像虐待”或“可能导致儿童模仿危险”的内容。
因此我在提示词中添加了以下限制条件,以确保生成的新脚本和提示词不会触犯儿童危险的准则。

01
身体安全与危险行为
以下行为,我结合深海圈的分享,让Gemini帮我生成,它比我更加专业。
判定标准:
❖
危险挑战:
展示儿童参与危险的挑战(如吃洗衣球、窒息挑战)。
❖
接触危险品:
儿童手中持有或触碰刀具、枪支(包括仿真度高的玩具)、火源、药品、有毒液体。
❖
危险环境:
儿童独自出现在高处(屋顶、窗边)、繁忙马路、深水边、铁路旁,且画面中无成人监护。
❖
武器幻觉:
你提示词写的是“拿玩具枪”,AI 可能生成一把非常写实的黑色手枪。
❖
环境歧义:
背景过于模糊或黑暗,被算法误判为废墟或不安全场所。
02
精神痛苦与虐待
精神伤害也是伤害,所以尽可能避开“虐待”类脚本,尤其是动画风格的脚本,因为动画面向的群体本身是儿童。
判定标准:
❖
恶意恶作剧:
展示成人恐吓儿童,导致儿童极度惊恐、哭泣、尖叫。
❖
羞辱惩罚:
拍摄儿童被责骂、罚站、被羞辱的过程。
❖
家庭暴力暗示:
即使没有打下去,高举的手、挥舞的皮带也算违规。
❖
恐怖谷表情:
AI 生成的“大笑”或“惊讶”如果用力过猛,看起来会像“惊恐”或“痛苦的扭曲”。审核算法分不清是由于作画崩坏还是真实虐待,通常直接封杀。
❖
身体畸形:
AI 生成的少一只胳膊、多一只眼睛、皮肤溃烂感,会被判定为 "Gore"(血腥/身体恐怖) 或 "Abuse"(虐待造成的伤痕)。
03
行为不当主题混搭
不当行为依然大概率会被认定为”儿童危害“,所以有儿童必须要出现,那么就不要有这些犯罪的情节。
判定标准:
❖
毁童年IP:
使用知名卡通形象(蜘蛛侠、艾莎、米老鼠)进行不当行为(抽烟、喝酒、打针、怀孕、排泄、暴力互殴)。
❖
伪科普/伪医疗:
展示针头注射、手术开刀、充满鲜艳液体的怪异医疗行为。
❖
涉黄涉暴的卡通:
画风是儿童向的,但剧情包含谋杀、背叛、葬礼等成人议题。
❖
自动联想:
如果你输入“蜘蛛侠和艾莎在医院”,AI 可能自动生成这一类典型的 ElsaGate 画面(因为它学习过这些违规数据)
对策:严禁使用知名 IP 进行二创,这不仅违规还侵权。坚持做原创角色。
Part 4
提示词调整
01
根据需求修改
该提示词支持自定义调整,请使用Gemini 3.5模型,调整方法如下:
提示词
1 请按照要求修改以下提示词:
2
3 具体要求:
4 1.
5 2.
6 3.
7 ....
8 {输入该提示词}
注意:一次修改不超过三个点,每次修改完毕后,请使用新的提示词检验结果,再根据结果继续修改,每次修改前请备份当前版本。
具体的调试过程可参考链接:https://gemini.google.com/share/559e785342da
02
匹配自动化流程
此提示词设计初衷是窗口互动式对话调整,因此不得直接用于API端。你如有需要,请使用修改流程,使用以下提示词:
提示词
1 请按照要求修改以下提示词:
2
3 具体要求:
4 1.请修改成适合API生成的提示词要求,直接输出{你需要利用的部分,例如文生图提示词部分}
5
6 {输入该提示词}
这就是我分享的10分钟低成本复刻Youtube爆款视频的经验啦,希望对大家有帮助。
原创文章,作者:小帆哥,如若转载,请注明出处:https://www.liulinblog.com/8801.html
