目录
想做电商短视频带货,却倒在了“拍摄成本”这一关?
大家都知道,在这个“无视频不电商”的时代,一条高质量的产品宣传片往往意味着高转化。但问题是:找模特太贵,搭场景太累,外包给传媒公司一条视频动辄几千块,对于中小卖家来说,这笔开支实在太肉疼。
难道没有专业摄影团队,就注定做不出电影级的电商大片吗?
当然不是!今天我要给大家复盘一条全自动 AI 视频工作流。不需要你懂复杂的剪辑软件,也不需要昂贵的拍摄设备,只需要利用 Coze 工作流 + Banana2 + Sora2,你就能一键生成 10-15 秒的高质感电商宣传视频。
体验链接:https://www.coze.cn/s/4OGVFTzmSVI/
免费工作流(在头部):https://my.feishu.cn/wiki/W4hGwS4AHidEHmkMPepcTdbJnif?from=from_copylink
看看下面这个视频,是不是以为是哪个 4A 广告公司拍的?其实,这完全是由 AI 全自动生成的,而且是0成本、批量产出!
Sora2粉色毛衣宣传视频
一、核心实操:搭建工作流
这一部分是整篇文章的精华。请打开你的 Coze(扣子)后台,创建一个新的工作流。我们将这个看似复杂的流程拆解为三个阶段:“大脑分析阶段”、“指令生成阶段” 和 “视频渲染与轮询阶段”。
像搭积木一样,我们一步步来。
整体工作流如下:

1️⃣ 开始节点
一切的起点。为了保证生成的视频精准符合我们的商品需求,我们需要预设几个关键的输入参数。
在这里,我们定义了四个核心变量,这决定了后面 AI 能拿到什么素材以及是否有权限运行:
-
video_duration(Integer):视频时长。建议设置为 10 或 15,单位是秒。 -
title(String):商品名称。例如“复古手冲咖啡壶”。 -
product_image(Image):这是最核心的变量!我们需要上传一张商品的高清实拍图。 -
api_key(String):关键凭证。这是你调用 Banana2 和 Sora2 服务的密钥(通常以sk-开头)。

2️⃣ 大模型:生成产品卖点
有了图片,AI 得先看懂图片里卖的是什么。这个节点充当了“电商选品官”的角色。
-
模型选择:关键点! 这里必须选择
豆包·1.6·视觉理解-250815。只有带“视觉理解”后缀的模型才能看懂你上传的图片。 -
输入配置:
-
title:引用开始节点的title。 -
product_image:引用开始节点的product_image。
-
-
提示词配置:
-
系统提示词:设定 AI 的角色,要求它“只围绕产品宣传相关内容进行交流,坚决拒答无关话题”,并要求生成的脚本“结构完整、要素齐全”。
-

系统提示词:
# 角色
你是一位专业且极具创意的产品宣传专家,擅长用生动、精炼且极具吸引力的语言介绍产品。
## 技能
### 技能 1: 介绍产品关键信息
1. 当用户要求介绍产品时,全面且精准地给出产品名称、核心功能、独特特点以及突出卖点。
2. 表述要生动形象、简洁清晰,具备较强的感染力,能有效吸引听众的兴趣。
===回复示例===
- 产品名称:<产品名>
- 功能:<以生动形象的语言简述核心功能,突出对用户的价值>
- 特点:<概括独特且吸引人的特点>
- 卖点:<提炼极具吸引力的突出卖点>
===示例结束===
## 限制
- 只围绕产品宣传相关内容进行交流,坚决拒答无关话题。
- 严格按照给定格式输出介绍产品关键信息,对于生成的宣传广告视频脚本要结构完整、要素齐全。
用户提示词:
产品主题:{{title}}
产品图片:{{product_image}}
输出变量:设置一个输出变量名为 Product_Sell_Points,用于传递给下一个节点。

3️⃣ 大模型:生成九宫格提示词
这一步是为了给 Banana2 做准备。我们不是直接生成视频,而是先生成一组“风格参考图”。
我们需要把上一步提取的“卖点”,转化成 Banana2 这个绘图模型能听懂的“绘画指令”。
-
模型选择:注意! 这里依然要选择
豆包·1.6·视觉理解-250815。因为这一步我们再次传入了产品原图,模型需要看着原图来写提示词,才能保证画出来的样子不走形。 -
输入配置:
-
Product_Sell_Points:引用上一个节点生成的卖点。 -
title:引用开始节点的标题。 -
product_image:再次传入开始节点的原图,确保视觉一致性。
-
-
提示词配置:
-
系统提示词:这里加了三条非常关键的“铁律”:
-
确保生成的提示词严格保持产品本身的颜色、形状不改变。
-
输出的图片不要有文字。
-
产品一定要有一致性。
-
-

系统提示词:
# 角色
你是一位专业的产品分镜图提示词生成专家,在生成产品分镜图提示词领域经验丰富,能从风格、结构、内容、细节四个维度精心构建高质量提示词,助力生成用于产品宣传广告视频的分镜图。
## 技能
### 技能 1: 生成产品分镜图提示词
1. **风格**:生成的提示词需呈现黑白线稿风格,具有漫画分镜式的简洁写实特点,融入日系插画质感。强调画面轮廓清晰、光影极简,同时严格保持产品本身的颜色、形状不变。
2. **结构**:采用严谨的九宫格布局,每个格子为独立场景,但整体叙事连贯。画面比例均匀分配,分镜感要强烈,最终只生成九个格子的图片。
3. **内容**:紧密围绕 “产品使用流程” 展开,具体内容如下:
- **人物场景**:要涵盖卧室梳妆台照镜、手部持握产品、精华滴落在掌心、脸部护理前后对比、产品涂抹细节、户外展示产品、闺蜜分享美妆时刻、产品特写 + slogan等多种场景。
- **产品元素**:产品设定为彩色渐变瓶身的美妆精华 / 爽肤水,着重强调瓶身设计,如金属瓶盖、品牌标识等,同样保持产品本身的颜色、形状不变。
4. **细节**:将人物形象设定为年轻女性,神态需自然亲和;场景要融入丰富的生活感元素,如床品、家具、阳光等;每格画面都要聚焦一个动作或细节。
### 回复示例
九宫格漫画分镜,黑白线稿风格,日系写实插画,围绕产品的使用叙事:第 1 格展示卧室梳妆台女孩照镜发现产品;第 2 格呈现手部持握彩色渐变瓶身的精华;第 3 格是精华滴落在掌心的画面;第 4 - 5 格为脸部护理前后对比(体现肤色提亮等效果);第 6 格突出精华涂抹在肌肤的细节;第 7 格展示女孩在阳光房展示产品;第 8 格是闺蜜聚会分享美妆产品的场景;第 9 格为产品特写 +‘焕亮肌肤’slogan。每格画面轮廓清晰,场景写实,人物神态自然,整体风格统一简洁,且产品保持本身颜色、形状不变。
## 限制
- 仅生成与产品分镜图相关的提示词,坚决拒绝回答无关话题。
- 所输出的提示词内容必须全面涵盖风格、结构、内容、细节四个维度,严格遵循框架要求,不得偏离。
- 回复示例需完整呈现九宫格各格内容,语言务必简洁明了。
- 仅生成九个格子的图片。
- 确保生成的提示词能严格保持产品本身的颜色、形状不改变。
- 输出的图片不要有文字
- 产品一定要有一致性
用户提示词:
产品介绍:{{Product_Sell_Points}}
输入主题:{{title}}
产品图:{{product_image}}
输出变量:设置输出变量名为 output,这将作为 Banana2 的直接输入。

4️⃣ 插件:Banana2 生成九宫格
这是工作流的第一个视觉高潮。我们将使用 NanoBanana2 模型来生成风格化的参考图。首先,我们需要在插件市场找到这个工具。点击画布上的“添加节点”,选择“插件”。在搜索框输入关键词 “Na绘图”。
-
找到插件后,点击添加
Na2_generate_image这一项。
注意:一定要选 Na2_generate_image (Na图片生成,图生图),不要选成 text_to_image,因为我们需要传入产品原图来控制构图。

添加成功后,点击节点进行配置。这里的连线逻辑非常关键,它把“原图”、“Prompt”和“密钥”串在了一起。
-
api_key:引用开始节点的api_key。这是调用服务的凭证。 -
image_url:引用开始节点的product_image。这就相当于告诉 AI:“底图是这个,千万别画歪了”。 -
prompt:引用上一步(大模型_生成产品九宫格提示词)输出的output。这是 AI 的创作指令。

5️⃣ 大模型:生成 Sora2 提示词
有了美术参考(Banana2 的图)和文字卖点,现在我们要指挥 Sora2 开机拍摄了。这个大模型节点是整个工作流的“总导演”,它决定了视频的运镜和细节。
-
模型选择:选择
豆包·1.6·lite·251015。虽然它是 lite 版本,但处理多模态输入(图片+文本)的速度快且逻辑够用。 -
输入配置:这里非常关键,我们需要把所有的素材都喂给它:
-
普通变量:
-
video_duration:视频时长。 -
Product_Sell_Points:产品卖点。 -
output:引用第三步生成的九宫格提示词。
-
-
视觉理解输入 (Visual Inputs):
-
image_url:引用 Banana2生成九宫格 的结果图(作为美术参考)。 -
product_image:引用 开始节点 的原图(确保产品不走样)。
-
-

系统提示词:
## 一、输入要求(4个必填)
1. 分镜线稿:**5-9个**,按1-N顺序排好
2. 产品参考图:高清图(只用来对产品颜色/logo/材质)
3. 产品信息:核心>功能>情感卖点,列清楚
4. 目标时长:**10秒/15秒** 二选一
## 二、核心规则(直接套用)
### 1. 时长自动分配
| 总时长 | 转场时长 | 单镜时长计算法 | 收尾镜特殊规则 |
|--------|----------|----------------|----------------|
| 10秒 | 0.2秒/次 | (10 - 0.2×(分镜数-1) - 收尾时长)÷ (分镜数-1) | 比普通镜长20% |
| 15秒 | 0.3秒/次 | (15 - 0.3×(分镜数-1) - 收尾时长)÷ (分镜数-1) | 比普通镜长20% |
- 动作匹配:短时长镜做简单动作(拿产品),长时长镜做复杂动作(拿+转+按)
### 2. 分镜功能必覆盖
不管多少镜,必须包含4类:
- 设计类:秀产品外观 → 配**核心卖点**
- 功能类:演示操作 → 配**功能卖点**
- 情感类:用产品场景 → 配**情感卖点**
- 收尾类:总结 → 配**品牌价值**
### 3. 产品一致性(每个镜都要写)
必须加2个量化细节,比如:
- 颜色:和参考图RGB(XXX,XXX,XXX)一致
- 尺寸:厚度3.2mm,logo蚀刻在左上角0.5cm处
### 4. 口播&转场规则
| 分镜类型 | 口播语速 | 口播占单镜时长 | 转场方式 |
|----------|----------|----------------|----------|
| 设计类 | 10秒版180字/分;15秒版160字/分 | 60% | 同场景→滑动;跨场景→淡入淡出 |
| 功能类 | 10秒版200字/分;15秒版180字/分 | 50% | 同场景→焦点转移;跨场景→摇镜 |
| 情感类 | 10秒版160字/分;15秒版140字/分 | 70% | 同场景→滑动;跨场景→淡入淡出 |
| 收尾类 | 10秒版150字/分;15秒版130字/分 | 80% | 无转场 |
- 音乐:120BPM轻电子乐,口播时降速30%,降速时间和口播一样
### 5. 画质&光影(固定写死)
- 画质:8K超高清,细节放大无失真
- 光影:全片光线方向统一(比如左前侧45°光)
- 相机:设计/收尾镜用环形补光;功能/情感镜用浅景深
## 三、直接写提示词的模板(填空就行)
### 广告基础(先写这个)
**视频主题**:[产品名]+[核心场景]
**目标时长**:[10/15秒]
**分镜数量**:[X镜]
**时长明细**:[普通镜时长]×[X-1]镜 + [收尾镜时长]×1镜 + [转场时长]×[X-1]次 = 总时长
**核心卖点**:1. [核心卖点] 2. [功能卖点] 3. [情感卖点] 4. [品牌价值]
### 单镜提示词(按顺序写每个镜)
**分镜X([功能定位])**:时长[XX秒],8K超高清真实摄影,[场景写实描述,比如:阳光书房,浅木书架+磨砂台灯],[人物状态,比如:25岁女性穿米白衬衫,微笑露齿],手持[产品描述+一致性细节],动作:[和时长匹配的动作],光影:[统一方向光+量化细节,比如:左前侧光,桌面12°光影渐变],转场:[方式+时长],口播:[卖点金句](时长[XX秒],语速[XX字/分]),背景音乐120BPM轻电子乐,口播时降速30%,相机参数:[环形补光/浅景深]
## 四、强制要求(缺一不可)
1. 分镜按1-N顺序,不能乱
2. 总时长误差≤±0.5秒
3. 口播别写“买”“点击”,写“[卖点]+[场景]”
4. 每个镜必须有2个量化细节(反光率/瞳孔直径/焦距都行)
用户提示词:
视频时长:{{video_duration}}
产品卖点:{{Product_Sell_Points}}
生成九宫格提示词:{{output}}
生成九宫格图片:{{image_url}}
产品原图:{{product_image}}
输出变量配置:最后别忘了在节点底部设置输出。
-
变量名:设置为
output。 -
意义:这个
output里面装的就是 AI 写好的、包含运镜光影的视频脚本,它将直接决定视频长什么样。

6️⃣ 文本处理节点
大模型生成的提示词有时候只是一段单纯的画面描述,为了让 Sora2 严格执行我们的要求(比如不要乱加文字),我们需要在这里给提示词“加个头”。
-
节点选择:添加 文本处理 节点。
-
选择应用:功能模式选择
字符串拼接。 -
输入配置:
-
变量名:
String1。 -
引用来源:引用上一步(大模型_生成sora2提示词)的
output。
-
-
拼接逻辑:
-
我们在输入框里写了一段非常霸气的“前缀指令”,告诉视频模型不要自作聪明加字幕:
-
视频中严禁出现字幕,直接以分镜生成视频
以下是视频提示词
{{String1}}

7️⃣ 插件:URL转Array数组
为了让视频模型能同时参考“产品原图”和“Banana2生成的风格图”,我们需要用这个小工具把这两张图片的链接“打包”在一起。
-
在画布中点击“添加节点” -> “插件”。
-
搜索关键词 “链接URL转Array数组”。
-
找到插件,点击添加
url_to_array工具。

点击节点进行配置,这里我们要把两张关键图片的来源接进来:
-
image_url_01:引用 【开始节点】 的product_image。这是为了确保产品主体不变。 -
image_url_02:引用 【Banana2生成九宫格】 的image_url。这是为了提供美术风格参考。 -
(其他
image_url_03等留空即可) -
输出理解:这个节点会输出一个名为
imageArray的变量,里面装着这两张图的链接,下一步我们就可以直接用了。

8️⃣ 插件:Sora2 图生视频
这是见证奇迹的时刻!我们将调用 Sora2 的 “图生视频” 接口,让它基于我们提供的“美术风格图”和“产品原图”来生成最终大片。
-
点击画布上的“添加节点”,选择“插件”。
-
搜索关键词 “S视频创作”。
-
关键点:这次我们要点击
img_to_video(图生视频) 右侧的添加按钮。

点击节点进行配置,这里的参数比较丰富,我们需要把所有的“原料”都喂进去:
-
api_key:引用 【开始节点】 的api_key。 -
images:引用上一步 【图片URL转Array数组】 的imageArray。-
(这就是图生视频的核心,我们把打包好的图片组传给它)。
-
-
duration:引用 【开始节点】 的video_duration。 -
model:手动填入sora-2-all(这是目前效果最快的版本,也可以选择sora-2-pro-all)。 -
orientation:手动填入9:16(确保生成的是竖屏短视频格式)。 -
prompt:引用 【文本处理节点】 的output(这是视频的运镜和光影指令)。

9️⃣ 选择器:确认任务提交
在进入漫长的等待之前,我们必须先确认“订单”是否成功提交给了 Sora2 系统。
-
添加节点:在 Sora2 生成节点之后,连接一个 选择器 (IF)。
-
配置条件:
-
变量:选择上一步(Sora2图生视频)输出的
status。 -
操作符:选择 等于 (=)。
-
值:填写字符串
completed。
-
-
逻辑含义:只有当任务状态明确为“已完成提交”时,我们才进入下一步的等待循环;否则(走“否则”分支),说明任务在一开始就挂了,直接停止即可。

🔟 循环节点:搭建等待通道
确认任务提交成功后,我们需要一个“循环车间”来持续查询进度,直到视频生成完毕。
-
连接逻辑:将上一步选择器的 “如果 (If)” 分支,连接到一个 循环节点 (Loop)。
-
基本配置:
-
循环类型:选择
无限循环。(注意:这意味着我们需要在循环内部手动设置“退出条件”,否则它会一直跑下去。)
-
-
输出配置 (关键):
-
我们需要把循环内部查到的视频链接传到外部来。
-
点击“输出”旁边的加号,添加一个变量。
-
变量名:
videoURLs。 -
变量值:选择引用循环内部的
Sora2-查询任务的video_url。 -
类型:确保类型是
Array<String>。
-

1️⃣1️⃣ 循环体内部:查询与判断
进入循环节点内部,这里的逻辑其实就是“一查、二判、三等”。
-
查询任务:这是核心。添加插件
Query_Task,把外部传入的task_id填进去,实时获取生成进度。 -
逻辑判断:简单来说,用选择器判断 进度是否到达 100%。如果到了,就走“成功出口”;如果没到,就走“等待代码”。
-
代码等待:在未完成的分支里,挂一个简单的 Python 代码节点,让工作流休息若干秒再进行下一次查询,防止接口被刷爆。



1️⃣2️⃣ 代码节点:数据清洗
循环节点输出的数据有时候会嵌套在数组里,或者包含一些我们不需要的格式信息。为了让用户直接拿到纯净的视频链接,我们需要加一个代码节点来“剥壳”。
-
添加节点:连接一个 代码 (Code) 节点,重命名为
代码_去除空字符。 -
输入配置:
-
变量名:
videoURLs。 -
引用来源:引用上一步 【循环_查询任务】 输出的
videoURLs。
-
-
代码逻辑:
-
这个节点的任务是遍历输入的数组,找到非空的
video_url并提取出来。 -
(如果你不懂代码也没关系,直接让 AI 帮你写一段“提取对象中非空视频链接”的 JS/Python 代码即可)。
-
-
输出变量:设置输出名为
video_url(String类型),这就是我们要的最终成品。

1️⃣3️⃣ 结束节点:输出成品
这是万里长征的最后一步!我们需要把清洗干净的视频链接返还给用户。
-
配置输出:点击结束节点。
-
输出变量:
-
变量名:
output(或者你自己喜欢的名字)。 -
变量值:引用上一步 【代码_去除空字符】 的
video_url。
-
-
输出类型:选择
返回变量。

二、获取API_Key
在使用 Nano-Banana2 之前,需要先注册 API 平台并获取对应的 API Key。首先进入到API平台:https://linoapi.com.cn/register?aff=sJ68,点击右上角 「登录 / 注册」 完成账号注册。(新注册账号默认赠送 0.4 元 体验额度,不够的话可在【钱包】中按需充值。)



注册完成后,进入 【API 令牌】 页面,点击 「添加令牌」 新建一个 API Key。

在创建令牌时,填写名称并选择分组,分组务必选择「官转 gemini」、「优质 gemini」、「default」、「官转OpenAI」、「auto」,这样才能正确匹配 NanoBanana2 模型。额度可根据需要自行调整,其余参数保持默认即可,最后点击 「提交」。


创建完成后,在 API 秘钥 列表中复制对应的 Key,后续直接填入工作流的 api_key 参数即可。

三、使用工作流
工作流创建完成后,建议先进行一次 试运行,确认整个流程是否正常,以及生成的视频效果是否符合预期。
-
启动测试:点击画布底部的 「试运行」 按钮。
-
填写参数:在弹出的参数填写窗口中,按下面示例填写:
-
api_key:填写刚刚获取的 API 密钥(sk-开头)。 -
product_image:上传一张清晰的产品图(示例:肉粉色毛衣.jpg)。 -
title:填写产品名称/主题(示例:肉粉色毛衣)。 -
video_duration:填写视频时长(建议填 15,可选 10-15秒)。
-
-
开始运行:参数填写完成后,点击底部的绿色 「试运行」 按钮,静待奇迹发生。

如果一切配置正常,工作流会依次执行 【Banana2生成九宫格】、【Sora2生成视频】 以及 【循环查询】 节点,最终在 【结束】 节点返回生成的视频 URL。点击链接在浏览器中打开并下载,即可看到生成好的 10-15 秒电商宣传大片效果。

四、写到最后
在这个“注意力稀缺”的时代,视频内容的生产效率往往决定了电商的生死。
这套基于 Banana2 + Sora2 的自动化工作流,不仅打破了传统拍摄高昂的资金壁垒,更让我们看到了 AI 赋能个体的无限可能。不需要专业的摄影棚,也不需要昂贵的模特,只要你有创意,AI 就能帮你把想法落地,用最低的成本跑出最高的 ROI。
“种一棵树最好的时间是十年前,其次是现在。” 别让这个工作流在你的收藏夹里吃灰,赶紧动手试试吧!
转载自CSDN-专业IT技术社区
原文链接:https://blog.csdn.net/Little_Carter/article/details/156753748



