【保姆级教程】手把手教你搭 Coze 工作流，Banana2 + Sora2 电商视频生成全流程复盘（附免费工作流）

一、核心实操：搭建工作流

1️⃣ 开始节点

2️⃣ 大模型：生成产品卖点

3️⃣ 大模型：生成九宫格提示词

想做电商短视频带货，却倒在了“拍摄成本”这一关？

大家都知道，在这个“无视频不电商”的时代，一条高质量的产品宣传片往往意味着高转化。但问题是：找模特太贵，搭场景太累，外包给传媒公司一条视频动辄几千块，对于中小卖家来说，这笔开支实在太肉疼。

难道没有专业摄影团队，就注定做不出电影级的电商大片吗？

当然不是！今天我要给大家复盘一条全自动 AI 视频工作流。不需要你懂复杂的剪辑软件，也不需要昂贵的拍摄设备，只需要利用 Coze 工作流 + Banana2 + Sora2，你就能一键生成 10-15 秒的高质感电商宣传视频。

体验链接：https://www.coze.cn/s/4OGVFTzmSVI/

免费工作流（在头部）：https://my.feishu.cn/wiki/W4hGwS4AHidEHmkMPepcTdbJnif?from=from_copylink

看看下面这个视频，是不是以为是哪个 4A 广告公司拍的？其实，这完全是由 AI 全自动生成的，而且是0成本、批量产出！

Sora2粉色毛衣宣传视频

一、核心实操：搭建工作流

这一部分是整篇文章的精华。请打开你的 Coze（扣子）后台，创建一个新的工作流。我们将这个看似复杂的流程拆解为三个阶段：“大脑分析阶段”、“指令生成阶段” 和 “视频渲染与轮询阶段”。

像搭积木一样，我们一步步来。

整体工作流如下：

1️⃣ 开始节点

一切的起点。为了保证生成的视频精准符合我们的商品需求，我们需要预设几个关键的输入参数。

在这里，我们定义了四个核心变量，这决定了后面 AI 能拿到什么素材以及是否有权限运行：

video_duration (Integer)：视频时长。建议设置为 10 或 15，单位是秒。
title (String)：商品名称。例如“复古手冲咖啡壶”。
product_image (Image)：这是最核心的变量！我们需要上传一张商品的高清实拍图。
api_key (String)：关键凭证。这是你调用 Banana2 和 Sora2 服务的密钥（通常以 sk- 开头）。

2️⃣ 大模型：生成产品卖点

有了图片，AI 得先看懂图片里卖的是什么。这个节点充当了“电商选品官”的角色。

模型选择：关键点！ 这里必须选择 豆包·1.6·视觉理解-250815。只有带“视觉理解”后缀的模型才能看懂你上传的图片。
输入配置：
- title：引用开始节点的 title。
- product_image：引用开始节点的 product_image。
提示词配置：
- 系统提示词：设定 AI 的角色，要求它“只围绕产品宣传相关内容进行交流，坚决拒答无关话题”，并要求生成的脚本“结构完整、要素齐全”。

系统提示词：

# 角色
你是一位专业且极具创意的产品宣传专家，擅长用生动、精炼且极具吸引力的语言介绍产品。

## 技能
### 技能 1: 介绍产品关键信息
1. 当用户要求介绍产品时，全面且精准地给出产品名称、核心功能、独特特点以及突出卖点。
2. 表述要生动形象、简洁清晰，具备较强的感染力，能有效吸引听众的兴趣。
===回复示例===
- 产品名称：<产品名>
- 功能：<以生动形象的语言简述核心功能，突出对用户的价值>
- 特点：<概括独特且吸引人的特点>
- 卖点：<提炼极具吸引力的突出卖点>
===示例结束===


## 限制
- 只围绕产品宣传相关内容进行交流，坚决拒答无关话题。
- 严格按照给定格式输出介绍产品关键信息，对于生成的宣传广告视频脚本要结构完整、要素齐全。

用户提示词：

产品主题：{{title}}
产品图片：{{product_image}}

输出变量：设置一个输出变量名为 Product_Sell_Points，用于传递给下一个节点。

3️⃣ 大模型：生成九宫格提示词

这一步是为了给 Banana2 做准备。我们不是直接生成视频，而是先生成一组“风格参考图”。

我们需要把上一步提取的“卖点”，转化成 Banana2 这个绘图模型能听懂的“绘画指令”。

模型选择：注意！ 这里依然要选择 豆包·1.6·视觉理解-250815。因为这一步我们再次传入了产品原图，模型需要看着原图来写提示词，才能保证画出来的样子不走形。
输入配置：
- Product_Sell_Points：引用上一个节点生成的卖点。
- title：引用开始节点的标题。
- product_image：再次传入开始节点的原图，确保视觉一致性。
提示词配置：
- 系统提示词：这里加了三条非常关键的“铁律”：
  - 确保生成的提示词严格保持产品本身的颜色、形状不改变。
  - 输出的图片不要有文字。
  - 产品一定要有一致性。

系统提示词：

# 角色
你是一位专业的产品分镜图提示词生成专家，在生成产品分镜图提示词领域经验丰富，能从风格、结构、内容、细节四个维度精心构建高质量提示词，助力生成用于产品宣传广告视频的分镜图。

## 技能
### 技能 1: 生成产品分镜图提示词
1. **风格**：生成的提示词需呈现黑白线稿风格，具有漫画分镜式的简洁写实特点，融入日系插画质感。强调画面轮廓清晰、光影极简，同时严格保持产品本身的颜色、形状不变。
2. **结构**：采用严谨的九宫格布局，每个格子为独立场景，但整体叙事连贯。画面比例均匀分配，分镜感要强烈，最终只生成九个格子的图片。
3. **内容**：紧密围绕 “产品使用流程” 展开，具体内容如下：
    - **人物场景**：要涵盖卧室梳妆台照镜、手部持握产品、精华滴落在掌心、脸部护理前后对比、产品涂抹细节、户外展示产品、闺蜜分享美妆时刻、产品特写 + slogan等多种场景。
    - **产品元素**：产品设定为彩色渐变瓶身的美妆精华 / 爽肤水，着重强调瓶身设计，如金属瓶盖、品牌标识等，同样保持产品本身的颜色、形状不变。
4. **细节**：将人物形象设定为年轻女性，神态需自然亲和；场景要融入丰富的生活感元素，如床品、家具、阳光等；每格画面都要聚焦一个动作或细节。

### 回复示例
九宫格漫画分镜，黑白线稿风格，日系写实插画，围绕产品的使用叙事：第 1 格展示卧室梳妆台女孩照镜发现产品；第 2 格呈现手部持握彩色渐变瓶身的精华；第 3 格是精华滴落在掌心的画面；第 4 - 5 格为脸部护理前后对比（体现肤色提亮等效果）；第 6 格突出精华涂抹在肌肤的细节；第 7 格展示女孩在阳光房展示产品；第 8 格是闺蜜聚会分享美妆产品的场景；第 9 格为产品特写 +‘焕亮肌肤’slogan。每格画面轮廓清晰，场景写实，人物神态自然，整体风格统一简洁，且产品保持本身颜色、形状不变。

## 限制
- 仅生成与产品分镜图相关的提示词，坚决拒绝回答无关话题。
- 所输出的提示词内容必须全面涵盖风格、结构、内容、细节四个维度，严格遵循框架要求，不得偏离。
- 回复示例需完整呈现九宫格各格内容，语言务必简洁明了。 
- 仅生成九个格子的图片。 
- 确保生成的提示词能严格保持产品本身的颜色、形状不改变。 
- 输出的图片不要有文字
- 产品一定要有一致性

用户提示词：

产品介绍：{{Product_Sell_Points}}
输入主题：{{title}}
产品图：{{product_image}}

输出变量：设置输出变量名为 output，这将作为 Banana2 的直接输入。

4️⃣ 插件：Banana2 生成九宫格

这是工作流的第一个视觉高潮。我们将使用 NanoBanana2 模型来生成风格化的参考图。首先，我们需要在插件市场找到这个工具。点击画布上的“添加节点”，选择“插件”。在搜索框输入关键词 “Na绘图”。

找到插件后，点击添加 Na2_generate_image 这一项。

注意：一定要选 Na2_generate_image (Na图片生成，图生图)，不要选成 text_to_image，因为我们需要传入产品原图来控制构图。

添加成功后，点击节点进行配置。这里的连线逻辑非常关键，它把“原图”、“Prompt”和“密钥”串在了一起。

api_key：引用开始节点的 api_key。这是调用服务的凭证。
image_url：引用开始节点的 product_image。这就相当于告诉 AI：“底图是这个，千万别画歪了”。
prompt：引用上一步（大模型_生成产品九宫格提示词）输出的 output。这是 AI 的创作指令。

5️⃣ 大模型：生成 Sora2 提示词

有了美术参考（Banana2 的图）和文字卖点，现在我们要指挥 Sora2 开机拍摄了。这个大模型节点是整个工作流的“总导演”，它决定了视频的运镜和细节。

模型选择：选择 豆包·1.6·lite·251015。虽然它是 lite 版本，但处理多模态输入（图片+文本）的速度快且逻辑够用。
输入配置：这里非常关键，我们需要把所有的素材都喂给它：
- 普通变量：
  - video_duration：视频时长。
  - Product_Sell_Points：产品卖点。
  - output：引用第三步生成的九宫格提示词。
- 视觉理解输入 (Visual Inputs)：
  - image_url：引用 Banana2生成九宫格 的结果图（作为美术参考）。
  - product_image：引用 开始节点 的原图（确保产品不走样）。

系统提示词：

## 一、输入要求（4个必填）
1.  分镜线稿：**5-9个**，按1-N顺序排好
2.  产品参考图：高清图（只用来对产品颜色/logo/材质）
3.  产品信息：核心＞功能＞情感卖点，列清楚
4.  目标时长：**10秒/15秒** 二选一

## 二、核心规则（直接套用）
### 1. 时长自动分配
| 总时长 | 转场时长 | 单镜时长计算法 | 收尾镜特殊规则 |
|--------|----------|----------------|----------------|
| 10秒 | 0.2秒/次 | （10 - 0.2×(分镜数-1) - 收尾时长）÷ (分镜数-1) | 比普通镜长20% |
| 15秒 | 0.3秒/次 | （15 - 0.3×(分镜数-1) - 收尾时长）÷ (分镜数-1) | 比普通镜长20% |
- 动作匹配：短时长镜做简单动作（拿产品），长时长镜做复杂动作（拿+转+按）

### 2. 分镜功能必覆盖
不管多少镜，必须包含4类：
- 设计类：秀产品外观 → 配**核心卖点**
- 功能类：演示操作 → 配**功能卖点**
- 情感类：用产品场景 → 配**情感卖点**
- 收尾类：总结 → 配**品牌价值**

### 3. 产品一致性（每个镜都要写）
必须加2个量化细节，比如：
- 颜色：和参考图RGB(XXX,XXX,XXX)一致
- 尺寸：厚度3.2mm，logo蚀刻在左上角0.5cm处

### 4. 口播&转场规则
| 分镜类型 | 口播语速 | 口播占单镜时长 | 转场方式 |
|----------|----------|----------------|----------|
| 设计类 | 10秒版180字/分；15秒版160字/分 | 60% | 同场景→滑动；跨场景→淡入淡出 |
| 功能类 | 10秒版200字/分；15秒版180字/分 | 50% | 同场景→焦点转移；跨场景→摇镜 |
| 情感类 | 10秒版160字/分；15秒版140字/分 | 70% | 同场景→滑动；跨场景→淡入淡出 |
| 收尾类 | 10秒版150字/分；15秒版130字/分 | 80% | 无转场 |
- 音乐：120BPM轻电子乐，口播时降速30%，降速时间和口播一样

### 5. 画质&光影（固定写死）
- 画质：8K超高清，细节放大无失真
- 光影：全片光线方向统一（比如左前侧45°光）
- 相机：设计/收尾镜用环形补光；功能/情感镜用浅景深

## 三、直接写提示词的模板（填空就行）
### 广告基础（先写这个）
**视频主题**：[产品名]+[核心场景]
**目标时长**：[10/15秒]
**分镜数量**：[X镜]
**时长明细**：[普通镜时长]×[X-1]镜 + [收尾镜时长]×1镜 + [转场时长]×[X-1]次 = 总时长
**核心卖点**：1. [核心卖点] 2. [功能卖点] 3. [情感卖点] 4. [品牌价值]

### 单镜提示词（按顺序写每个镜）
**分镜X（[功能定位]）**：时长[XX秒]，8K超高清真实摄影，[场景写实描述，比如：阳光书房，浅木书架+磨砂台灯]，[人物状态，比如：25岁女性穿米白衬衫，微笑露齿]，手持[产品描述+一致性细节]，动作：[和时长匹配的动作]，光影：[统一方向光+量化细节，比如：左前侧光，桌面12°光影渐变]，转场：[方式+时长]，口播：[卖点金句]（时长[XX秒]，语速[XX字/分]），背景音乐120BPM轻电子乐，口播时降速30%，相机参数：[环形补光/浅景深]

## 四、强制要求（缺一不可）
1.  分镜按1-N顺序，不能乱
2.  总时长误差≤±0.5秒
3.  口播别写“买”“点击”，写“[卖点]+[场景]”
4.  每个镜必须有2个量化细节（反光率/瞳孔直径/焦距都行）

用户提示词：

视频时长：{{video_duration}}
产品卖点：{{Product_Sell_Points}}
生成九宫格提示词：{{output}}
生成九宫格图片：{{image_url}}
产品原图：{{product_image}}

输出变量配置：最后别忘了在节点底部设置输出。

变量名：设置为 output。
意义：这个 output 里面装的就是 AI 写好的、包含运镜光影的视频脚本，它将直接决定视频长什么样。

6️⃣ 文本处理节点

大模型生成的提示词有时候只是一段单纯的画面描述，为了让 Sora2 严格执行我们的要求（比如不要乱加文字），我们需要在这里给提示词“加个头”。

节点选择：添加 文本处理 节点。
选择应用：功能模式选择 字符串拼接。
输入配置：
- 变量名：String1。
- 引用来源：引用上一步（大模型_生成sora2提示词）的 output。
拼接逻辑：
- 我们在输入框里写了一段非常霸气的“前缀指令”，告诉视频模型不要自作聪明加字幕：

视频中严禁出现字幕，直接以分镜生成视频
以下是视频提示词
{{String1}}

7️⃣ 插件：URL转Array数组

为了让视频模型能同时参考“产品原图”和“Banana2生成的风格图”，我们需要用这个小工具把这两张图片的链接“打包”在一起。

在画布中点击“添加节点” -> “插件”。
搜索关键词 “链接URL转Array数组”。
找到插件，点击添加 url_to_array 工具。

点击节点进行配置，这里我们要把两张关键图片的来源接进来：

image_url_01：引用 【开始节点】 的 product_image。这是为了确保产品主体不变。
image_url_02：引用 【Banana2生成九宫格】 的 image_url。这是为了提供美术风格参考。
（其他 image_url_03 等留空即可）
输出理解：这个节点会输出一个名为 imageArray 的变量，里面装着这两张图的链接，下一步我们就可以直接用了。

8️⃣ 插件：Sora2 图生视频

这是见证奇迹的时刻！我们将调用 Sora2 的 “图生视频” 接口，让它基于我们提供的“美术风格图”和“产品原图”来生成最终大片。

点击画布上的“添加节点”，选择“插件”。
搜索关键词 “S视频创作”。
关键点：这次我们要点击 img_to_video (图生视频) 右侧的添加按钮。

点击节点进行配置，这里的参数比较丰富，我们需要把所有的“原料”都喂进去：

api_key：引用 【开始节点】 的 api_key。
images：引用上一步 【图片URL转Array数组】 的 imageArray。
- （这就是图生视频的核心，我们把打包好的图片组传给它）。
duration：引用 【开始节点】 的 video_duration。
model：手动填入 sora-2-all（这是目前效果最快的版本，也可以选择sora-2-pro-all）。
orientation：手动填入 9:16（确保生成的是竖屏短视频格式）。
prompt：引用 【文本处理节点】 的 output（这是视频的运镜和光影指令）。

9️⃣ 选择器：确认任务提交

在进入漫长的等待之前，我们必须先确认“订单”是否成功提交给了 Sora2 系统。

添加节点：在 Sora2 生成节点之后，连接一个 选择器 (IF)。
配置条件：
- 变量：选择上一步（Sora2图生视频）输出的 status。
- 操作符：选择 等于 (=)。
- 值：填写字符串 completed。
逻辑含义：只有当任务状态明确为“已完成提交”时，我们才进入下一步的等待循环；否则（走“否则”分支），说明任务在一开始就挂了，直接停止即可。

🔟 循环节点：搭建等待通道

确认任务提交成功后，我们需要一个“循环车间”来持续查询进度，直到视频生成完毕。

连接逻辑：将上一步选择器的 “如果 (If)” 分支，连接到一个 循环节点 (Loop)。
基本配置：
- 循环类型：选择 无限循环。（注意：这意味着我们需要在循环内部手动设置“退出条件”，否则它会一直跑下去。）
输出配置 (关键)：
- 我们需要把循环内部查到的视频链接传到外部来。
- 点击“输出”旁边的加号，添加一个变量。
- 变量名：videoURLs。
- 变量值：选择引用循环内部的 Sora2-查询任务 的 video_url。
- 类型：确保类型是 Array<String>。

1️⃣1️⃣ 循环体内部：查询与判断

进入循环节点内部，这里的逻辑其实就是“一查、二判、三等”。

查询任务：这是核心。添加插件 Query_Task，把外部传入的 task_id 填进去，实时获取生成进度。
逻辑判断：简单来说，用选择器判断 进度是否到达 100%。如果到了，就走“成功出口”；如果没到，就走“等待代码”。
代码等待：在未完成的分支里，挂一个简单的 Python 代码节点，让工作流休息若干秒再进行下一次查询，防止接口被刷爆。

1️⃣2️⃣ 代码节点：数据清洗

循环节点输出的数据有时候会嵌套在数组里，或者包含一些我们不需要的格式信息。为了让用户直接拿到纯净的视频链接，我们需要加一个代码节点来“剥壳”。

添加节点：连接一个 代码 (Code) 节点，重命名为 代码_去除空字符。
输入配置：
- 变量名：videoURLs。
- 引用来源：引用上一步 【循环_查询任务】 输出的 videoURLs。
代码逻辑：
- 这个节点的任务是遍历输入的数组，找到非空的 video_url 并提取出来。
- （如果你不懂代码也没关系，直接让 AI 帮你写一段“提取对象中非空视频链接”的 JS/Python 代码即可）。
输出变量：设置输出名为 video_url（String类型），这就是我们要的最终成品。

1️⃣3️⃣ 结束节点：输出成品

这是万里长征的最后一步！我们需要把清洗干净的视频链接返还给用户。

配置输出：点击结束节点。
输出变量：
- 变量名：output（或者你自己喜欢的名字）。
- 变量值：引用上一步 【代码_去除空字符】 的 video_url。
输出类型：选择 返回变量。

二、获取API_Key

在使用 Nano-Banana2 之前，需要先注册 API 平台并获取对应的 API Key。首先进入到API平台：https://linoapi.com.cn/register?aff=sJ68，点击右上角 「登录 / 注册」 完成账号注册。（新注册账号默认赠送 0.4 元 体验额度，不够的话可在【钱包】中按需充值。）

注册完成后，进入 【API 令牌】 页面，点击 「添加令牌」 新建一个 API Key。

在创建令牌时，填写名称并选择分组，分组务必选择「官转 gemini」、「优质 gemini」、「default」、「官转OpenAI」、「auto」，这样才能正确匹配 NanoBanana2 模型。额度可根据需要自行调整，其余参数保持默认即可，最后点击 「提交」。

创建完成后，在 API 秘钥 列表中复制对应的 Key，后续直接填入工作流的 api_key 参数即可。

三、使用工作流

工作流创建完成后，建议先进行一次 试运行，确认整个流程是否正常，以及生成的视频效果是否符合预期。

启动测试：点击画布底部的 「试运行」 按钮。
填写参数：在弹出的参数填写窗口中，按下面示例填写：
1. api_key：填写刚刚获取的 API 密钥（sk-开头）。
2. product_image：上传一张清晰的产品图（示例：肉粉色毛衣.jpg）。
3. title：填写产品名称/主题（示例：肉粉色毛衣）。
4. video_duration：填写视频时长（建议填 15，可选 10-15秒）。
开始运行：参数填写完成后，点击底部的绿色 「试运行」 按钮，静待奇迹发生。

如果一切配置正常，工作流会依次执行 【Banana2生成九宫格】、【Sora2生成视频】 以及 【循环查询】 节点，最终在 【结束】 节点返回生成的视频 URL。点击链接在浏览器中打开并下载，即可看到生成好的 10-15 秒电商宣传大片效果。

四、写到最后

在这个“注意力稀缺”的时代，视频内容的生产效率往往决定了电商的生死。

这套基于 Banana2 + Sora2 的自动化工作流，不仅打破了传统拍摄高昂的资金壁垒，更让我们看到了 AI 赋能个体的无限可能。不需要专业的摄影棚，也不需要昂贵的模特，只要你有创意，AI 就能帮你把想法落地，用最低的成本跑出最高的 ROI。

“种一棵树最好的时间是十年前，其次是现在。” 别让这个工作流在你的收藏夹里吃灰，赶紧动手试试吧！

转载自CSDN-专业IT技术社区

原文链接：https://blog.csdn.net/Little_Carter/article/details/156753748

【保姆级教程】手把手教你搭 Coze 工作流，Banana2 + Sora2 电商视频生成全流程复盘（附免费工作流）

一、核心实操：搭建工作流

1️⃣ 开始节点

2️⃣ 大模型：生成产品卖点

3️⃣ 大模型：生成九宫格提示词

4️⃣ 插件：Banana2 生成九宫格

5️⃣ 大模型：生成 Sora2 提示词

6️⃣ 文本处理节点

7️⃣ 插件：URL转Array数组

8️⃣ 插件：Sora2 图生视频

9️⃣ 选择器：确认任务提交

🔟 循环节点：搭建等待通道

1️⃣1️⃣ 循环体内部：查询与判断

1️⃣2️⃣ 代码节点：数据清洗

1️⃣3️⃣ 结束节点：输出成品

二、获取API_Key

三、使用工作流

四、写到最后

评论

评论列表

微信小程序

QQ小程序

关于作者