臻灵短剧平台 · 用户操作手册
臻灵短剧平台 · 用户操作手册
本手册面向普通用户,详细说明平台各项功能的使用方法。
手册中的按钮、输入框等界面元素均以 「」 包裹标注。
目录
1. 产品概述
1.1 平台简介
臻灵短剧是一个 AI 短剧自动化生产平台,实现从剧本输入 → AI 分镜 → 角色设计 → TTS 配音 → 视频生成 → 合成导出的全流程覆盖。
用户只需提供剧本文本,平台即可自动完成分镜拆分、角色形象生成、配音合成、视频生成,最终输出完整的短剧成品。

1.2 功能模块一览
| 模块 | 入口位置 | 说明 |
|---|---|---|
| 剧集 | 顶部导航第一项 | 短剧项目总览,创建/管理短剧项目 |
| AI 配置 | 顶部导航第二项 | 配置各 AI 厂商的 API Key |
| 存储 | 顶部导航第三项 | 配置视频/图片的存储位置 |
| 任务追踪 | 顶部导航第四项 | 查看后台异步任务的执行状态 |
1.3 顶部导航栏
平台顶部为全局导航栏,无论处于哪个页面,均可通过顶部导航栏快速切换:
| 导航项 | 点击后进入 |
|---|---|
| 剧集 | 剧集列表页面,短剧项目管理总览 |
| AI 配置 | AI 厂商 API 配置页面 |
| 存储 | 存储位置设置页面 |
| 任务追踪 | 异步任务进度查看页面 |
提示:当前所在的导航项通常会高亮显示(如蓝色或加粗)。
2. 快速入门流程
2.1 首次使用清单
在开始制作短剧前,请按以下顺序完成配置和操作:
□ 步骤 1:配置 AI 厂商 API Key
└─ 入口:顶部导航 → AI配置
□ 步骤 2:配置存储位置
└─ 入口:顶部导航 → 存储
□ 步骤 3:创建第一个剧集
└─ 入口:顶部导航 → 剧集
□ 步骤 4:导入剧本并 AI 拆解
└─ 入口:进入剧集详情 → 分镜Tab → AI拆解剧本
□ 步骤 5:设计角色
└─ 入口:进入剧集详情 → 角色Tab
□ 步骤 6:制作分镜
└─ 入口:进入剧集详情 → 分镜Tab
□ 步骤 7:生成配音
└─ 入口:进入剧集详情 → 媒体工作室 → 配音tab
□ 步骤 8:生成视频
└─ 入口:进入剧集详情 → 媒体工作室 → 视频tab
□ 步骤 9:合成导出
└─ 入口:进入剧集详情 → 媒体工作室 → 合成输出tab
2.2 核心制作流程图
【第1步】输入剧本
↓
AI 拆解剧本
↓ 自动生成场景和分镜
↓
【第2步】角色设计
↓ 为每个角色设定外观形象
↓
【第3步】分镜设计
↓ 优化每个镜头的画面描述(提示词)
↓
【第4步】TTS 配音
↓ 为分镜添加语音台词
↓
【第5步】视频生成
↓ AI 生成视频片段
↓
【第6步】合成输出
↓
将所有视频片段合成为完整剧集
3. 剧集管理
入口:顶部导航 → 剧集
3.1 剧集列表页
3.1.1 页面布局
| 区域 | 内容说明 |
|---|---|
| 页面标题 | 显示"剧集" |
| 新建按钮 | 右上角「新建短剧」按钮 |
| 搜索框 | 支持按剧集名称搜索 |
| 剧集卡片区 | 排列的剧集卡片 |
| 分页控件 | 剧集数量多时进行分页 |

3.1.2 剧集卡片内容
| 信息项 | 说明 |
|---|---|
| 封面图 | 剧集的展示封面图 |
| 剧集标题 | 剧集名称 |
| 集数 | 显示总集数 |
| 状态标签 | 草稿 / 制作中 / 已完成 |
| 创建时间 | 显示创建日期 |
3.1.3 剧集卡片操作
| 操作 | 功能 |
|---|---|
| 点击卡片 | 进入剧集详情页 |
| 「查看」/「进入」 | 进入剧集详情页 |
| 「编辑」 | 编辑剧集基本信息 |
| 「删除」 | 删除该剧集(需二次确认) |
3.2 创建新剧集
3.2.1 打开新建弹窗
步骤 1:在剧集列表页,点击右上角的 「新建短剧」 按钮。
步骤 2:弹出新建剧集的表单弹窗。

3.2.2 填写剧集信息
| 字段 | 说明 | 必填 | 示例 |
|---|---|---|---|
| 剧集标题 | 短剧的名称 | ✅ 必填 | 互换人生·假面迷局 |
| 封面图片 | 列表展示用封面图 | ❌ 选填 | 点击上传按钮选择图片 |
| 剧集描述 | 简短的剧情描述 | ❌ 选填 | 一场意外引发的身份互换… |
| 总集数 | 该剧总共的集数 | ✅ 必填(默认1) | 10 |
填写步骤:
-
步骤 1:在「剧集标题」输入框中输入剧集名称
建议:名称简短有力,建议 4-12 个字
-
步骤 2(可选):点击封面区域上传图片,或拖拽图片到封面区域
支持格式:JPG、PNG;建议尺寸:16:9 或 3:4
-
步骤 3(可选):在「剧集描述」输入框中填写简短描述
-
步骤 4:在「总集数」输入框中填写总集数(默认值为 1)
如制作的是单集短剧,保持默认值 1 即可
3.2.3 确认创建
步骤 3:点击弹窗底部的 「创建剧集」 按钮。
步骤 4:创建成功后:
- 弹窗自动关闭
- 列表中新增一条剧集记录
- 自动跳转到剧集详情页
3.3 剧集详情页
3.3.1 进入详情页
在剧集列表页点击任意剧集卡片,即可进入该剧的详情页。
3.3.2 页面布局概览
剧集详情页包含以下功能标签页:
| 标签页 | 说明 |
|---|---|
| 角色 | 添加/编辑/删除角色形象 |
| 场景 | 添加/编辑/删除场景背景 |
| 分镜 | 查看/编辑/添加分镜 |
| 设置 | 修改剧集基本信息 |

3.3.3 设置标签页
在「设置」标签页可以修改:
| 字段 | 说明 |
|---|---|
| 剧集封面 | 上传/更换封面图 |
| 剧集标题 | 修改剧集名称 |
| 描述 | 修改剧情描述 |
| 总集数 | 修改总集数 |
| 状态 | 草稿 / 制作中 / 已完成 |
状态说明:
- 草稿:刚开始制作的剧集
- 制作中:正在制作中
- 已完成:制作完成的剧集
4. AI 配置
入口:顶部导航 → AI配置
4.1 为什么需要配置 AI
平台使用 AI 厂商来完成以下功能:
| AI 功能 | 用途说明 |
|---|---|
| 文本生成(text) | 理解剧本内容、拆分场景 |
| 图片生成(image) | 生成角色图、场景图、分镜参考图 |
| 视频生成(video) | 将分镜描述转换为视频片段 |
| 语音合成(tts) | 将文字台词转换为语音 |
重要提示:首次使用平台前,必须先完成 AI 配置,否则无法使用任何生成功能。
4.2 支持的 AI 厂商
| 厂商 | 说明 | 支持的 API 类型 |
|---|---|---|
| MiniMax | 海螺视频是主力模型 | text、image、video、tts |
| 火山引擎(volcengine) | 豆包/火山引擎,支持音画同生 | video、tts |
| OpenAI | GPT 系列模型 | text、image |
| Google Gemini | Gemini 系列模型 | text、image |
| 阿里云 | 阿里云 AI 服务 | text、image |

4.3 AI 配置页面布局
4.3.1 页面组成
| 区域 | 说明 |
|---|---|
| 页面标题 | 显示"AI 服务配置" |
| 添加按钮 | 右上角「添加配置」按钮 |
| 类型筛选 Tab | 按 API 类型筛选配置:全部 / 文本生成 / 图片生成 / 视频生成 / 语音合成 |
| 配置列表 | 显示所有已添加的 AI 配置 |
| 配置卡片 | 每个配置卡片显示厂商、API类型、模型名称、启用状态 |

4.3.2 筛选功能
点击不同的类型筛选 Tab,可以快速查看该类型的所有配置:
| 筛选Tab | 说明 |
|---|---|
| 全部 | 显示所有 AI 配置 |
| 文本生成 | 仅显示 text 类型配置 |
| 图片生成 | 仅显示 image 类型配置 |
| 视频生成 | 仅显示 video 类型配置 |
| 语音合成 | 仅显示 tts 类型配置 |
提示:每个 Tab 后面会显示该类型的配置数量。

4.4 添加 AI 配置
4.4.1 打开添加弹窗
步骤 1:在 AI 配置页面,点击右上角的 「添加配置」 按钮。
步骤 2:弹出添加配置的表单弹窗。

4.4.2 填写配置信息
| 字段 | 说明 | 必填 | 示例/说明 |
|---|---|---|---|
| 厂商 | AI 服务提供商 | ✅ 必填 | 选择厂商 |
| API类型 | 该配置用于哪种功能 | ✅ 必填 | 选择 API 类型 |
| Base URL | API 接口地址 | ✅ 必填 | 各厂商默认值不同 |
| API Key | 访问密钥 | ✅ 必填 | 从厂商平台获取 |
| 模型名称 | 具体使用的模型名称 | ✅ 必填 | 如 gpt-4o、speech-02-hd |
| 优先级 | 同类型多配置时的优先级 | ✅ 必填(默认0) | 数字越小越优先 |
| Token单价 | 每 Token 的价格(元/Token) | ❌ 选填 | 用于计算任务费用 |
4.4.3 厂商说明
| 厂商 | Base URL 默认值 | 说明 |
|---|---|---|
| MiniMax | https://api.minimaxi.com/v1 |
海螺视频、TTS 主力厂商 |
| 火山引擎 | https://ark.cn-beijing.volces.com/api/v3 |
豆包/火山引擎 |
| OpenAI | https://api.openai.com/v1 |
GPT 系列模型 |
| Google Gemini | https://generativelanguage.googleapis.com/v1 |
Gemini 系列模型 |
| 阿里云 | 需填写 | 阿里云 AI 服务 |
4.4.4 API 类型说明
| API 类型 | 用途 | 常用模型 |
|---|---|---|
| 文本生成(text) | 剧本分析、场景拆解 | gpt-4o、gpt-3.5-turbo |
| 图片生成(image) | 生成角色图、场景图 | dall-e-3、stable-diffusion |
| 视频生成(video) | 生成视频片段 | MiniMax-Hailuo-2.3、doubao-seedance-1-5-pro |
| 语音合成(tts) | TTS 配音 | speech-02-hd |
4.4.5 优先级说明
同一 API 类型可配置多个厂商,优先级数字越小越优先。
示例:配置了多个视频生成配置
| 配置 | 厂商 | API类型 | 优先级 | 效果 |
|---|---|---|---|---|
| 配置A | MiniMax | video | 0 | 优先使用 |
| 配置B | 火山引擎 | video | 1 | 配置A不可用时使用 |
4.4.6 Token 单价说明
Token 单价用于计算任务的实际费用消耗。
提示:如果不填写 Token 单价,将无法准确计算任务费用,但仍可正常使用 AI 功能。
4.4.7 确认添加
步骤 3:填写完毕后,点击 「保存」 按钮。

4.5 管理已有配置
4.5.1 配置卡片显示内容
每个配置卡片显示:
| 信息 | 说明 |
|---|---|
| 启用/禁用状态 | 显示为绿色"启用"或灰色"禁用"标签 |
| 厂商名称 | 如 MiniMax、火山引擎 |
| API类型 | 如 文本生成、图片生成 |
| 模型名称 | 具体模型名称 |

4.5.2 配置操作
| 操作 | 功能 |
|---|---|
| 启用/禁用切换 | 点击圆形图标,切换该配置的启用状态 |
| 编辑 | 点击编辑图标,修改该配置的信息 |
| 删除 | 点击删除图标,删除该配置(需二次确认) |
提示:禁用的配置不会生效,但不会被删除,可以随时启用。

4.6 配置示例
4.6.1 MiniMax 文本生成配置
| 字段 | 填写内容 |
|---|---|
| 厂商 | MiniMax |
| API类型 | 文本生成 |
| Base URL | https://api.minimaxi.com/v1 |
| API Key | 从 MiniMax 开放平台获取 |
| 模型名称 | (可不填或填写如gpt-4o) |
| 优先级 | 0 |
4.6.2 MiniMax TTS 配置
| 字段 | 填写内容 |
|---|---|
| 厂商 | MiniMax |
| API类型 | 语音合成 |
| Base URL | https://api.minimaxi.com/v1 |
| API Key | 从 MiniMax 开放平台获取 |
| 模型名称 | speech-02-hd |
| 优先级 | 0 |
4.6.3 火山引擎视频生成配置
| 字段 | 填写内容 |
|---|---|
| 厂商 | 火山引擎(volcengine) |
| API类型 | 视频生成 |
| Base URL | https://ark.cn-beijing.volces.com/api/v3 |
| API Key | 从火山引擎控制台获取 |
| 模型名称 | doubao-seedance-1-5-pro-251215 |
| 优先级 | 1 |
5. 存储设置
入口:顶部导航 → 存储
5.1 存储的作用
平台生成的文件需要存放位置:
| 文件类型 | 示例 |
|---|---|
| 视频文件 | .mp4 格式的视频片段 |
| 图片文件 | .jpg/.png 格式的角色图、场景图 |
| 音频文件 | .mp3/.wav 格式的配音音频 |
| 字幕文件 | .ass 格式的字幕文件 |
存储位置选项:
- 云存储(OSS):阿里云对象存储,推荐用于生产环境
- 本地存储:服务器本地磁盘,适合测试/开发环境

5.2 配置阿里云 OSS

5.2.1 填写 OSS 配置信息
| 字段 | 说明 | 示例 |
|---|---|---|
| Endpoint | OSS 服务地址 | oss-cn-chengdu.aliyuncs.com |
| AccessKey ID | 阿里云 AccessKey ID | 从阿里云控制台获取 |
| AccessKey Secret | 阿里云 AccessKey Secret | 从阿里云控制台获取 |
| Bucket 名称 | OSS 存储桶名称 | 如my-drama-bucket |
| 自定义域名 | (可选)已备案的域名 | 如cdn.example.com |
5.2.2 Endpoint 说明
不同地区的 Endpoint 不同,填写时请使用实际创建 Bucket 的地区:
| 地区 | Endpoint 示例 |
|---|---|
| 成都 | oss-cn-chengdu.aliyuncs.com |
| 北京 | oss-cn-beijing.aliyuncs.com |
| 上海 | oss-cn-shanghai.aliyuncs.com |
| 深圳 | oss-cn-shenzhen.aliyuncs.com |
5.2.3 确认保存
点击 「保存」 按钮。
提示:保存后建议测试连接是否正常。
5.3 配置本地存储
5.3.1 选择本地存储模式
如果在存储设置页面看到模式选择,选择 「本地存储」 选项。
5.3.2 设置本地存储路径
| 字段 | 说明 |
|---|---|
| 存储路径 | 本地磁盘存放目录,如/data/drama-files/ |
提示:本地存储适合开发测试环境使用。生产环境建议使用 OSS 云存储。
6. 任务追踪
入口:顶部导航 → 任务追踪
6.1 什么是异步任务
AI 生成操作(如视频生成、配音合成)是异步任务:
| 同步任务 | 异步任务 |
|---|---|
| 点击后立即等待结果 | 提交后后台执行,前端立即返回 |
| 适合耗时短的操作 | 适合耗时长(如 2-10 分钟)的操作 |

6.2 任务状态说明
| 状态 | 标识 | 含义 |
|---|---|---|
| ⏳等待中 | 蓝色 | 任务已提交,等待执行 |
| 🔄处理中 | 黄色 | 正在执行 |
| ✅已完成 | 绿色 | 任务完成,结果可用 |
| ❌失败 | 红色 | 任务失败,可查看错误原因 |

6.3 查看任务详情
步骤 1:在任务列表中找到需要查看的任务,点击该行或「查看详情」按钮。
步骤 2:在详情弹窗中查看:
| 信息 | 说明 |
|---|---|
| 任务类型 | 视频生成 / 配音合成 |
| 关联分镜 | 所属剧集和分镜编号 |
| 提交时间 | 任务开始时间 |
| 完成时间 | 任务结束时间(完成后显示) |
| 执行耗时 | 总耗时 |
| 状态 | 当前状态 |
| 错误信息 | 失败时显示的具体错误原因 |
6.4 任务失败处理
6.4.1 常见错误及解决方法
| 错误类型 | 可能原因 | 解决方法 |
|---|---|---|
| API Key 无效 | Key 过期或填写错误 | 前往 AI 配置页面更新 API Key |
| 余额不足 | 账号余额不足 | 前往 AI 厂商平台充值 |
| 参数不支持 | 模型不支持当前参数组合 | 调整参数后重试 |
| 网络超时 | 网络连接问题 | 点击「重试」,通常为临时性问题 |
| 任务超时 | AI 厂商处理超时 | 等待一段时间后重试 |
6.4.2 重试任务
步骤 3:确认问题解决后,点击 「重试」 按钮重新执行任务。

7. 短剧制作全流程详解
7.1 创建剧集
7.1.1 操作路径
剧集列表页 → 点击「新建短剧」→ 填写信息 → 创建 → 进入剧集详情页
7.1.2 具体操作步骤
步骤 1:在浏览器中打开平台,进入剧集列表页。
步骤 2:点击页面右上角的 「新建短剧」 按钮。
步骤 3:在弹出的新建剧集表单中,填写剧集标题(必填)。
建议:
- 名称简短有力,4-12 个字为宜
- 避免使用特殊字符
步骤 4(可选):点击封面区域,上传封面图片。
封面要求:
- 支持格式:JPG、PNG
- 建议尺寸:1280×720(16:9)或 750×1000(3:4)
步骤 5(可选):在「剧集描述」中填写简短描述。
步骤 6:在「总集数」输入框中填写总集数(默认值为 1)。
步骤 7:点击 「创建剧集」 按钮。
步骤 8:创建成功后,自动跳转到剧集详情页。

7.2 角色设计
7.2.1 操作路径
剧集详情页 → 点击「角色」标签 → 添加角色 → 填写信息 → 保存
7.2.2 进入角色管理
步骤 1:在剧集详情页,点击 「角色」 标签。

7.2.3 添加新角色
步骤 3:点击 「添加角色」 按钮。
步骤 4:弹出添加角色的表单弹窗。

7.2.5 填写角色信息
| 字段 | 说明 | 示例 |
|---|---|---|
| 名称 | 角色姓名/代号 | 张伟、李婷 |
| 描述 | 角色背景描述 | 28岁都市女性,外企高管 |
| 外观提示词 | 用于 AI 生成角色图的描述 | 可手动填写或 AI 提取 |
| 台词风格 | 角色的说话风格 | 温柔/霸道/幽默 |
| 专属音色 | 角色使用的 TTS 音色 | 从音色列表中选择 |
| 角色形象图 | 角色的外观图片 | AI 生成或上传 |
7.2.6 选择专属音色
在「专属音色」下拉菜单中,有 60+ 种音色 可供选择。
音色分类列表:
一、标准音色(中文普通话)
| 音色 ID | æ ‡签显示 | 适用角色 | 示例场景 |
|---|---|---|---|
male-qn-qingse |
🎙️ 青涩青年音色 | 年轻男性角色 | 少年、学生、实习生 |
male-qn-jingying |
🎙️ 精英青年音色 | 职场男性 | 经理、精英、商务人士 |
male-qn-badao |
🎙️ 霸道青年音色 | 强势男性 | 总裁、少爷、霸道男主 |
male-qn-daxuesheng |
🎙️ 青年大学生音色 | 年轻男性 | 大学生、校园男主 |
female-shaonv |
🎙️ 少女音色 | 年轻女性 | 女主、妹妹、萝莉 |
female-yujie |
🎙️ 御姐音色 | 成熟女性 | 御姐、女上司、女王 |
female-chengshu |
🎙️ 成熟女性音色 | 成年女性 | 母亲、姐姐、熟女 |
female-tianmei |
🎙️ 甜美女性音色 | 可爱型女性 | 甜美女主、邻家女孩 |
二、Beta 精品音色
| 音色 ID | 标签显示 | 适用角色 | 说明 |
|---|---|---|---|
male-qn-qingse-jingpin |
⭐ 青涩青年音色-beta | 青涩感年轻男性 | 比标准版更细腻 |
male-qn-jingying-jingpin |
⭐ 精英青年音色-beta | 专业精英男性 | 更专业的精英感 |
male-qn-badao-jingpin |
⭐ 霸道青年音色-beta | 强势霸道男性 | 更强势的霸道感 |
male-qn-daxuesheng-jingpin |
⭐ 青年大学生音色-beta | 校园男生 | 更强的校园感 |
female-shaonv-jingpin |
⭐ 少女音色-beta | 清纯少女 | 更细腻的少女感 |
female-yujie-jingpin |
⭐ 御姐音色-beta | 成熟御姐 | 更成熟的御姐感 |
female-chengshu-jingpin |
⭐ 成熟女性音色-beta | 沉稳女性 | 更沉稳的女性声音 |
female-tianmei-jingpin |
⭐ 甜美女性音色-beta | 甜美女孩 | 更甜美的声音 |
三、特色角色音色
| 音色 ID | 标签显示 | 适用角色 | 说明 |
|---|---|---|---|
clever_boy |
🧒 聪明男童 | 聪明的小男孩 | 智慧型儿童角色 |
cute_boy |
🧒 可爱男童 | 可爱的小男孩 | 萌系儿童角色 |
lovely_girl |
👧 萌萌女童 | 可爱的小女孩 | 萌系小女孩 |
cartoon_pig |
🐷 卡通猪小琪 | 卡通角色 | 动画/游戏角色 |
bingjiao_didi |
😈 病娇弟弟 | 病娇型男性 | 偏执、病娇弟弟 |
junlang_nanyou |
👦 俊朗男友 | 帅气的男朋友 | 偶像剧男主 |
chunzhen_xuedi |
🎒 纯真学弟 | 天真的学弟 | 校园单纯男生 |
lengdan_xiongzhang |
🧊 冷淡学长 | 高冷学长 | 冰山系学长 |
badao_shaoye |
🎩 霸道少爷 | 有钱少爷 | 富二代、少爷 |
tianxin_xiaoling |
🍬 甜心小玲 | 甜美女孩子 | 甜心系女孩 |
qiaopi_mengmei |
😜 俏皮萌妹 | 俏皮女孩 | 活泼俏皮女主 |
wumei_yujie |
💋 妩媚御姐 | 妩媚的御姐 | 性感成熟的御姐 |
diadia_xuemei |
🎀 嗲嗲学妹 | 撒娇的学妹 | 黏人撒娇型 |
danya_xuejie |
📚 淡雅学姐 | 文艺学姐 | 气质文艺学姐 |
四、专业/特色音色
| 音色 ID | 标签显示 | 适用场景 | 说明 |
|---|---|---|---|
Chinese (Mandarin)_Reliable_Executive |
💼 沉稳高管 | 成熟男性管理者 | CEO、领导 |
Chinese (Mandarin)_News_Anchor |
📺 新闻女声 | 新闻播报 | 新闻旁白 |
Chinese (Mandarin)_Mature_Woman |
💅 傲娇御姐 | 傲娇女性 | 傲娇型女主 |
Chinese (Mandarin)_Unrestrained_Young_Man |
🏍️ 不羁青年 | 叛逆青年 | 摩托车手、摇滚青年 |
Arrogant_Miss |
😤 嚣张小姐 | 嚣张大小姐 | 富家女 |
Robot_Armor |
🤖 机械战甲 | 机器人 | 科幻角色 |
Chinese (Mandarin)_Kind-hearted_Antie |
👵 热心大婶 | 中老年女性 | 邻居大妈 |
Chinese (Mandarin)_HK_Flight_Attendant |
✈️ 港普空姐 | 港式普通话 | 空姐角色 |
Chinese (Mandarin)_Humorous_Elder |
😂 搞笑大爷 | 搞笑老年男性 | 喜剧角色 |
Chinese (Mandarin)_Gentleman |
🎩 温润男声 | 温柔男性 | 暖男 |
Chinese (Mandarin)_Warm_Bestie |
👭 温暖闺蜜 | 女性好朋友 | 闺蜜 |
Chinese (Mandarin)_Male_Announcer |
🎤 播报男声 | 广播 | 体育解说 |
Chinese (Mandarin)_Sweet_Lady |
🌸 甜美女声 | 甜美女性 | 甜心女主 |
Chinese (Mandarin)_Southern_Young_Man |
🌾 南方小哥 | 南方口音男性 | 南方男性角色 |
Chinese (Mandarin)_Wise_Women |
📖 阅历姐姐 | 有故事的姐姐 | 大姐姐 |
Chinese (Mandarin)_Gentle_Youth |
🍃 温润青年 | 温柔的青年 | 暖心男主 |
Chinese (Mandarin)_Warm_Girl |
☀️ 温暖少女 | 温暖的女孩 | 治愈系女主 |
Chinese (Mandarin)_Kind-hearted_Elder |
👵 花甲奶奶 | 老年女性 | 奶奶角色 |
Chinese (Mandarin)_Cute_Spirit |
🦄 憨憨萌兽 | 可爱萌兽音 | 卡通动物 |
Chinese (Mandarin)_Radio_Host |
📻 电台男主播 | 电台主持 | 广播主持 |
Chinese (Mandarin)_Lyrical_Voice |
🎵 抒情男声 | 抒情/唱歌 | 歌手角色 |
Chinese (Mandarin)_Straightforward_Boy |
🗣️ 率真弟弟 | 耿直弟弟 | 率真男孩 |
Chinese (Mandarin)_Sincere_Adult |
🙏 真诚青年 | 真诚的男性 | 真诚男主 |
Chinese (Mandarin)_Gentle_Senior |
🌙 温柔学姐 | 温柔的学姐 | 大学学姐 |
Chinese (Mandarin)_Stubborn_Friend |
😤 嘴硬竹马 | 傲娇青梅竹马 | 竹马 |
Chinese (Mandarin)_Crisp_Girl |
✨ 清脆少女 | 声音清脆的女孩 | 清纯少女 |
Chinese (Mandarin)_Pure-hearted_Boy |
💙 清澈邻家弟弟 | 清澈男孩声音 | 邻家弟弟 |
Chinese (Mandarin)_Soft_Girl |
🌸 柔和少女 | 柔和女性声音 | 柔和女主 |
五、中文(粤语)
| 音色 ID | 标签显示 | 适用场景 | 说明 |
|---|---|---|---|
Cantonese_ProfessionalHost(F) |
🇭🇰 粤语-专业女主持 | 粤语女主持 | 香港节目 |
Cantonese_GentleLady |
🇭🇰 粤语-温柔女声 | 温柔粤语女性 | 温柔女性 |
Cantonese_ProfessionalHost(M) |
🇭🇰 粤语-专业男主持 | 粤语男主持 | 香港节目 |
Cantonese_PlayfulMan |
🇭🇰 粤语-活泼男声 | 活泼粤语男性 | 活泼男性 |
Cantonese_CuteGirl |
🇭🇰 粤语-可爱女孩 | 可爱粤语女孩 | 小女孩 |
Cantonese_KindWoman |
🇭🇰 粤语-善良女声 | 善良粤语女性 | 善良女性 |
音色选择建议:
- 优先选择与角色性格匹配的音色
- Beta 精品音色比标准音色æ›´细腻,但可能消耗更多资源
- 特定角色音色适合特定人设的角色
- 粤语音色适合需要地方特色的角色

7.2.7 试听音色
- 选择一个音色
- 点击 「试听」 按钮
- 等待试听音频生成(约 10-30 秒)
- 在预览区域播放试听

7.2.8 生成/上传角色形象图
方式一:AI 自动生成
- 填写「外观提示词」(描述角色外观)
- 点击 「AI生成」 按钮
- 等待生成完成(通常 10-30 秒)
方式二:从素材库选择
- 点击 「从存储选择」 按钮
- 在弹出窗口中选择已上传的图片
- 确认选择
方式三:上传本地图片
- 点击 「上传图片」 按钮
- 从本地选择图片文件
- 图片自动填入
方式四:提取已有图片的外观描述
如果已有角色图片,可以:
- 先上传角色图片
- 点击 「提取」 按钮(位于图片右侧)
- 系统自动分析图片并填入「外观提示词」
7.2.9 保存角色
步骤 5:确认角色信息填写完毕后,点击 「创建」 按钮。
7.3 场景管理
7.3.1 操作路径
剧集详情页 → 点击「场景」标签 → 添加场景 → 填写信息 → 保存
7.3.2 进入场景管理
步骤 1:在剧集详情页,点击 「场景」 标签。

7.3.3 添加新场景
步骤 3:点击 「添加场景」 按钮。
弹出添加场景的表单弹窗。

7.3.4 填写场景信息
| 字段 | 说明 | 示例 |
|---|---|---|
| 场景名称 | 场景名称/代号 | 温馨客厅、深夜天台 |
| 地点 | 场景所在地点 | 市中心、郊外、学校 |
| 时间 | 场景发生的时间段 | 白天、夜晚、清晨等 |
| 描述 | 环境详细描述 | 现代简约风格,落地窗外城市夜景 |
| AI生成提示词 | 用于 AI 生成场景图 | 可手动填写或留空让 AI 自动生成 |
| 场景图片 | 场景的参考图 | AI 生成或上传 |
7.3.5 时间段选项
| 时间段 | 说明 | 适用场景示例 |
|---|---|---|
| 白天 | 日间场景,阳光充足 | 客厅、办公室、街道 |
| 夜晚 | 夜间场景,灯光照明 | 夜总会、天台、街道 |
| 清晨 | 早晨场景,晨曦微露 | 公园、湖边、卧室 |
| 黄昏 | 傍晚场景,夕阳西下 | 天台、海边、街道 |
| 黎明 | 天刚亮的时候 | 街道、公园、乡村 |
| 午夜 | 深夜十二点左右 | 办公室、医院、街道 |

7.3.6 生成/上传场景图
方式一:AI 自动生成
- 填写「AI生成提示词」(描述场景环境)
- 点击 「AI生成」 按钮
- 等待生成完成
方式二:从素材库选择
- 点击 「从存储选择」 按钮
- 选择已上传的图片
方式三:上传本地图片
- 点击 「上传图片」 按钮
7.3.7 保存场景
步骤 5:确认信息填写完毕后,点击 「创建」 按钮。
7.4 分镜设计
7.4.1 操作路径
剧集详情页 → 点击「分镜」标签 → AI拆解剧本 或 手动添加分镜
7.4.2 进入分镜列表
步骤 1:在剧集详情页,点击 「分镜」 标签。

7.4.3 方式一:AI 自动拆解剧本
如果已有完整剧本,可使用 AI 自动拆解功能。
步骤 3:在分镜列表上方文本框中粘贴完整剧本内容。
剧本格式建议:
- 纯文本格式
- 包含场景描述和角色台词
- 建议每段对话前标注角色名
示例剧本格式:
【第一幕 客厅】 张伟:(走进客厅)今天真是太累了。 李婷:(递上咖啡)辛苦了,喝点咖啡吧。 【第二幕 办公室】 张伟:(坐在办公桌前)这个项目必须尽快完成。 同事:没问题,我来帮你。
步骤 4:点击 「AI拆解分镜」 按钮。
步骤 5:AI 分析剧本并自动生成分镜,等待生成完成(通常 30-60 秒)。
步骤 6:拆解完成后,分镜列表中自动填充所有分镜。

7.4.4 方式二:手动添加/编辑分镜
步骤 3:在分镜列表中,点击要编辑的分镜卡片。
步骤 4:弹出分镜编辑表单。

7.4.5 填写分镜信息
| 字段 | 说明 | 示例 |
|---|---|---|
| 镜头类型 | 镜头景别 | 全景、中景、近景、特写 |
| 运镜方式 | 镜头运动方式 | 推镜头/拉镜头/固定 |
| 动作描述 | 该镜头的动作和画面 | 角色缓缓转身,背景是夕阳下的海滩 |
| 台词 | 角色的对白 | 张伟:今天天气真好! |
镜头类型详解:
| 镜头类型 | 说明 | 适用场景 |
|---|---|---|
| 全景(wide) | 展示完整场景和所有人物 | 开场、群戏、交代环境 |
| 中景(medium) | 展示人物膝盖以上 | 对话、动作场景 |
| 近景(close-up) | 展示人物胸部以上 | 对话特写、情感表达 |
| 特写(extreme-close-up) | 聚焦人物脸部或物体 | 强调表情、细节 |
运镜方式说明:
| 运镜方式 | 说明 |
|---|---|
| 推镜头 | 镜头向前推进,画面放大 |
| 拉镜头 | 镜头向后拉远,画面缩小 |
| 固定 | 镜头固定不动 |
| 左移/右移 | 镜头左右平移 |
| 上升/下降 | 镜头上下移动 |
| 摇镜头 | 镜头左右摇摆 |
7.4.6 关联角色和场景
在分镜编辑弹窗中:
关联角色:
- 从角色下拉菜单中选择(支持多选)
- 已设置角色图片的角色会显示 📸 图标
- 选择后自动带出角色图片
关联场景:
- 从场景下拉菜单中选择
- 已设置场景图片的场景会显示 📸 图标
- 选择后自动带出场景图片

7.4.7 保存分镜
步骤 5:确认信息填写完毕后,点击 「保存」 按钮。
7.5 工作台(批量参考图管理)
入口:剧集详情页 → 进入工作台
7.5.1 工作台页面布局
工作台包含以下标签页:
| 标签页 | 说明 |
|---|---|
| 分镜编辑器 | 分镜列表、参考图管理、生成视频入口 |
| 角色图 | 批量管理角色图片生成 |
| 场景图 | 批量管理场景图片生成 |
| 视频生成 | 快速生成视频 |


7.5.2 分镜编辑器标签页
7.5.2.1 批量参考图管理面板
在分镜列表上方有参考图批量管理面板,显示:
| 信息 | 说明 |
|---|---|
| 已生成数量 | 已生成参考图的分镜数 / 总分镜数 |
| 模型选择 | 选择参考图生成的模型 |
参考图模型选项:
| 模型 | 说明 |
|---|---|
| MiniMax Image-01 | MiniMax 图片生成模型 |
| Seedream 5.0(多图融合) | 豆包多图融合模型 |
批量生成按钮:
- 点击 「全部生成」 按钮,可以批量为未生成参考图的分镜生成图片
- 显示"X个未生成"表示还有多少分镜需要生成

7.5.2.2 分镜卡片内容
每个分镜卡片显示:
| 信息 | 说明 |
|---|---|
| 镜号 | 分镜序号 |
| 镜头类型标签 | 全景/中景/近景/特写 |
| 动作描述 | 该镜头的动作和画面描述 |
| 台词 | 角色对白(如有) |
| 角色标签 | 关联的角色名称 |
| 运镜方式标签 | 如 推镜头/拉镜头 |
| 图片标记 | 场景图/角色图/宫格图/参考图 标记 |
7.5.2.3 分镜卡片操作
| 操作 | 功能 |
|---|---|
| 点击卡片 | 打开分镜编辑弹窗 |
| 生成参考图 | 为该分镜生成参考图 |
| Ctrl+点击生成参考图 | 强制重新生成(覆盖已有图片) |
| 预览 | 预览已生成的参考图 |
| 重绘 | 重新生成参考图 |
| 生成视频 | 跳转到媒体工作室的视频生成页面 |
7.5.2.4 参考图状态
| 状态 | 显示 | 说明 |
|---|---|---|
| 已生成 | 绿色 ✓ 图标 | 该分镜已有参考图 |
| 未生成 | 灰色 ○ 图标 | 该分镜尚未生成参考图 |
7.5.3 角色图标签页
7.5.3.1 角色卡片
每个角色卡片显示:
| 信息 | 说明 |
|---|---|
| 角色图片 | 角色形象图(如无则显示占位图标) |
| 角色名称 | 角色姓名 |
| 生成状态 | AI 生成中的加载动画 |
7.5.3.2 角色图操作
| 操作 | 功能 |
|---|---|
| AI生成角色图 | 为该角色生成形象图 |
| 点击生成中 | 等待生成完成(按钮禁用) |
前提条件:需要先在「角色」标签页添加角色并设置外观提示词。

7.5.4 场景图标签页
7.5.4.1 场景卡片
每个场景卡片显示:
| 信息 | 说明 |
|---|---|
| 场景图片 | 场景背景图(如无则显示占位图标) |
| 场景名称 | 场景名称 |
| 生成状态 | AI 生成中的加载动画 |
7.5.4.2 场景图操作
| 操作 | 功能 |
|---|---|
| AI生成场景图 | 为该场景生成背景图 |
前提条件:需要先在「场景」标签页添加场景并设置 AI 生成提示词。

7.5.5 视频生成标签页
7.5.5.1 快速视频生成
步骤 1:在「参考图片 URL」输入框中粘贴图片地址。
图片来源:
- 分镜参考图的 URL
- 宫格图的 URL
- 角色图的 URL
- 场景图的 URL
步骤 2:在「视频模型」下拉菜单中选择 AI 模型。
| 模型 | 说明 |
|---|---|
| MiniMax 海螺 2.3 | MiniMax 视频生成模型 |
| MiniMax Video-01 | MiniMax 视频模型 01 |
步骤 3:点击 「生成视频」 按钮。
7.5.5.2 视频记录
生成记录列表显示:
| 信息 | 说明 |
|---|---|
| 视频预览 | 视频封面图或播放按钮 |
| 模型名称 | 使用的 AI 模型 |
| 状态标签 | 已完成 / 处理中 / 失败 |
| 集数 | 所属集数 |
| 时长 | 视频时长 |

视频预览操作:
- 点击视频区域:播放/暂停视频
- 视频播放时显示进度条和播放控件
7.6 TTS 配音
入口:媒体工作室 → 配音 tab
7.6.1 进入配音页面
步骤 1:在剧集详情页,点击 「媒体工作室」。
步骤 2:在媒体工作室中,默认显示「配音」标签页。

7.6.2 配音页面布局
| 区域 | 说明 |
|---|---|
| 关联分镜选择 | 下拉菜单选择要配音的分镜 |
| 关联角色选择 | 下拉菜单选择角色(可选) |
| 音色选择 | 下拉菜单选择音色 |
| 试听按钮 | 试听当前选择的音色 |
| 配音文本 | 多行文本框输入台词 |
| 生成按钮 | 提交配音生成任务 |
| 配音记录列表 | 显示已生成的配音记录 |
7.6.3 选择目标分镜
步骤 3:在「关联分镜」下拉菜单中选择要配音的分镜。
自动填入功能:
- 选择分镜后,该分镜的台词自动填入文本框
- 该分镜关联的角色自动带出
- 根据角色信息自动选择匹配的音色(如果有设置)

7.6.4 选择音色
步骤 4:从「选择音色」下拉菜单中选择合适的角色音色。
音色列表:共 60+ 种音色,详见「7.2.6 选择专属音色」章节。
7.6.5 试听音色
- 选择一个音色
- 点击 「试听 →」 链接
- 等待试听音频生成(约 10-30 秒)
- 在预览区域播放试听
7.6.6 填写/修改配音文本
步骤 5:在「配音文本」文本框中确认或修改台词内容。
提示:
- 如果选择了分镜,台词会自动填入
- 可以手动修改台词内容
- 建议每段配音控制在 50 字以内,效果更好
7.6.7 生成配音
步骤 6:确认信息无误后,点击 「生成配音」 按钮。
7.6.8 配音记录列表
| 列 | 说明 |
|---|---|
| 播放按钮 | 点击可试听配音(紫色播放图标) |
| 台词预览 | 显示台词内容(前50字) |
| 分镜编号 | 关联的分镜号 |
| 音色信息 | 使用的音色和提供商 |
| 时长 | 配音音频的时长(秒) |
| 状态 | 已完成 / 处理中 / 失败 |
| 操作 | 删除该配音记录 |
7.7 视频生成
入口:媒体工作室 → 视频生成 tab
7.7.1 进入视频生成页面
步骤 1:在媒体工作室中,点击 「视频生成」 标签。

7.7.2 视频生成页面布局
| 区域 | 说明 |
|---|---|
| 厂商选择 | Radio 单选按钮选择 AI 厂商 |
| 模型选择 | 下拉菜单选择具体的 AI 模型 |
| 生成模式 | Radio 单选按钮选择生成模式 |
| 关联分镜 | 下拉菜单选择分镜(自动填入数据) |
| 画面描述 | 多行文本框输入视频描述 |
| 参考图片 | 图生视频/首尾帧/主体参考模式的图片上传 |
| 时长选择 | 6秒/10秒 或 4-12秒滑块 |
| 分辨率选择 | Radio 单选按钮选择画质 |
| 运镜指令 | 可多选的标签,选择镜头运动方式 |
| 预估费用 | 显示本次生成的成本 |
| 生成按钮 | 提交视频生成任务 |
7.7.3 选择 AI 厂商
步骤 3:在「选择厂商」中选择 AI 服务商。
| 厂商 | 说明 |
|---|---|
| MiniMax | 海螺视频生成,支持文生视频、图生视频 |
| 豆包/火山引擎 | 音画同生,支持对口型效果 |

7.7.4 选择模型
步骤 4:在「选择模型」下拉菜单中选择具体的 AI 模型。
7.7.4.1 MiniMax 模型选项
| 模型 | 支持模式 | 支持分辨率 | 支持时长 | 价格参考 |
|---|---|---|---|---|
| 海螺 2.3(标准版) | 文生视频、图生成视频 | 768P、1080P | 6秒 / 10秒 | 6s-768P: ¥2.00 6s-1080P: ¥3.50 10s: ¥4.00 |
| 海螺 2.3-Fast(快速版) | 仅图生视频 | 768P、1080P | 6秒 / 10秒 | 6s-768P: ¥1.35 6s-1080P: ¥2.31 |
| 海螺 02(多模式版) | 文生视频、图生视频、首尾帧 | 512P、768P、1080P | 6秒 / 10秒 | 6s-512P: ¥0.60(最低价) |
| S2V-01(主体参考) | 仅主体参考 | 仅 720P | 仅 6秒 | ¥2.00(固定) |
7.7.4.2 豆包/火山引擎模型选项
| 模型 | 支持模式 | 支持分辨率 | 支持时长 | 特点 |
|---|---|---|---|---|
| Seedance 1.5 Pro(音画同生) | 图生视频、首尾帧 | 480P、720P、1080P | 4-12秒(滑块调节) | 音画同步、支持对口型 |
豆包 Seedance 1.5 Pro 特别说明:
- 豆包模型支持音画同生(视频和音频同时生成),这是与 MiniMax 的核心区别
- 生成的视频自带原生音轨,无需后续配音合成
- 支持多语言及方言口型同步(普通话、陕西话、四川话、英语等)
7.7.4.3 豆包 Seedance 1.5 Pro 详解
豆包 Seedance 1.5 Pro(模型 ID:doubao-seedance-1-5-pro-251215)是火山引擎提供的专业级视频生成模型,核心特点是音画同生——音频和视频在同一次生成任务中同步产生,确保唇形与语音完美匹配。
支持的任务类型
| 任务类型 | 说明 | 适用场景 |
|---|---|---|
| 图生音画 | 基于图片 + 语音描述生成带声音的视频 | 有角色图/场景图时,生成人物说话的视频 |
| 图生视频 | 基于图片 + 文字描述生成无声视频 | 需要展示画面动作,但不需要角色配音 |
| 文生音画 | 仅凭文字描述生成带声音的视频 | 没有参考图片时,通过文字描述生成说话视频 |
| 文生视频 | 仅凭文字描述生成无声视频 | 没有参考图片时,通过文字描述生成纯画面视频 |
实际可用:当前平台界面主要开放「图生视频」和「首尾帧」模式。「图生音画」和「文生音画」需要通过剧情流等高级功能实现。
分辨率与时长参数
| 参数 | 可选值 | 说明 |
|---|---|---|
| 分辨率 | 480P(标清) | 最低成本,适合快速预览 |
| 720P(高清) | 中等成本,推荐日常使用 | |
| 1080P(全高清) | 最高成本,适合正式输出 | |
| 时长 | 4秒 / 6秒 / 8秒 / 10秒 / 12秒(滑块调节) | 时长越长费用越高 |
选择建议:
- 快速预览:480P + 4秒 = 最低成本,适合在正式制作前查看效果
- 日常制作:720P + 6-8秒 = 推荐配置,性价比最高
- 正式输出:1080P + 10-12秒 = 最高质量,适合最终交付
价格说明
豆包 Seedance 按 Tokens(Token) 数量计费,而非按秒计费:
| 视频类型 | 价格 | 说明 |
|---|---|---|
| 有声视频 | 16元 / 百万Tokens | 包含音轨的视频(音画同生) |
| 无声视频 | 8元 / 百万Tokens | 纯画面视频(无音频轨道) |
| 批量推理 | 更低折扣价格 | 适合大规模生产任务 |
与 MiniMax 的区别:
- MiniMax 按「秒」计费,价格固定
- 豆包按「Tokens」计费,实际费用取决于提示词复杂度(提示词越长,Tokens 越多)
- 批量推理可获得更低单价,适合专业制作团队
多语言与方言支持
豆包 Seedance 1.5 Pro 支持多语言唇形同步,可根据台词自动匹配口型:
| 语言/方言 | 说明 | 适用场景 |
|---|---|---|
| 普通话 | 标准中文 | 大部分国内短剧 |
| 陕西话 | 陕西方言 | 有地域特色的剧情 |
| 四川话 | 四川方言 | 西南地区风格短剧 |
| 英语 | 英文对白 | 国际化内容、出海场景 |
| 日语 | 日语对白 | 动漫风格内容 |
| 韩语 | 韩语对白 | 韩剧风格内容 |
| 粤语 | 粤语 | 港风内容 |
口型同步原理:系统会根据音频中的语言自动调整口型,使其与语音匹配,呈现自然的口型效果。
画面描述(Prompt)写作技巧
豆包 Seedance 的画面质量很大程度上取决于 Prompt(画面描述)的质量。以下是详细技巧:
####### Prompt 基本结构
一个完整的 Prompt 应包含以下要素:
[场景环境] + [人物外貌] + [人物动作] + [镜头运动] + [氛围光线] + [声音描述]
各要素详细说明
1. 场景环境(必填)
描述故事发生的地点和背景:
| 示例 | 说明 |
|---|---|
现代都市办公室,落地窗外是城市夜景 |
具体地点 + 环境细节 |
老式茶馆内,木质桌椅,墙上挂着书法 |
传统风格 + 陈设 |
海边悬崖,远处有灯塔,浪花拍打礁石 |
自然景观 + 动态元素 |
2. 人物外貌(必填)
描述画面中的人物外观特征:
| 示例 | 说明 |
|---|---|
女性,30岁左右,黑色长发,职业套装 |
基本特征 |
男性,40岁出头,短发,灰色西装,深色皮鞋 |
更详细的穿着 |
年轻女孩,20岁,淡妆,红色连衣裙,马尾辫 |
详细外貌 + 服装 |
3. 人物动作(必填)
描述人物在画面中的动作和表情:
| 示例 | 说明 |
|---|---|
女子缓缓站起身,神情惊讶,眉头微皱 |
动作 + 表情 |
男子靠在窗边,双手交叉胸å‰,目光看å‘远方 |
姿态 + 视线方向 |
两人对视片刻,女性轻轻点头,嘴角露出微笑 |
互动动作 |
4. 镜头运动(选填)
描述镜头如何移动(运镜指令):
| 示例 | 说明 |
|---|---|
镜头缓慢向前推进,聚焦于人物面部表情变化 |
推近 |
镜头缓慢拉远,展示整个场景的空间感 |
拉远 |
镜头轻微右摇,视线跟随人物移动 |
平移 |
5. 氛围光线(选填)
描述画面的光线和氛围:
| 示例 | 说明 |
|---|---|
黄昏暖色调,夕阳从窗户斜照进来 |
时间 + 光线方向 |
冷色调月光,房间内只有台灯的暖光 |
月光 + 点光源 |
霓虹灯光闪烁,营造夜晚都市氛围 |
特殊灯光效果 |
6. 声音描述(重要)
对于「有声视频」,Prompt 中应包含声音描述,帮助模型理解音频特征:
| 声音类型 | 示例 |
|---|---|
| 人声描述 | 女性声音,温柔但坚定,语速适中,略带情感起伏 |
| 语气描述 | 带有惊讶的语气,语速稍快,句尾语调上扬 |
| 环境音 | 伴随咖啡厅背景人声,隐约可闻钢琴轻音乐 |
| 海声 | 海浪拍打礁石的声音,海风声,海鸥鸣叫 |
| 光声 | 打字机键盘敲击声,电话铃声,纸张翻动声 |
| 脚步声 | 高跟鞋敲击地板的清脆声,脚步由远及近 |
重要:声音描述帮助模型理解音频内容,从而生成更匹配的口型。如果不描述声音特征,生成的口型可能与实际音频不匹配。
####### Prompt 完整示例
示例 1:有声视频(女性角色说话)
现代客厅场景,暖黄色灯光,落地窗外城市夜景。
女性,30岁左右,黑色长发,身穿米色针织衫,坐在沙发上。
她微微侧身,目光看向镜头方向,嘴唇轻轻张开。
镜头缓慢推近,聚焦于面部表情。
背景隐约有钢琴轻音乐。
女性声音,温柔但略带忧郁,语速缓慢。
海浪拍打岸边的声音。
示例 2:无声视频(场景展示)
古代客栈大厅,木质横梁,红灯笼悬挂在两侧。
一位侠客站在柜台前,身穿深色侠客服饰,腰佩长剑。
他右手握着酒杯,目光警觉地扫视周围。
镜头缓慢拉远,展示客栈全貌。
烛光摇曳,营造神秘氛围。
示例 3:首尾帧过渡(两人对话)
【首帧】咖啡厅角落,女性坐在靠窗位置,阳光从窗户斜照在她的侧脸。
【尾帧】女性站起身,面带微笑,双手接过对面男性递来的文件。
过渡:女性从坐姿缓慢站起,手部动作自然衔接。
镜头固定机位,焦点从女性侧脸切换到双手。
参数设置建议
| 场景 | 推荐配置 | 原因 |
|---|---|---|
| 快速预览 / 测试 | 480P + 4秒 | 最低成本,快速验证效果 |
| 日常短视频制作 | 720P + 6-8秒 | 性价比最高,质量足够日常使用 |
| 高质量正式输出 | 1080P + 10-12秒 | 最高质量,适合最终交付 |
| 角色对话场景 | 720P + 6秒 + 包含声音描述的 Prompt | 口型匹配效果最佳 |
| 场景转换/过渡镜头 | 720P + 4-6秒(短时长) | 过渡镜头不需要太长 |
| 动作幅度大的场景 | 1080P + 10-12秒 + 详细动作描述 | 长时长确保完整动作展示,高分辨率捕捉细节 |
与 MiniMax 的选择建议
| 需求场景 | 推荐方案 |
|---|---|
| 需要配音对口型 | 豆包 Seedance + 图生音画 + 声音描述 |
| 需要最低成本 | MiniMax 海螺 02 + 512P + 6秒 = ¥0.60 |
| 需要角色一致性(多镜头同角色) | MiniMax S2V-01(主体参考模式) |
| 需要快速预览 | 豆包 480P + 4秒 或 MiniMax 海螺 2.3-Fast |
| 需要更长视频(10秒以上) | MiniMax(豆包最长12秒,但价格较高) |
| 需要多语言口型 | 豆包 Seedance(支持方言和外语口型同步) |
| 需要复杂场景过渡 | 豆包 Seedance + 首尾帧模式 |
综合建议:如果预算充足且需要对口型效果,选择豆包 Seedance;如果追求性价比且已经有配音流程,选择 MiniMax。
模型选择建议:
- 想要最低价格:选海螺 02 + 512P + 6秒 = ¥0.60
- 想要最快速度:选海螺 2.3-Fast(快速版)
- 想要首尾帧:选海螺 02(多模式版)或豆包 Seedance
- 想要角色一致性:选 S2V-01(主体参考)
- 想要音画同步:选豆包 Seedance 1.5 Pro
- 想要对口型效果:选豆包 Seedance 1.5 Pro
7.7.5 选择生成模式
步骤 5:在「生成模式」中选择视频生成方式。
| 模式 | 说明 | 适用场景 |
|---|---|---|
| 📝 文生视频 | 仅凭文字描述直接生成视频 | 无参考图时使用 |
| 🖼️ 图生视频 | 基于图片+文字描述生成视频 | 有角色图/场景图时使用 |
| 🎬 首尾帧视频 | 提供首帧和尾帧图片,AI 生成过渡动画 | 需要特定起止画面 |
| 👤 主体参考 | 基于参考人物生成视频(S2V-01) | 保持角色外观一致性 |
模式对应关系:
- 海螺 2.3 标准版:支持文生视频、图生视频
- 海螺 2.3-Fast:仅支持图生视频
- 海螺 02:支持文生视频、图生视频、首尾帧
- S2V-01:仅支持主体参考
- 豆包 Seedance:支持图生视频、首尾帧
7.7.6 选择关联分镜
步骤 6:在「关联分镜」下拉菜单中选择要生成视频的分镜。
自动填入功能:
选择分镜后,系统自动填入:
- 画面描述(Prompt):自动组合角色、场景、动作等信息
- 参考图片:按优先级自动选择(参考图 > 宫格图 > 角色图 > 场景图)
- 推荐视频时长:根据该分镜的配音时长自动设置
7.7.7 填写/确认画面描述
步骤 7:确认或修改画面描述(Prompt)。
画面描述建议:
应包含:场景环境、人物动作、镜头运动、氛围光线等示例:
“温馨客厅场景,清晨阳光从落地窗洒入,一家人整齐坐在沙发上。镜头缓慢推近女主人公面部特写。背景音乐前奏响起,营造温馨期待氛围。”
7.7.8 上传参考图片
图生视频模式:
- 点击 「从素材库选择参考图片」
- 在弹出窗口中选择角色图或场景图
首尾帧模式:
- 「首帧图片」:选择起始画面
- 「尾帧图片」:选择结束画面
主体参考模式:
- 「参考人物图片」:选择角色形象图(用于保持角色一致性)
7.7.9 设置视频时长
步骤 8:设置视频时长。
| 厂商 | 时长选项 |
|---|---|
| MiniMax | 6 秒 / 10 秒(单选按钮) |
| 豆包/火山引擎 | 4-12 ç§’(滑块调节) |
时长选æ‹©建议:
- æ ¹据配音时长选择匹配的时长
- 系统会根据配音自动推荐合适的时长
- 更长的视频消耗更多费用
7.7.10 设置视频分辨率
步骤 9:在「视频分辨率」中选择画质等级。
| 分辨率 | 说明 | 价格影响 |
|---|---|---|
| 480P | 标清 | 较低(豆包专有) |
| 512P | 准高清 | 最低(海螺 02 独有) |
| 720P | 高清 | 中等 |
| 768P | 超清 | 标准 |
| 1080P | 全高清 | 最高 |
分辨率限制:
- 10 秒视频不支持 1080P(海螺模型限制)
- 首尾帧模式不支持 512P
- S2V-01 仅支持 720P
7.7.11 设置运镜指令
步骤 10(可选):在「运镜指令」中选择镜头运动方式。
| 运镜指令 | 效果说明 |
|---|---|
| 推近 | 镜头向前推进,画面放大 |
| 拉远 | 镜头向后拉远,画面缩小 |
| 左移 | 镜头向左平移 |
| 右移 | 镜头向右平移 |
| 上升 | 镜头向上移动 |
| 下降 | 镜头向下移动 |
| 旋转 | 镜头旋转 |
| 跟随 | 镜头跟随主体 |
提示:
- 可以多选运镜指令
- 选中的指令会自动添加到提示词前面
- 运镜效果会增加生成时间
7.7.12 查看预估费用
步骤 11:确认参数后,查看「预估费用」显示的本次生成成本。
费用仅供参考,以实际扣费为准。
7.7.13 提交生成
步骤 12:确认所有参数设置无误后,点击 「生成视频」 按钮。
7.8 合成输出
入口:媒体工作室 → 合成输出 tab
7.8.1 进入合成输出页面
步骤 1:在媒体工作室中,点击 「合成输出」 标签。

7.8.2 合成输出页面布局
| 区域 | 说明 |
|---|---|
| FFmpeg 状态 | 显示 FFmpeg 是否可用(不可用时合成按钮禁用) |
| 集数选择 | 输入框选择要合成的集数 |
| 开始合成按钮 | 提交合成任务 |
| 音画对齐详情 | 合成后显示每个镜头的处理策略 |
| 合成记录列表 | 显示历史合成记录 |
7.8.3 选择合成集数
步骤 2:在「集数」输入框中选择要合成的集数(1-100)。
7.8.4 确认分镜状态
步骤 3:系统显示该集所有分镜的视频状态。
| 状态 | 说明 |
|---|---|
| ✅ 已完成 | 视频已生成完成 |
| ⏳ 处理中 | 视频正在生成中 |
| ❌ 失败 | 视频生成失败 |
前置要求:至少需要有 1 个状态为「已完成」的视频才能开始合成
7.8.5 音画处理规则
合成时会自动处理音频,规则如下:
| 视频来源 | 音频处理方式 |
|---|---|
| MiniMax 生成(无声) | 自动混入对应分镜的 TTS 配音 |
| 豆包/火山引擎生成(有声音) | 保留原视频音画同步音频,不混入 TTS |
重要说明:
- 豆包/火山引擎的 Seedance 模型生成的是原生音画同步视频
- 合成时直接使用视频自带的音频,不再混入 TTS 配音
- 这是为了确保豆包视频的音画同步效果
7.8.6 字幕叠加说明
合成时系统会根据分镜的台词自动烧录 ASS 字幕到视频中。
7.8.7 开始合成
步骤 4:确认一切就绪后,点击 「开始合成第X集」 按钮。
7.8.8 查看合成进度
步骤 5:合成开始后,显示合成进度和音画对齐详情。
合成进度页面显示:
共 6 个镜头 · 总时长 26.3s
#1 🔵 冻结延展 视频6.0s + 配音7.2s → 输出7.2s [台词...]
#2 🟢 补静音 视频6.0s + 配音3.1s → 输出6.0s [台词...]
#3 ⚪ 纯画面 视频6.0s(无配音) → 输出6.0s
策略图标说明:
| 图标 | 策略名称 | 含义 |
|---|---|---|
| ✅ | 直接混流 | 配音和视频时长相近,直接拼接 |
| 🔵 | 冻结延展 | 配音比视频长,视频末帧冻结延展匹配音频 |
| 🟢 | 补静音 | 视频比配音长,音频结束后补静音 |
| ⚪ | 纯画面 | 无配音,保留视频原声(豆包视频)或纯画面 |
| 🔴 | 降级(原始) | 合成失败,使用原始视频 |
| 🟡 | 降级(简单) | 简单拼接模式 |
7.8.9 合成完成
步骤 6:合成完成后:
- 显示成功提示
- 可查看总时长、文件大小
- 可点击「下载」按钮下载视频
- 视频自动保存到配置的存储位置
7.8.10 查看导出历史
步骤 7:在「合成记录」区域查看历史导出:
| 字段 | 说明 |
|---|---|
| 状态标签 | 成功(绿色)/ 失败(红色)/ 处理中(黄色) |
| 集数 | 第X集 |
| 镜头数 | 包含的分镜数量 |
| 时长 | 视频总时长 |
| 时间 | 导出时间 |
| 操作 | 下载 |
8. 常见问题
Q1:AI 配置页面应该配置哪些?
答:至少需要配置以下四项才能完整使用平台功能:
| API 类型 | 用途 | 必填说明 |
|---|---|---|
| text | 剧本分析、场景拆解 | ✅ 推荐配置 |
| image | 生成角色图、场景图 | ✅ 推荐配置 |
| video | 生成视频片段 | ✅ 核心功能 |
| tts | 文字转语音(配音) | ✅ 推荐配置 |
Q2:视频生成显示"处理中"要等多久?
答:视频生成是异步任务,通常需要 2-10 分钟不等。
| 影响耗时的因素 | 说明 |
|---|---|
| AI 厂商队列 | 厂商处理任务多时排队时间长 |
| 视频时长 | 时长越长,生成时间越久 |
| 当前系统负载 | 服务器同时处理的任务数量 |
Q3:MiniMax 和豆包/火山引擎哪个更好?
答:两个厂商各有优势,应根据需求选择。
| 对比项 | MiniMax 海螺 | 豆包/火山引擎 Seedance |
|---|---|---|
| 音画同步 | ❌ 视频无声,需后期配音 | ✅ 原生音画同步 |
| 首尾帧 | ✅ 支持(海螺 02) | ✅ 支持 |
| 主体参考 | ✅ S2V-01 角色一致性 | ❌ 不支持 |
| 时长选择 | 6秒 / 10秒(固定) | 4-12秒(滑块调节) |
| 分辨率 | 512P-1080P | 480P-1080P |
| 计费方式 | 按秒计费 | 按 tokens 计费 |
选择建议:
| 需求场景 | 推荐厂商 |
|---|---|
| 需要配音对口型效果 | 豆包/火山引擎 |
| 需要角色一致性(同一角色多镜头) | MiniMax S2V-01 |
| 需要快速预览(低时长) | 豆包/火山引擎 4s |
| 需要更长视频(10s) | MiniMax 10s |
| 想要最低ä»·格 | MiniMax 海螺 02 + 512P |
Q4:合成时有些分镜显示"无可用视频"?
答:该分镜尚未生成视频或视频生成失败。
检查步骤:
- 在分镜列表中找到该分镜,查看视频列的状态
- 如状态为"失败",点击查看错误原因
- 根据错误原因修复问题(如更新 API Key、调整参数)
- 重新生成视频,等待完成后再次尝试合成
Q5:生成视频失败怎么解决?
答:视频生成失败可能由以下原因导致:
| 错误类型 | 可能原因 | 解决方法 |
|---|---|---|
| API Key 无效 | Key 过期、填写错误 | 前往 AI 配置页面更新 API Key |
| 余额不足 | 账号余额不足 | 前往 AI 厂商平台充值后重试 |
| 参数不支持 | 模型不支持当前参数组合 | 调整参数(如降低分辨率)后重试 |
| 网络超时 | 网络连接不稳定 | 等待后重试,通常为临时性问题 |
Q6:如何导出完成的剧集视频?
答:合成完成后,视频会自动保存到配置的存储位置。
查看导出结果:
- 在媒体工作室 → 合成输出 → 合成记录中查看
- 找到对应的导出记录,点击「下载」按钮
Q7:宫格图有什么用?
答:宫格图是将分镜的画面提示词以 4 宫格或 6 宫格漫画形式可视化展示。
宫格图的用途:
| 用途 | 说明 |
|---|---|
| 快速预览 | 在视频生成前快速查看整体视觉效果 |
| 早期发现 | 在制作早期发现画面描述问题,及时调整 |
| 团队沟通 | 用于内部沟通确认,避免返工 |
Q8:如何选择合适的视频模型?
答:根据您的需求参考以下选择:
| 需求 | 推荐模型 | 原因 |
|---|---|---|
| 最低价格 | 海螺 02 + 512P + 6秒 | ¥0.60 最低价 |
| 最快速度 | 海螺 2.3-Fast | 快速版生成更快 |
| 首尾帧 | 海螺 02 或 豆包 Seedance | 都支持首尾帧 |
| 角色一致性 | S2V-01 | 保持同一角色外观 |
| 音画同步 | 豆包 Seedance 1.5 Pro | 原生音画同步 |
| 对口型 | 豆包 Seedance 1.5 Pro | 支持口型同步 |
附录
A. 页面索引
| 页面 | 路径 | 功能说明 |
|---|---|---|
| 剧集列表 | /dramas |
管理所有短剧项目 |
| 剧集详情 | /drama/:id |
单个剧集的完整制作区 |
| 工作台 | /workbench/:dramaId |
分镜编辑、批量图片/视频管理 |
| 媒体工作室 | /media/:dramaId |
TTS配音、视频生成、合成输出 |
| AI 配置 | /settings/ai |
配置 AI 厂商 API Key |
| 存储设置 | /settings/storage |
配置存储位置 |
| 任务追踪 | /settings/tasks |
查看异步任务进度 |
B. 术语表
| 术语 | 说明 |
|---|---|
| 分镜 | 短剧中的单个镜头,每个分镜对应一个视频片段 |
| Prompt | 画面描述词,用于告诉 AI 生成什么样的画面 |
| TTS | Text-to-Speech,文字转语音 |
| OSS | Object Storage Service,对象存储服务(如阿里云 OSS) |
| 异步任务 | 后台执行的任务,前端提交后不等待完成 |
| 音画同步 | 音频和视频的时间对齐 |
| 宫格图 | 多格漫画形式的画面预览图 |
| 运镜 | 镜头运动方式(推近、拉远、左右移动等) |
| 景别 | 镜头画面的大小范围(全景、中景、近景、特写) |
| 文生视频 | Text-to-Video,仅凭文字描述生成视频 |
| 图生视频 | Image-to-Video,基于图片生成视频 |
| 首尾帧 | 提供视频的起始和结束画面,AI 生成过渡 |
| 主体参考 | 以参考人物为主体生成视频 |
| Token | AI 模型计费单位 |
| 参考图 | 用于视频生成的参考图片 |
C. 快捷键说明
功能开发中,即将上线
D. 视频生成价格参考
以下价格为参考价,实际扣费以各 AI 厂商为准
MiniMax 海螺模型:
| 模型 | 时长 | 512P | 768P | 1080P |
|---|---|---|---|---|
| 海螺 2.3 标准版 | 6秒 | ¥0.60 | ¥2.00 | ¥3.50 |
| 海螺 2.3 标准版 | 10秒 | ¥1.00 | ¥4.00 | ¥4.00 |
| 海螺 2.3-Fast | 6秒 | - | ¥1.35 | ¥2.31 |
| 海螺 2.3-Fast | 10秒 | - | ¥2.25 | ¥2.31 |
| 海螺 02 | 6秒 | ¥0.60 | ¥2.00 | ¥3.50 |
| 海螺 02 | 10秒 | ¥1.00 | ¥4.00 | ¥4.00 |
| S2V-01 | 6秒 | - | ¥2.00(仅720P) | - |
E. 参考图与视频生成图片的区别
| 类型 | 说明 | 生成方式 |
|---|---|---|
| 角色图 | 角色的形象照片 | 在「角色」标签页生成 |
| 场景图 | 场景的背景照片 | 在「场景」标签页生成 |
| 宫格图 | 分镜画面的漫画分格预览 | 在分镜详情中生成 |
| 参考图 | 用于视频生成的综合参考图 | 在工作台「分镜编辑器」中生成,融合角色和场景元素 |
F. AI 配置字段说明
| 字段 | 说明 | 注意事项 |
|---|---|---|
| 厂商 | AI 服务提供商 | 必须与实际使用的厂商一致 |
| API类型 | 配置的用途类型 | 同一厂商可配置多种类型 |
| Base URL | API 接口地址 | 必须与厂商要求一致,否则无法调用 |
| API Key | 访问密钥 | 请妥善保管,不要泄露 |
| 模型名称 | 具体使用的模型 | 必须与 API 类型匹配 |
| 优先级 | 同类型多配置时的调用顺序 | 数字越小越优先,0 为最高优先级 |
| Token单价 | 每 Token 的价格 | 用于计算费用,不影响功能 |
本手册最后更新:2026年5月
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)