臻灵短剧平台 · 用户操作手册

本手册面向普通用户,详细说明平台各项功能的使用方法。
手册中的按钮、输入框等界面元素均以 「」 包裹标注。


目录

  1. 产品概述
  2. 快速入门流程
  3. 剧集管理
  4. AI 配置
  5. 存储设置
  6. 任务追踪
  7. 短剧制作全流程详解
  8. 常见问题
  9. 附录

1. 产品概述

1.1 平台简介

臻灵短剧是一个 AI 短剧自动化生产平台,实现从剧本输入 → AI 分镜 → 角色设计 → TTS 配音 → 视频生成 → 合成导出的全流程覆盖。

用户只需提供剧本文本,平台即可自动完成分镜拆分、角色形象生成、配音合成、视频生成,最终输出完整的短剧成品。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


1.2 功能模块一览

模块 入口位置 说明
剧集 顶部导航第一项 短剧项目总览,创建/管理短剧项目
AI 配置 顶部导航第二项 配置各 AI 厂商的 API Key
存储 顶部导航第三项 配置视频/图片的存储位置
任务追踪 顶部导航第四项 查看后台异步任务的执行状态

1.3 顶部导航栏

平台顶部为全局导航栏,无论处于哪个页面,均可通过顶部导航栏快速切换:

导航项 点击后进入
剧集 剧集列表页面,短剧项目管理总览
AI 配置 AI 厂商 API 配置页面
存储 存储位置设置页面
任务追踪 异步任务进度查看页面

提示:当前所在的导航项通常会高亮显示(如蓝色或加粗)。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


2. 快速入门流程

2.1 首次使用清单

在开始制作短剧前,请按以下顺序完成配置和操作:

□ 步骤 1:配置 AI 厂商 API Key
        └─ 入口:顶部导航 → AI配置

□ 步骤 2:配置存储位置
        └─ 入口:顶部导航 → 存储

□ 步骤 3:创建第一个剧集
        └─ 入口:顶部导航 → 剧集

□ 步骤 4:导入剧本并 AI 拆解
        └─ 入口:进入剧集详情 → 分镜Tab → AI拆解剧本

□ 步骤 5:设计角色
        └─ 入口:进入剧集详情 → 角色Tab

□ 步骤 6:制作分镜
        └─ 入口:进入剧集详情 → 分镜Tab

□ 步骤 7:生成配音
        └─ 入口:进入剧集详情 → 媒体工作室 → 配音tab

□ 步骤 8:生成视频
        └─ 入口:进入剧集详情 → 媒体工作室 → 视频tab

□ 步骤 9:合成导出
        └─ 入口:进入剧集详情 → 媒体工作室 → 合成输出tab

2.2 核心制作流程图

                    【第1步】输入剧本
                         ↓
                    AI 拆解剧本
                    ↓  自动生成场景和分镜
                    ↓
                    【第2步】角色设计
                    ↓  为每个角色设定外观形象
                    ↓
                    【第3步】分镜设计
                    ↓  优化每个镜头的画面描述(提示词)
                    ↓
                    【第4步】TTS 配音
                    ↓  为分镜添加语音台词
                    ↓
                    【第5步】视频生成
                    ↓  AI 生成视频片段
                    ↓
                    【第6步】合成输出
                         ↓
                    将所有视频片段合成为完整剧集

3. 剧集管理

入口:顶部导航 → 剧集


3.1 剧集列表页

3.1.1 页面布局
区域 内容说明
页面标题 显示"剧集"
新建按钮 右上角「新建短剧」按钮
搜索框 支持按剧集名称搜索
剧集卡片区 排列的剧集卡片
分页控件 剧集数量多时进行分页

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

3.1.2 剧集卡片内容
信息项 说明
封面图 剧集的展示封面图
剧集标题 剧集名称
集数 显示总集数
状态标签 草稿 / 制作中 / 已完成
创建时间 显示创建日期
3.1.3 剧集卡片操作
操作 功能
点击卡片 进入剧集详情页
「查看」/「进入」 进入剧集详情页
「编辑」 编辑剧集基本信息
「删除」 删除该剧集(需二次确认)

3.2 创建新剧集

3.2.1 打开新建弹窗

步骤 1:在剧集列表页,点击右上角的 「新建短剧」 按钮。

步骤 2:弹出新建剧集的表单弹窗。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

3.2.2 填写剧集信息
字段 说明 必填 示例
剧集标题 短剧的名称 ✅ 必填 互换人生·假面迷局
封面图片 列表展示用封面图 ❌ 选填 点击上传按钮选择图片
剧集描述 简短的剧情描述 ❌ 选填 一场意外引发的身份互换…
总集数 该剧总共的集数 ✅ 必填(默认1) 10

填写步骤

  • 步骤 1:在「剧集标题」输入框中输入剧集名称

    建议:名称简短有力,建议 4-12 个字

  • 步骤 2(可选):点击封面区域上传图片,或拖拽图片到封面区域

    支持格式:JPG、PNG;建议尺寸:16:9 或 3:4

  • 步骤 3(可选):在「剧集描述」输入框中填写简短描述

  • 步骤 4:在「总集数」输入框中填写总集数(默认值为 1)

    如制作的是单集短剧,保持默认值 1 即可

3.2.3 确认创建

步骤 3:点击弹窗底部的 「创建剧集」 按钮。

步骤 4:创建成功后:

  • 弹窗自动关闭
  • 列表中新增一条剧集记录
  • 自动跳转到剧集详情页

3.3 剧集详情页

3.3.1 进入详情页

在剧集列表页点击任意剧集卡片,即可进入该剧的详情页。

3.3.2 页面布局概览

剧集详情页包含以下功能标签页:

标签页 说明
角色 添加/编辑/删除角色形象
场景 添加/编辑/删除场景背景
分镜 查看/编辑/添加分镜
设置 修改剧集基本信息

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

3.3.3 设置标签页

在「设置」标签页可以修改:

字段 说明
剧集封面 上传/更换封面图
剧集标题 修改剧集名称
描述 修改剧情描述
总集数 修改总集数
状态 草稿 / 制作中 / 已完成

状态说明

  • 草稿:刚开始制作的剧集
  • 制作中:正在制作中
  • 已完成:制作完成的剧集

4. AI 配置

入口:顶部导航 → AI配置


4.1 为什么需要配置 AI

平台使用 AI 厂商来完成以下功能:

AI 功能 用途说明
文本生成(text) 理解剧本内容、拆分场景
图片生成(image) 生成角色图、场景图、分镜参考图
视频生成(video) 将分镜描述转换为视频片段
语音合成(tts) 将文字台词转换为语音

重要提示:首次使用平台前,必须先完成 AI 配置,否则无法使用任何生成功能。


4.2 支持的 AI 厂商

厂商 说明 支持的 API 类型
MiniMax 海螺视频是主力模型 text、image、video、tts
火山引擎(volcengine) 豆包/火山引擎,支持音画同生 video、tts
OpenAI GPT 系列模型 text、image
Google Gemini Gemini 系列模型 text、image
阿里云 阿里云 AI 服务 text、image

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


4.3 AI 配置页面布局

4.3.1 页面组成
区域 说明
页面标题 显示"AI 服务配置"
添加按钮 右上角「添加配置」按钮
类型筛选 Tab 按 API 类型筛选配置:全部 / 文本生成 / 图片生成 / 视频生成 / 语音合成
配置列表 显示所有已添加的 AI 配置
配置卡片 每个配置卡片显示厂商、API类型、模型名称、启用状态

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4.3.2 筛选功能

点击不同的类型筛选 Tab,可以快速查看该类型的所有配置:

筛选Tab 说明
全部 显示所有 AI 配置
文本生成 仅显示 text 类型配置
图片生成 仅显示 image 类型配置
视频生成 仅显示 video 类型配置
语音合成 仅显示 tts 类型配置

提示:每个 Tab 后面会显示该类型的配置数量。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


4.4 添加 AI 配置

4.4.1 打开添加弹窗

步骤 1:在 AI 配置页面,点击右上角的 「添加配置」 按钮。

步骤 2:弹出添加配置的表单弹窗。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4.4.2 填写配置信息
字段 说明 必填 示例/说明
厂商 AI 服务提供商 ✅ 必填 选择厂商
API类型 该配置用于哪种功能 ✅ 必填 选择 API 类型
Base URL API 接口地址 ✅ 必填 各厂商默认值不同
API Key 访问密钥 ✅ 必填 从厂商平台获取
模型名称 具体使用的模型名称 ✅ 必填 如 gpt-4o、speech-02-hd
优先级 同类型多配置时的优先级 ✅ 必填(默认0) 数字越小越优先
Token单价 每 Token 的价格(元/Token) ❌ 选填 用于计算任务费用
4.4.3 厂商说明
厂商 Base URL 默认值 说明
MiniMax https://api.minimaxi.com/v1 海螺视频、TTS 主力厂商
火山引擎 https://ark.cn-beijing.volces.com/api/v3 豆包/火山引擎
OpenAI https://api.openai.com/v1 GPT 系列模型
Google Gemini https://generativelanguage.googleapis.com/v1 Gemini 系列模型
阿里云 需填写 阿里云 AI 服务
4.4.4 API 类型说明
API 类型 用途 常用模型
文本生成(text) 剧本分析、场景拆解 gpt-4o、gpt-3.5-turbo
图片生成(image) 生成角色图、场景图 dall-e-3、stable-diffusion
视频生成(video) 生成视频片段 MiniMax-Hailuo-2.3、doubao-seedance-1-5-pro
语音合成(tts) TTS 配音 speech-02-hd
4.4.5 优先级说明

同一 API 类型可配置多个厂商,优先级数字越小越优先

示例:配置了多个视频生成配置

配置 厂商 API类型 优先级 效果
配置A MiniMax video 0 优先使用
配置B 火山引擎 video 1 配置A不可用时使用
4.4.6 Token 单价说明

Token 单价用于计算任务的实际费用消耗。

提示:如果不填写 Token 单价,将无法准确计算任务费用,但仍可正常使用 AI 功能。

4.4.7 确认添加

步骤 3:填写完毕后,点击 「保存」 按钮。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


4.5 管理已有配置

4.5.1 配置卡片显示内容

每个配置卡片显示:

信息 说明
启用/禁用状态 显示为绿色"启用"或灰色"禁用"标签
厂商名称 如 MiniMax、火山引擎
API类型 如 文本生成、图片生成
模型名称 具体模型名称

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4.5.2 配置操作
操作 功能
启用/禁用切换 点击圆形图标,切换该配置的启用状态
编辑 点击编辑图标,修改该配置的信息
删除 点击删除图标,删除该配置(需二次确认)

提示:禁用的配置不会生效,但不会被删除,可以随时启用。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


4.6 配置示例

4.6.1 MiniMax 文本生成配置
字段 填写内容
厂商 MiniMax
API类型 文本生成
Base URL https://api.minimaxi.com/v1
API Key 从 MiniMax 开放平台获取
模型名称 (可不填或填写如gpt-4o
优先级 0
4.6.2 MiniMax TTS 配置
字段 填写内容
厂商 MiniMax
API类型 语音合成
Base URL https://api.minimaxi.com/v1
API Key 从 MiniMax 开放平台获取
模型名称 speech-02-hd
优先级 0
4.6.3 火山引擎视频生成配置
字段 填写内容
厂商 火山引擎(volcengine)
API类型 视频生成
Base URL https://ark.cn-beijing.volces.com/api/v3
API Key 从火山引擎控制台获取
模型名称 doubao-seedance-1-5-pro-251215
优先级 1

5. 存储设置

入口:顶部导航 → 存储


5.1 存储的作用

平台生成的文件需要存放位置:

文件类型 示例
视频文件 .mp4 格式的视频片段
图片文件 .jpg/.png 格式的角色图、场景图
音频文件 .mp3/.wav 格式的配音音频
字幕文件 .ass 格式的字幕文件

存储位置选项

  • 云存储(OSS):阿里云对象存储,推荐用于生产环境
  • 本地存储:服务器本地磁盘,适合测试/开发环境

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


5.2 配置阿里云 OSS

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

5.2.1 填写 OSS 配置信息
字段 说明 示例
Endpoint OSS 服务地址 oss-cn-chengdu.aliyuncs.com
AccessKey ID 阿里云 AccessKey ID 从阿里云控制台获取
AccessKey Secret 阿里云 AccessKey Secret 从阿里云控制台获取
Bucket 名称 OSS 存储桶名称 my-drama-bucket
自定义域名 (可选)已备案的域名 cdn.example.com
5.2.2 Endpoint 说明

不同地区的 Endpoint 不同,填写时请使用实际创建 Bucket 的地区:

地区 Endpoint 示例
成都 oss-cn-chengdu.aliyuncs.com
北京 oss-cn-beijing.aliyuncs.com
上海 oss-cn-shanghai.aliyuncs.com
深圳 oss-cn-shenzhen.aliyuncs.com
5.2.3 确认保存

点击 「保存」 按钮。

提示:保存后建议测试连接是否正常。


5.3 配置本地存储

5.3.1 选择本地存储模式

如果在存储设置页面看到模式选择,选择 「本地存储」 选项。

5.3.2 设置本地存储路径
字段 说明
存储路径 本地磁盘存放目录,如/data/drama-files/

提示:本地存储适合开发测试环境使用。生产环境建议使用 OSS 云存储。


6. 任务追踪

入口:顶部导航 → 任务追踪


6.1 什么是异步任务

AI 生成操作(如视频生成、配音合成)是异步任务

同步任务 异步任务
点击后立即等待结果 提交后后台执行,前端立即返回
适合耗时短的操作 适合耗时长(如 2-10 分钟)的操作

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


6.2 任务状态说明

状态 标识 含义
等待中 蓝色 任务已提交,等待执行
🔄处理中 黄色 正在执行
已完成 绿色 任务完成,结果可用
失败 红色 任务失败,可查看错误原因

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


6.3 查看任务详情

步骤 1:在任务列表中找到需要查看的任务,点击该行或「查看详情」按钮。

步骤 2:在详情弹窗中查看:

信息 说明
任务类型 视频生成 / 配音合成
关联分镜 所属剧集和分镜编号
提交时间 任务开始时间
完成时间 任务结束时间(完成后显示)
执行耗时 总耗时
状态 当前状态
错误信息 失败时显示的具体错误原因

6.4 任务失败处理

6.4.1 常见错误及解决方法
错误类型 可能原因 解决方法
API Key 无效 Key 过期或填写错误 前往 AI 配置页面更新 API Key
余额不足 账号余额不足 前往 AI 厂商平台充值
参数不支持 模型不支持当前参数组合 调整参数后重试
网络超时 网络连接问题 点击「重试」,通常为临时性问题
任务超时 AI 厂商处理超时 等待一段时间后重试
6.4.2 重试任务

步骤 3:确认问题解决后,点击 「重试」 按钮重新执行任务。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


7. 短剧制作全流程详解


7.1 创建剧集

7.1.1 操作路径
剧集列表页 → 点击「新建短剧」→ 填写信息 → 创建 → 进入剧集详情页
7.1.2 具体操作步骤

步骤 1:在浏览器中打开平台,进入剧集列表页

步骤 2:点击页面右上角的 「新建短剧」 按钮。

步骤 3:在弹出的新建剧集表单中,填写剧集标题(必填)。

建议

  • 名称简短有力,4-12 个字为宜
  • 避免使用特殊字符

步骤 4(可选):点击封面区域,上传封面图片。

封面要求

  • 支持格式:JPG、PNG
  • 建议尺寸:1280×720(16:9)或 750×1000(3:4)

步骤 5(可选):在「剧集描述」中填写简短描述。

步骤 6:在「总集数」输入框中填写总集数(默认值为 1)。

步骤 7:点击 「创建剧集」 按钮。

步骤 8:创建成功后,自动跳转到剧集详情页。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


7.2 角色设计

7.2.1 操作路径
剧集详情页 → 点击「角色」标签 → 添加角色 → 填写信息 → 保存
7.2.2 进入角色管理

步骤 1:在剧集详情页,点击 「角色」 标签。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.2.3 添加新角色

步骤 3:点击 「添加角色」 按钮。

步骤 4:弹出添加角色的表单弹窗。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.2.5 填写角色信息
字段 说明 示例
名称 角色姓名/代号 张伟、李婷
描述 角色背景描述 28岁都市女性,外企高管
外观提示词 用于 AI 生成角色图的描述 可手动填写或 AI 提取
台词风格 角色的说话风格 温柔/霸道/幽默
专属音色 角色使用的 TTS 音色 从音色列表中选择
角色形象图 角色的外观图片 AI 生成或上传
7.2.6 选择专属音色

在「专属音色」下拉菜单中,有 60+ 种音色 可供选择。

音色分类列表

一、标准音色(中文普通话)

音色 ID æ ‡签显示 适用角色 示例场景
male-qn-qingse 🎙️ 青涩青年音色 年轻男性角色 少年、学生、实习生
male-qn-jingying 🎙️ 精英青年音色 职场男性 经理、精英、商务人士
male-qn-badao 🎙️ 霸道青年音色 强势男性 总裁、少爷、霸道男主
male-qn-daxuesheng 🎙️ 青年大学生音色 年轻男性 大学生、校园男主
female-shaonv 🎙️ 少女音色 年轻女性 女主、妹妹、萝莉
female-yujie 🎙️ 御姐音色 成熟女性 御姐、女上司、女王
female-chengshu 🎙️ 成熟女性音色 成年女性 母亲、姐姐、熟女
female-tianmei 🎙️ 甜美女性音色 可爱型女性 甜美女主、邻家女孩

二、Beta 精品音色

音色 ID 标签显示 适用角色 说明
male-qn-qingse-jingpin ⭐ 青涩青年音色-beta 青涩感年轻男性 比标准版更细腻
male-qn-jingying-jingpin ⭐ 精英青年音色-beta 专业精英男性 更专业的精英感
male-qn-badao-jingpin ⭐ 霸道青年音色-beta 强势霸道男性 更强势的霸道感
male-qn-daxuesheng-jingpin ⭐ 青年大学生音色-beta 校园男生 更强的校园感
female-shaonv-jingpin ⭐ 少女音色-beta 清纯少女 更细腻的少女感
female-yujie-jingpin ⭐ 御姐音色-beta 成熟御姐 更成熟的御姐感
female-chengshu-jingpin ⭐ 成熟女性音色-beta 沉稳女性 更沉稳的女性声音
female-tianmei-jingpin ⭐ 甜美女性音色-beta 甜美女孩 更甜美的声音

三、特色角色音色

音色 ID 标签显示 适用角色 说明
clever_boy 🧒 聪明男童 聪明的小男孩 智慧型儿童角色
cute_boy 🧒 可爱男童 可爱的小男孩 萌系儿童角色
lovely_girl 👧 萌萌女童 可爱的小女孩 萌系小女孩
cartoon_pig 🐷 卡通猪小琪 卡通角色 动画/游戏角色
bingjiao_didi 😈 病娇弟弟 病娇型男性 偏执、病娇弟弟
junlang_nanyou 👦 俊朗男友 帅气的男朋友 偶像剧男主
chunzhen_xuedi 🎒 纯真学弟 天真的学弟 校园单纯男生
lengdan_xiongzhang 🧊 冷淡学长 高冷学长 冰山系学长
badao_shaoye 🎩 霸道少爷 有钱少爷 富二代、少爷
tianxin_xiaoling 🍬 甜心小玲 甜美女孩子 甜心系女孩
qiaopi_mengmei 😜 俏皮萌妹 俏皮女孩 活泼俏皮女主
wumei_yujie 💋 妩媚御姐 妩媚的御姐 性感成熟的御姐
diadia_xuemei 🎀 嗲嗲学妹 撒娇的学妹 黏人撒娇型
danya_xuejie 📚 淡雅学姐 文艺学姐 气质文艺学姐

四、专业/特色音色

音色 ID 标签显示 适用场景 说明
Chinese (Mandarin)_Reliable_Executive 💼 沉稳高管 成熟男性管理者 CEO、领导
Chinese (Mandarin)_News_Anchor 📺 新闻女声 新闻播报 新闻旁白
Chinese (Mandarin)_Mature_Woman 💅 傲娇御姐 傲娇女性 傲娇型女主
Chinese (Mandarin)_Unrestrained_Young_Man 🏍️ 不羁青年 叛逆青年 摩托车手、摇滚青年
Arrogant_Miss 😤 嚣张小姐 嚣张大小姐 富家女
Robot_Armor 🤖 机械战甲 机器人 科幻角色
Chinese (Mandarin)_Kind-hearted_Antie 👵 热心大婶 中老年女性 邻居大妈
Chinese (Mandarin)_HK_Flight_Attendant ✈️ 港普空姐 港式普通话 空姐角色
Chinese (Mandarin)_Humorous_Elder 😂 搞笑大爷 搞笑老年男性 喜剧角色
Chinese (Mandarin)_Gentleman 🎩 温润男声 温柔男性 暖男
Chinese (Mandarin)_Warm_Bestie 👭 温暖闺蜜 女性好朋友 闺蜜
Chinese (Mandarin)_Male_Announcer 🎤 播报男声 广播 体育解说
Chinese (Mandarin)_Sweet_Lady 🌸 甜美女声 甜美女性 甜心女主
Chinese (Mandarin)_Southern_Young_Man 🌾 南方小哥 南方口音男性 南方男性角色
Chinese (Mandarin)_Wise_Women 📖 阅历姐姐 有故事的姐姐 大姐姐
Chinese (Mandarin)_Gentle_Youth 🍃 温润青年 温柔的青年 暖心男主
Chinese (Mandarin)_Warm_Girl ☀️ 温暖少女 温暖的女孩 治愈系女主
Chinese (Mandarin)_Kind-hearted_Elder 👵 花甲奶奶 老年女性 奶奶角色
Chinese (Mandarin)_Cute_Spirit 🦄 憨憨萌兽 可爱萌兽音 卡通动物
Chinese (Mandarin)_Radio_Host 📻 电台男主播 电台主持 广播主持
Chinese (Mandarin)_Lyrical_Voice 🎵 抒情男声 抒情/唱歌 歌手角色
Chinese (Mandarin)_Straightforward_Boy 🗣️ 率真弟弟 耿直弟弟 率真男孩
Chinese (Mandarin)_Sincere_Adult 🙏 真诚青年 真诚的男性 真诚男主
Chinese (Mandarin)_Gentle_Senior 🌙 温柔学姐 温柔的学姐 大学学姐
Chinese (Mandarin)_Stubborn_Friend 😤 嘴硬竹马 傲娇青梅竹马 竹马
Chinese (Mandarin)_Crisp_Girl ✨ 清脆少女 声音清脆的女孩 清纯少女
Chinese (Mandarin)_Pure-hearted_Boy 💙 清澈邻家弟弟 清澈男孩声音 邻家弟弟
Chinese (Mandarin)_Soft_Girl 🌸 柔和少女 柔和女性声音 柔和女主

五、中文(粤语)

音色 ID 标签显示 适用场景 说明
Cantonese_ProfessionalHost(F) 🇭🇰 粤语-专业女主持 粤语女主持 香港节目
Cantonese_GentleLady 🇭🇰 粤语-温柔女声 温柔粤语女性 温柔女性
Cantonese_ProfessionalHost(M) 🇭🇰 粤语-专业男主持 粤语男主持 香港节目
Cantonese_PlayfulMan 🇭🇰 粤语-活泼男声 活泼粤语男性 活泼男性
Cantonese_CuteGirl 🇭🇰 粤语-可爱女孩 可爱粤语女孩 小女孩
Cantonese_KindWoman 🇭🇰 粤语-善良女声 善良粤语女性 善良女性

音色选择建议

  • 优先选择与角色性格匹配的音色
  • Beta 精品音色比标准音色æ›´细腻,但可能消耗更多资源
  • 特定角色音色适合特定人设的角色
  • 粤语音色适合需要地方特色的角色

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.2.7 试听音色
  1. 选择一个音色
  2. 点击 「试听」 按钮
  3. 等待试听音频生成(约 10-30 秒)
  4. 在预览区域播放试听

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.2.8 生成/上传角色形象图

方式一:AI 自动生成

  1. 填写「外观提示词」(描述角色外观)
  2. 点击 「AI生成」 按钮
  3. 等待生成完成(通常 10-30 秒)

方式二:从素材库选择

  1. 点击 「从存储选择」 按钮
  2. 在弹出窗口中选择已上传的图片
  3. 确认选择

方式三:上传本地图片

  1. 点击 「上传图片」 按钮
  2. 从本地选择图片文件
  3. 图片自动填入

方式四:提取已有图片的外观描述

如果已有角色图片,可以:

  1. 先上传角色图片
  2. 点击 「提取」 按钮(位于图片右侧)
  3. 系统自动分析图片并填入「外观提示词」
7.2.9 保存角色

步骤 5:确认角色信息填写完毕后,点击 「创建」 按钮。


7.3 场景管理

7.3.1 操作路径
剧集详情页 → 点击「场景」标签 → 添加场景 → 填写信息 → 保存
7.3.2 进入场景管理

步骤 1:在剧集详情页,点击 「场景」 标签。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.3.3 添加新场景

步骤 3:点击 「添加场景」 按钮。

弹出添加场景的表单弹窗。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.3.4 填写场景信息
字段 说明 示例
场景名称 场景名称/代号 温馨客厅、深夜天台
地点 场景所在地点 市中心、郊外、学校
时间 场景发生的时间段 白天、夜晚、清晨等
描述 环境详细描述 现代简约风格,落地窗外城市夜景
AI生成提示词 用于 AI 生成场景图 可手动填写或留空让 AI 自动生成
场景图片 场景的参考图 AI 生成或上传
7.3.5 时间段选项
时间段 说明 适用场景示例
白天 日间场景,阳光充足 客厅、办公室、街道
夜晚 夜间场景,灯光照明 夜总会、天台、街道
清晨 早晨场景,晨曦微露 公园、湖边、卧室
黄昏 傍晚场景,夕阳西下 天台、海边、街道
黎明 天刚亮的时候 街道、公园、乡村
午夜 深夜十二点左右 办公室、医院、街道

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.3.6 生成/上传场景图

方式一:AI 自动生成

  1. 填写「AI生成提示词」(描述场景环境)
  2. 点击 「AI生成」 按钮
  3. 等待生成完成

方式二:从素材库选择

  1. 点击 「从存储选择」 按钮
  2. 选择已上传的图片

方式三:上传本地图片

  1. 点击 「上传图片」 按钮
7.3.7 保存场景

步骤 5:确认信息填写完毕后,点击 「创建」 按钮。


7.4 分镜设计

7.4.1 操作路径
剧集详情页 → 点击「分镜」标签 → AI拆解剧本 或 手动添加分镜
7.4.2 进入分镜列表

步骤 1:在剧集详情页,点击 「分镜」 标签。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.4.3 方式一:AI 自动拆解剧本

如果已有完整剧本,可使用 AI 自动拆解功能。

步骤 3:在分镜列表上方文本框中粘贴完整剧本内容

剧本格式建议

  • 纯文本格式
  • 包含场景描述和角色台词
  • 建议每段对话前标注角色名

示例剧本格式

【第一幕 客厅】
张伟:(走进客厅)今天真是太累了。
李婷:(递上咖啡)辛苦了,喝点咖啡吧。

【第二幕 办公室】
张伟:(坐在办公桌前)这个项目必须尽快完成。
同事:没问题,我来帮你。

步骤 4:点击 「AI拆解分镜」 按钮。

步骤 5:AI 分析剧本并自动生成分镜,等待生成完成(通常 30-60 秒)。

步骤 6:拆解完成后,分镜列表中自动填充所有分镜。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.4.4 方式二:手动添加/编辑分镜

步骤 3:在分镜列表中,点击要编辑的分镜卡片。

步骤 4:弹出分镜编辑表单。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.4.5 填写分镜信息
字段 说明 示例
镜头类型 镜头景别 全景、中景、近景、特写
运镜方式 镜头运动方式 推镜头/拉镜头/固定
动作描述 该镜头的动作和画面 角色缓缓转身,背景是夕阳下的海滩
台词 角色的对白 张伟:今天天气真好!

镜头类型详解

镜头类型 说明 适用场景
全景(wide) 展示完整场景和所有人物 开场、群戏、交代环境
中景(medium) 展示人物膝盖以上 对话、动作场景
近景(close-up) 展示人物胸部以上 对话特写、情感表达
特写(extreme-close-up) 聚焦人物脸部或物体 强调表情、细节

运镜方式说明

运镜方式 说明
推镜头 镜头向前推进,画面放大
拉镜头 镜头向后拉远,画面缩小
固定 镜头固定不动
左移/右移 镜头左右平移
上升/下降 镜头上下移动
摇镜头 镜头左右摇摆
7.4.6 关联角色和场景

在分镜编辑弹窗中:

关联角色

  • 从角色下拉菜单中选择(支持多选)
  • 已设置角色图片的角色会显示 📸 图标
  • 选择后自动带出角色图片

关联场景

  • 从场景下拉菜单中选择
  • 已设置场景图片的场景会显示 📸 图标
  • 选择后自动带出场景图片

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.4.7 保存分镜

步骤 5:确认信息填写完毕后,点击 「保存」 按钮。


7.5 工作台(批量参考图管理)

入口:剧集详情页 → 进入工作台

7.5.1 工作台页面布局

工作台包含以下标签页:

标签页 说明
分镜编辑器 分镜列表、参考图管理、生成视频入口
角色图 批量管理角色图片生成
场景图 批量管理场景图片生成
视频生成 快速生成视频

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.5.2 分镜编辑器标签页
7.5.2.1 批量参考图管理面板

在分镜列表上方有参考图批量管理面板,显示:

信息 说明
已生成数量 已生成参考图的分镜数 / 总分镜数
模型选择 选择参考图生成的模型

参考图模型选项

模型 说明
MiniMax Image-01 MiniMax 图片生成模型
Seedream 5.0(多图融合) 豆包多图融合模型

批量生成按钮

  • 点击 「全部生成」 按钮,可以批量为未生成参考图的分镜生成图片
  • 显示"X个未生成"表示还有多少分镜需要生成

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.5.2.2 分镜卡片内容

每个分镜卡片显示:

信息 说明
镜号 分镜序号
镜头类型标签 全景/中景/近景/特写
动作描述 该镜头的动作和画面描述
台词 角色对白(如有)
角色标签 关联的角色名称
运镜方式标签 如 推镜头/拉镜头
图片标记 场景图/角色图/宫格图/参考图 标记
7.5.2.3 分镜卡片操作
操作 功能
点击卡片 打开分镜编辑弹窗
生成参考图 为该分镜生成参考图
Ctrl+点击生成参考图 强制重新生成(覆盖已有图片)
预览 预览已生成的参考图
重绘 重新生成参考图
生成视频 跳转到媒体工作室的视频生成页面
7.5.2.4 参考图状态
状态 显示 说明
已生成 绿色 ✓ 图标 该分镜已有参考图
未生成 灰色 ○ 图标 该分镜尚未生成参考图
7.5.3 角色图标签页
7.5.3.1 角色卡片

每个角色卡片显示:

信息 说明
角色图片 角色形象图(如无则显示占位图标)
角色名称 角色姓名
生成状态 AI 生成中的加载动画
7.5.3.2 角色图操作
操作 功能
AI生成角色图 为该角色生成形象图
点击生成中 等待生成完成(按钮禁用)

前提条件:需要先在「角色」标签页添加角色并设置外观提示词。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.5.4 场景图标签页
7.5.4.1 场景卡片

每个场景卡片显示:

信息 说明
场景图片 场景背景图(如无则显示占位图标)
场景名称 场景名称
生成状态 AI 生成中的加载动画
7.5.4.2 场景图操作
操作 功能
AI生成场景图 为该场景生成背景图

前提条件:需要先在「场景」标签页添加场景并设置 AI 生成提示词。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.5.5 视频生成标签页
7.5.5.1 快速视频生成

步骤 1:在「参考图片 URL」输入框中粘贴图片地址。

图片来源

  • 分镜参考图的 URL
  • 宫格图的 URL
  • 角色图的 URL
  • 场景图的 URL

步骤 2:在「视频模型」下拉菜单中选择 AI 模型。

模型 说明
MiniMax 海螺 2.3 MiniMax 视频生成模型
MiniMax Video-01 MiniMax 视频模型 01

步骤 3:点击 「生成视频」 按钮。

7.5.5.2 视频记录

生成记录列表显示:

信息 说明
视频预览 视频封面图或播放按钮
模型名称 使用的 AI 模型
状态标签 已完成 / 处理中 / 失败
集数 所属集数
时长 视频时长

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

视频预览操作

  • 点击视频区域:播放/暂停视频
  • 视频播放时显示进度条和播放控件

7.6 TTS 配音

入口:媒体工作室 → 配音 tab

7.6.1 进入配音页面

步骤 1:在剧集详情页,点击 「媒体工作室」

步骤 2:在媒体工作室中,默认显示「配音」标签页。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.6.2 配音页面布局
区域 说明
关联分镜选择 下拉菜单选择要配音的分镜
关联角色选择 下拉菜单选择角色(可选)
音色选择 下拉菜单选择音色
试听按钮 试听当前选择的音色
配音文本 多行文本框输入台词
生成按钮 提交配音生成任务
配音记录列表 显示已生成的配音记录
7.6.3 选择目标分镜

步骤 3:在「关联分镜」下拉菜单中选择要配音的分镜。

自动填入功能

  • 选择分镜后,该分镜的台词自动填入文本框
  • 该分镜关联的角色自动带出
  • 根据角色信息自动选择匹配的音色(如果有设置)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.6.4 选择音色

步骤 4:从「选择音色」下拉菜单中选择合适的角色音色。

音色列表:共 60+ 种音色,详见「7.2.6 选择专属音色」章节。

7.6.5 试听音色
  1. 选择一个音色
  2. 点击 「试听 →」 链接
  3. 等待试听音频生成(约 10-30 秒)
  4. 在预览区域播放试听
7.6.6 填写/修改配音文本

步骤 5:在「配音文本」文本框中确认或修改台词内容。

提示

  • 如果选择了分镜,台词会自动填入
  • 可以手动修改台词内容
  • 建议每段配音控制在 50 字以内,效果更好
7.6.7 生成配音

步骤 6:确认信息无误后,点击 「生成配音」 按钮。

7.6.8 配音记录列表
说明
播放按钮 点击可试听配音(紫色播放图标)
台词预览 显示台词内容(前50字)
分镜编号 关联的分镜号
音色信息 使用的音色和提供商
时长 配音音频的时长(秒)
状态 已完成 / 处理中 / 失败
操作 删除该配音记录

7.7 视频生成

入口:媒体工作室 → 视频生成 tab

7.7.1 进入视频生成页面

步骤 1:在媒体工作室中,点击 「视频生成」 标签。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.7.2 视频生成页面布局
区域 说明
厂商选择 Radio 单选按钮选择 AI 厂商
模型选择 下拉菜单选择具体的 AI 模型
生成模式 Radio 单选按钮选择生成模式
关联分镜 下拉菜单选择分镜(自动填入数据)
画面描述 多行文本框输入视频描述
参考图片 图生视频/首尾帧/主体参考模式的图片上传
时长选择 6秒/10秒 或 4-12秒滑块
分辨率选择 Radio 单选按钮选择画质
运镜指令 可多选的标签,选择镜头运动方式
预估费用 显示本次生成的成本
生成按钮 提交视频生成任务
7.7.3 选择 AI 厂商

步骤 3:在「选择厂商」中选择 AI 服务商。

厂商 说明
MiniMax 海螺视频生成,支持文生视频、图生视频
豆包/火山引擎 音画同生,支持对口型效果

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.7.4 选择模型

步骤 4:在「选择模型」下拉菜单中选择具体的 AI 模型。

7.7.4.1 MiniMax 模型选项
模型 支持模式 支持分辨率 支持时长 价格参考
海螺 2.3(标准版) 文生视频、图生成视频 768P、1080P 6秒 / 10秒 6s-768P: ¥2.00
6s-1080P: ¥3.50
10s: ¥4.00
海螺 2.3-Fast(快速版) 仅图生视频 768P、1080P 6秒 / 10秒 6s-768P: ¥1.35
6s-1080P: ¥2.31
海螺 02(多模式版) 文生视频、图生视频、首尾帧 512P、768P、1080P 6秒 / 10秒 6s-512P: ¥0.60(最低价)
S2V-01(主体参考) 仅主体参考 仅 720P 仅 6秒 ¥2.00(固定)
7.7.4.2 豆包/火山引擎模型选项
模型 支持模式 支持分辨率 支持时长 特点
Seedance 1.5 Pro(音画同生) 图生视频、首尾帧 480P、720P、1080P 4-12秒(滑块调节) 音画同步、支持对口型

豆包 Seedance 1.5 Pro 特别说明

  • 豆包模型支持音画同生(视频和音频同时生成),这是与 MiniMax 的核心区别
  • 生成的视频自带原生音轨,无需后续配音合成
  • 支持多语言及方言口型同步(普通话、陕西话、四川话、英语等)
7.7.4.3 豆包 Seedance 1.5 Pro 详解

豆包 Seedance 1.5 Pro(模型 ID:doubao-seedance-1-5-pro-251215)是火山引擎提供的专业级视频生成模型,核心特点是音画同生——音频和视频在同一次生成任务中同步产生,确保唇形与语音完美匹配。


支持的任务类型
任务类型 说明 适用场景
图生音画 基于图片 + 语音描述生成带声音的视频 有角色图/场景图时,生成人物说话的视频
图生视频 基于图片 + 文字描述生成无声视频 需要展示画面动作,但不需要角色配音
文生音画 仅凭文字描述生成带声音的视频 没有参考图片时,通过文字描述生成说话视频
文生视频 仅凭文字描述生成无声视频 没有参考图片时,通过文字描述生成纯画面视频

实际可用:当前平台界面主要开放「图生视频」和「首尾帧」模式。「图生音画」和「文生音画」需要通过剧情流等高级功能实现。


分辨率与时长参数
参数 可选值 说明
分辨率 480P(标清) 最低成本,适合快速预览
720P(高清) 中等成本,推荐日常使用
1080P(全高清) 最高成本,适合正式输出
时长 4秒 / 6秒 / 8秒 / 10秒 / 12秒(滑块调节) 时长越长费用越高

选择建议

  • 快速预览:480P + 4秒 = 最低成本,适合在正式制作前查看效果
  • 日常制作:720P + 6-8秒 = 推荐配置,性价比最高
  • 正式输出:1080P + 10-12秒 = 最高质量,适合最终交付

价格说明

豆包 Seedance 按 Tokens(Token) 数量计费,而非按秒计费:

视频类型 价格 说明
有声视频 16元 / 百万Tokens 包含音轨的视频(音画同生)
无声视频 8元 / 百万Tokens 纯画面视频(无音频轨道)
批量推理 更低折扣价格 适合大规模生产任务

与 MiniMax 的区别

  • MiniMax 按「秒」计费,价格固定
  • 豆包按「Tokens」计费,实际费用取决于提示词复杂度(提示词越长,Tokens 越多)
  • 批量推理可获得更低单价,适合专业制作团队

多语言与方言支持

豆包 Seedance 1.5 Pro 支持多语言唇形同步,可根据台词自动匹配口型:

语言/方言 说明 适用场景
普通话 标准中文 大部分国内短剧
陕西话 陕西方言 有地域特色的剧情
四川话 四川方言 西南地区风格短剧
英语 英文对白 国际化内容、出海场景
日语 日语对白 动漫风格内容
韩语 韩语对白 韩剧风格内容
粤语 粤语 港风内容

口型同步原理:系统会根据音频中的语言自动调整口型,使其与语音匹配,呈现自然的口型效果。


画面描述(Prompt)写作技巧

豆包 Seedance 的画面质量很大程度上取决于 Prompt(画面描述)的质量。以下是详细技巧:

####### Prompt 基本结构

一个完整的 Prompt 应包含以下要素:

[场景环境] + [人物外貌] + [人物动作] + [镜头运动] + [氛围光线] + [声音描述]
各要素详细说明

1. 场景环境(必填)

描述故事发生的地点和背景:

示例 说明
现代都市办公室,落地窗外是城市夜景 具体地点 + 环境细节
老式茶馆内,木质桌椅,墙上挂着书法 传统风格 + 陈设
海边悬崖,远处有灯塔,浪花拍打礁石 自然景观 + 动态元素

2. 人物外貌(必填)

描述画面中的人物外观特征:

示例 说明
女性,30岁左右,黑色长发,职业套装 基本特征
男性,40岁出头,短发,灰色西装,深色皮鞋 更详细的穿着
年轻女孩,20岁,淡妆,红色连衣裙,马尾辫 详细外貌 + 服装

3. 人物动作(必填)

描述人物在画面中的动作和表情:

示例 说明
女子缓缓站起身,神情惊讶,眉头微皱 动作 + 表情
男子靠在窗边,双手交叉胸前,目光看向远方 姿态 + 视线方向
两人对视片刻,女性轻轻点头,嘴角露出微笑 互动动作

4. 镜头运动(选填)

描述镜头如何移动(运镜指令):

示例 说明
镜头缓慢向前推进,聚焦于人物面部表情变化 推近
镜头缓慢拉远,展示整个场景的空间感 拉远
镜头轻微右摇,视线跟随人物移动 平移

5. 氛围光线(选填)

描述画面的光线和氛围:

示例 说明
黄昏暖色调,夕阳从窗户斜照进来 时间 + 光线方向
冷色调月光,房间内只有台灯的暖光 月光 + 点光源
霓虹灯光闪烁,营造夜晚都市氛围 特殊灯光效果

6. 声音描述(重要)

对于「有声视频」,Prompt 中应包含声音描述,帮助模型理解音频特征:

声音类型 示例
人声描述 女性声音,温柔但坚定,语速适中,略带情感起伏
语气描述 带有惊讶的语气,语速稍快,句尾语调上扬
环境音 伴随咖啡厅背景人声,隐约可闻钢琴轻音乐
海声 海浪拍打礁石的声音,海风声,海鸥鸣叫
光声 打字机键盘敲击声,电话铃声,纸张翻动声
脚步声 高跟鞋敲击地板的清脆声,脚步由远及近

重要:声音描述帮助模型理解音频内容,从而生成更匹配的口型。如果不描述声音特征,生成的口型可能与实际音频不匹配。

####### Prompt 完整示例

示例 1:有声视频(女性角色说话)

现代客厅场景,暖黄色灯光,落地窗外城市夜景。
女性,30岁左右,黑色长发,身穿米色针织衫,坐在沙发上。
她微微侧身,目光看向镜头方向,嘴唇轻轻张开。
镜头缓慢推近,聚焦于面部表情。
背景隐约有钢琴轻音乐。
女性声音,温柔但略带忧郁,语速缓慢。
海浪拍打岸边的声音。

示例 2:无声视频(场景展示)

古代客栈大厅,木质横梁,红灯笼悬挂在两侧。
一位侠客站在柜台前,身穿深色侠客服饰,腰佩长剑。
他右手握着酒杯,目光警觉地扫视周围。
镜头缓慢拉远,展示客栈全貌。
烛光摇曳,营造神秘氛围。

示例 3:首尾帧过渡(两人对话)

【首帧】咖啡厅角落,女性坐在靠窗位置,阳光从窗户斜照在她的侧脸。
【尾帧】女性站起身,面带微笑,双手接过对面男性递来的文件。
过渡:女性从坐姿缓慢站起,手部动作自然衔接。
镜头固定机位,焦点从女性侧脸切换到双手。

参数设置建议
场景 推荐配置 原因
快速预览 / 测试 480P + 4秒 最低成本,快速验证效果
日常短视频制作 720P + 6-8秒 性价比最高,质量足够日常使用
高质量正式输出 1080P + 10-12秒 最高质量,适合最终交付
角色对话场景 720P + 6秒 + 包含声音描述的 Prompt 口型匹配效果最佳
场景转换/过渡镜头 720P + 4-6秒(短时长) 过渡镜头不需要太长
动作幅度大的场景 1080P + 10-12秒 + 详细动作描述 长时长确保完整动作展示,高分辨率捕捉细节

与 MiniMax 的选择建议
需求场景 推荐方案
需要配音对口型 豆包 Seedance + 图生音画 + 声音描述
需要最低成本 MiniMax 海螺 02 + 512P + 6秒 = ¥0.60
需要角色一致性(多镜头同角色) MiniMax S2V-01(主体参考模式)
需要快速预览 豆包 480P + 4秒 或 MiniMax 海螺 2.3-Fast
需要更长视频(10秒以上) MiniMax(豆包最长12秒,但价格较高)
需要多语言口型 豆包 Seedance(支持方言和外语口型同步)
需要复杂场景过渡 豆包 Seedance + 首尾帧模式

综合建议:如果预算充足且需要对口型效果,选择豆包 Seedance;如果追求性价比且已经有配音流程,选择 MiniMax。

模型选择建议

  • 想要最低价格:选海螺 02 + 512P + 6秒 = ¥0.60
  • 想要最快速度:选海螺 2.3-Fast(快速版)
  • 想要首尾帧:选海螺 02(多模式版)或豆包 Seedance
  • 想要角色一致性:选 S2V-01(主体参考)
  • 想要音画同步:选豆包 Seedance 1.5 Pro
  • 想要对口型效果:选豆包 Seedance 1.5 Pro
7.7.5 选择生成模式

步骤 5:在「生成模式」中选择视频生成方式。

模式 说明 适用场景
📝 文生视频 仅凭文字描述直接生成视频 无参考图时使用
🖼️ 图生视频 基于图片+文字描述生成视频 有角色图/场景图时使用
🎬 首尾帧视频 提供首帧和尾帧图片,AI 生成过渡动画 需要特定起止画面
👤 主体参考 基于参考人物生成视频(S2V-01) 保持角色外观一致性

模式对应关系

  • 海螺 2.3 标准版:支持文生视频、图生视频
  • 海螺 2.3-Fast:仅支持图生视频
  • 海螺 02:支持文生视频、图生视频、首尾帧
  • S2V-01:仅支持主体参考
  • 豆包 Seedance:支持图生视频、首尾帧
7.7.6 选择关联分镜

步骤 6:在「关联分镜」下拉菜单中选择要生成视频的分镜。

自动填入功能
选择分镜后,系统自动填入:

  • 画面描述(Prompt):自动组合角色、场景、动作等信息
  • 参考图片:按优先级自动选择(参考图 > 宫格图 > 角色图 > 场景图)
  • 推荐视频时长:根据该分镜的配音时长自动设置
7.7.7 填写/确认画面描述

步骤 7:确认或修改画面描述(Prompt)。

画面描述建议
应包含:场景环境、人物动作、镜头运动、氛围光线等

示例
“温馨客厅场景,清晨阳光从落地窗洒入,一家人整齐坐在沙发上。镜头缓慢推近女主人公面部特写。背景音乐前奏响起,营造温馨期待氛围。”

7.7.8 上传参考图片

图生视频模式

  • 点击 「从素材库选择参考图片」
  • 在弹出窗口中选择角色图或场景图

首尾帧模式

  • 「首帧图片」:选择起始画面
  • 「尾帧图片」:选择结束画面

主体参考模式

  • 「参考人物图片」:选择角色形象图(用于保持角色一致性)
7.7.9 设置视频时长

步骤 8:设置视频时长。

厂商 时长选项
MiniMax 6 秒 / 10 秒(单选按钮)
豆包/火山引擎 4-12 ç§’(滑块调节)

时长选æ‹©建议

  • æ ¹据配音时长选择匹配的时长
  • 系统会根据配音自动推荐合适的时长
  • 更长的视频消耗更多费用
7.7.10 设置视频分辨率

步骤 9:在「视频分辨率」中选择画质等级。

分辨率 说明 价格影响
480P 标清 较低(豆包专有)
512P 准高清 最低(海螺 02 独有)
720P 高清 中等
768P 超清 标准
1080P 全高清 最高

分辨率限制

  • 10 秒视频不支持 1080P(海螺模型限制)
  • 首尾帧模式不支持 512P
  • S2V-01 仅支持 720P
7.7.11 设置运镜指令

步骤 10(可选):在「运镜指令」中选择镜头运动方式。

运镜指令 效果说明
推近 镜头向前推进,画面放大
拉远 镜头向后拉远,画面缩小
左移 镜头向左平移
右移 镜头向右平移
上升 镜头向上移动
下降 镜头向下移动
旋转 镜头旋转
跟随 镜头跟随主体

提示

  • 可以多选运镜指令
  • 选中的指令会自动添加到提示词前面
  • 运镜效果会增加生成时间
7.7.12 查看预估费用

步骤 11:确认参数后,查看「预估费用」显示的本次生成成本。

费用仅供参考,以实际扣费为准。

7.7.13 提交生成

步骤 12:确认所有参数设置无误后,点击 「生成视频」 按钮。


7.8 合成输出

入口:媒体工作室 → 合成输出 tab

7.8.1 进入合成输出页面

步骤 1:在媒体工作室中,点击 「合成输出」 标签。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

7.8.2 合成输出页面布局
区域 说明
FFmpeg 状态 显示 FFmpeg 是否可用(不可用时合成按钮禁用)
集数选择 输入框选择要合成的集数
开始合成按钮 提交合成任务
音画对齐详情 合成后显示每个镜头的处理策略
合成记录列表 显示历史合成记录
7.8.3 选择合成集数

步骤 2:在「集数」输入框中选择要合成的集数(1-100)。

7.8.4 确认分镜状态

步骤 3:系统显示该集所有分镜的视频状态。

状态 说明
✅ 已完成 视频已生成完成
⏳ 处理中 视频正在生成中
❌ 失败 视频生成失败

前置要求:至少需要有 1 个状态为「已完成」的视频才能开始合成

7.8.5 音画处理规则

合成时会自动处理音频,规则如下:

视频来源 音频处理方式
MiniMax 生成(无声) 自动混入对应分镜的 TTS 配音
豆包/火山引擎生成(有声音) 保留原视频音画同步音频,不混入 TTS

重要说明

  • 豆包/火山引擎的 Seedance 模型生成的是原生音画同步视频
  • 合成时直接使用视频自带的音频,不再混入 TTS 配音
  • 这是为了确保豆包视频的音画同步效果
7.8.6 字幕叠加说明

合成时系统会根据分镜的台词自动烧录 ASS 字幕到视频中。


7.8.7 开始合成

步骤 4:确认一切就绪后,点击 「开始合成第X集」 按钮。

7.8.8 查看合成进度

步骤 5:合成开始后,显示合成进度和音画对齐详情。

合成进度页面显示

共 6 个镜头 · 总时长 26.3s

#1  🔵 冻结延展  视频6.0s + 配音7.2s  →  输出7.2s  [台词...]
#2  🟢 补静音    视频6.0s + 配音3.1s  →  输出6.0s  [台词...]
#3  ⚪ 纯画面    视频6.0s(无配音)    →  输出6.0s

策略图标说明

图标 策略名称 含义
直接混流 配音和视频时长相近,直接拼接
🔵 冻结延展 配音比视频长,视频末帧冻结延展匹配音频
🟢 补静音 视频比配音长,音频结束后补静音
纯画面 无配音,保留视频原声(豆包视频)或纯画面
🔴 降级(原始) 合成失败,使用原始视频
🟡 降级(简单) 简单拼接模式

7.8.9 合成完成

步骤 6:合成完成后:

  • 显示成功提示
  • 可查看总时长、文件大小
  • 可点击「下载」按钮下载视频
  • 视频自动保存到配置的存储位置

7.8.10 查看导出历史

步骤 7:在「合成记录」区域查看历史导出:

字段 说明
状态标签 成功(绿色)/ 失败(红色)/ 处理中(黄色)
集数 第X集
镜头数 包含的分镜数量
时长 视频总时长
时间 导出时间
操作 下载

8. 常见问题

Q1:AI 配置页面应该配置哪些?

:至少需要配置以下四项才能完整使用平台功能:

API 类型 用途 必填说明
text 剧本分析、场景拆解 ✅ 推荐配置
image 生成角色图、场景图 ✅ 推荐配置
video 生成视频片段 ✅ 核心功能
tts 文字转语音(配音) ✅ 推荐配置

Q2:视频生成显示"处理中"要等多久?

:视频生成是异步任务,通常需要 2-10 分钟不等。

影响耗时的因素 说明
AI 厂商队列 厂商处理任务多时排队时间长
视频时长 时长越长,生成时间越久
当前系统负载 服务器同时处理的任务数量

Q3:MiniMax 和豆包/火山引擎哪个更好?

:两个厂商各有优势,应根据需求选择。

对比项 MiniMax 海螺 豆包/火山引擎 Seedance
音画同步 ❌ 视频无声,需后期配音 ✅ 原生音画同步
首尾帧 ✅ 支持(海螺 02) ✅ 支持
主体参考 ✅ S2V-01 角色一致性 ❌ 不支持
时长选择 6秒 / 10秒(固定) 4-12秒(滑块调节)
分辨率 512P-1080P 480P-1080P
计费方式 按秒计费 按 tokens 计费

选择建议

需求场景 推荐厂商
需要配音对口型效果 豆包/火山引擎
需要角色一致性(同一角色多镜头) MiniMax S2V-01
需要快速预览(低时长) 豆包/火山引擎 4s
需要更长视频(10s) MiniMax 10s
想要最低ä»·格 MiniMax 海螺 02 + 512P

Q4:合成时有些分镜显示"无可用视频"?

:该分镜尚未生成视频或视频生成失败。

检查步骤

  1. 在分镜列表中找到该分镜,查看视频列的状态
  2. 如状态为"失败",点击查看错误原因
  3. 根据错误原因修复问题(如更新 API Key、调整参数)
  4. 重新生成视频,等待完成后再次尝试合成

Q5:生成视频失败怎么解决?

:视频生成失败可能由以下原因导致:

错误类型 可能原因 解决方法
API Key 无效 Key 过期、填写错误 前往 AI 配置页面更新 API Key
余额不足 账号余额不足 前往 AI 厂商平台充值后重试
参数不支持 模型不支持当前参数组合 调整参数(如降低分辨率)后重试
网络超时 网络连接不稳定 等待后重试,通常为临时性问题

Q6:如何导出完成的剧集视频?

:合成完成后,视频会自动保存到配置的存储位置。

查看导出结果

  1. 在媒体工作室 → 合成输出 → 合成记录中查看
  2. 找到对应的导出记录,点击「下载」按钮

Q7:宫格图有什么用?

:宫格图是将分镜的画面提示词以 4 宫格或 6 宫格漫画形式可视化展示。

宫格图的用途

用途 说明
快速预览 在视频生成前快速查看整体视觉效果
早期发现 在制作早期发现画面描述问题,及时调整
团队沟通 用于内部沟通确认,避免返工

Q8:如何选择合适的视频模型?

:根据您的需求参考以下选择:

需求 推荐模型 原因
最低价格 海螺 02 + 512P + 6秒 ¥0.60 最低价
最快速度 海螺 2.3-Fast 快速版生成更快
首尾帧 海螺 02 或 豆包 Seedance 都支持首尾帧
角色一致性 S2V-01 保持同一角色外观
音画同步 豆包 Seedance 1.5 Pro 原生音画同步
对口型 豆包 Seedance 1.5 Pro 支持口型同步

附录

A. 页面索引

页面 路径 功能说明
剧集列表 /dramas 管理所有短剧项目
剧集详情 /drama/:id 单个剧集的完整制作区
工作台 /workbench/:dramaId 分镜编辑、批量图片/视频管理
媒体工作室 /media/:dramaId TTS配音、视频生成、合成输出
AI 配置 /settings/ai 配置 AI 厂商 API Key
存储设置 /settings/storage 配置存储位置
任务追踪 /settings/tasks 查看异步任务进度

B. 术语表

术语 说明
分镜 短剧中的单个镜头,每个分镜对应一个视频片段
Prompt 画面描述词,用于告诉 AI 生成什么样的画面
TTS Text-to-Speech,文字转语音
OSS Object Storage Service,对象存储服务(如阿里云 OSS)
异步任务 后台执行的任务,前端提交后不等待完成
音画同步 音频和视频的时间对齐
宫格图 多格漫画形式的画面预览图
运镜 镜头运动方式(推近、拉远、左右移动等)
景别 镜头画面的大小范围(全景、中景、近景、特写)
文生视频 Text-to-Video,仅凭文字描述生成视频
图生视频 Image-to-Video,基于图片生成视频
首尾帧 提供视频的起始和结束画面,AI 生成过渡
主体参考 以参考人物为主体生成视频
Token AI 模型计费单位
参考图 用于视频生成的参考图片

C. 快捷键说明

功能开发中,即将上线


D. 视频生成价格参考

以下价格为参考价,实际扣费以各 AI 厂商为准

MiniMax 海螺模型

模型 时长 512P 768P 1080P
海螺 2.3 标准版 6秒 ¥0.60 ¥2.00 ¥3.50
海螺 2.3 标准版 10秒 ¥1.00 ¥4.00 ¥4.00
海螺 2.3-Fast 6秒 - ¥1.35 ¥2.31
海螺 2.3-Fast 10秒 - ¥2.25 ¥2.31
海螺 02 6秒 ¥0.60 ¥2.00 ¥3.50
海螺 02 10秒 ¥1.00 ¥4.00 ¥4.00
S2V-01 6秒 - ¥2.00(仅720P) -

E. 参考图与视频生成图片的区别

类型 说明 生成方式
角色图 角色的形象照片 在「角色」标签页生成
场景图 场景的背景照片 在「场景」标签页生成
宫格图 分镜画面的漫画分格预览 在分镜详情中生成
参考图 用于视频生成的综合参考图 在工作台「分镜编辑器」中生成,融合角色和场景元素

F. AI 配置字段说明

字段 说明 注意事项
厂商 AI 服务提供商 必须与实际使用的厂商一致
API类型 配置的用途类型 同一厂商可配置多种类型
Base URL API 接口地址 必须与厂商要求一致,否则无法调用
API Key 访问密钥 请妥善保管,不要泄露
模型名称 具体使用的模型 必须与 API 类型匹配
优先级 同类型多配置时的调用顺序 数字越小越优先,0 为最高优先级
Token单价 每 Token 的价格 用于计算费用,不影响功能

本手册最后更新:2026年5月

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐