Coze + 剪映:零代码打造 AI 自动化书单短视频神器,效率提升 10 倍!

一、 前言:短视频创作者的“效率革命”

在短视频赛道中,书单号、读书笔记类视频一直以其稳定的流量和极高的变现潜力备受青睐。然而,传统制作流程极其繁杂:

  • 痛点直击:搜集金句、找配图、人工配音、逐句对齐字幕、添加特效、渲染导出……制作一条高质量的书单视频往往需要数小时的精雕细琢。
  • AI 破局:如果只需输入一个“书名”,剩下的所有工作——从文案提取到剪映工程文件的生成——都能在几分钟内自动完成呢?
  • 最终效果:本文将手把手带你通过 Coze(扣子) 搭建一套高度自动化的 AI 工作流。这不仅是一个“生成器”,它能直接产出包含完整轨道数据的剪映草稿,让你实现从“手工缝制”到“全自动流水线”的质变。

二、 核心逻辑:像搭积木一样构建自动化流

要实现自动化剪辑,核心逻辑是将视频的轨道思维(字幕轨、音频轨、画面轨、背景轨)映射到 Coze 的节点处理中。

15 步全流程深度解析

1. 输入初始化

在“开始节点”配置核心入参:book_name(书名)、author_name(作者)、auto_text(自定义文案,可选)、ip_name(视频创作者署名)。这是整个自动化引擎的燃料。

2. LLM 智能内容拆解

添加大模型节点,利用 WebPilot 插件联网搜索书籍精华。

  • 输出变量:生成字幕内容(content 数组)、BGM 风格(bgm_style)。
  • 核心逻辑:利用 group_content 对象进行文案分组合并。为了平衡视觉体验与生成成本,我们不要求“一句一图”,而是让 LLM 根据语义将多句文案合并为一个视觉场景。
3. 进度条规划

通过大模型将整本书的内容总结为 4 个关键阶段(output1~output4),作为视频顶部的实时进度指示器。

4. 批量 TTS 语音合成

使用 Coze 官方语音合成插件。技术细节:采用批处理并行生成,为 content 中的每一句文案生成对应的 .mp3 链接,确保人声自然且情感饱满。

5. 时间轴计算(关键步)

调用 audio_timelines 插件分析音频。

  • all_timelines:整段音频的总时长,用于控制背景图、BGM 等全局元素的生命周期。
  • timelines:每句文案对应的微秒级起止时间,用于控制人声轨道与对应字幕的精确对齐。
6. 初始化剪映草稿

通过 create_draft 工具创建一个 1920x1080 的画布,作为后续所有轨道的容器。

7. 动态背景图合成

利用“画板节点”动态生成一张包含书名、作者、进度标题和 IP 名的专属背景图。

  • 流程画板生成 -> str_to_list(转数组) -> imgs_infos(应用 all_timelines) -> add_images
8. BGM 智能注入

根据第 2 步生成的 bgm_style 自动搜索背景音乐,通过 audio_infos 设置音量(推荐 0.5 避免盖过人声),覆盖全时长 all_timelines

9. 人声轨道精确对齐

这是视频的灵魂。将 TTS 生成的音频列表通过 audio_infos 处理。注意:此处必须传入 timelines 列表,确保每一段音频都在正确的时间点播放。

10. AI 视觉生成与映射
  • Prompt 优化:LLM 为 group_content 生成绘图提示词,前缀固定为 white background, {{prompt}} 以保持风格统一。
  • 逻辑映射:利用 group_content 中的索引,将生成的图片列表与文案时间线结合,生成内容图轨道。
  • 缩放设置:设置 scale=0.5 确保内容图在画布中央完美呈现。
11. 动态滚动进度条(数学之美)

这是一个进阶玩法。

  • 素材:使用一张半透明纯白长图(1920 宽度的两倍)。
  • 关键帧逻辑:添加 add_keyframes。设置 X 轴起始坐标为 -3840,结束坐标为 0offsets=0|100)。
  • 效果:随着视频播放,顶部的白色遮罩会平滑移动,呈现出完美的进度加载感。
12. 智能字幕美化

调用 subtitles_infos

  • 参数配置alignment=1(居中)、font_size=8text_color=#000000(黑色金句风)、transform_y=-780(底部对齐)。
13. 氛围特效添加

将“下雪”、“光影”等特效名称通过 str_to_list 转为数组,覆盖 all_timelines,瞬间提升视频高级感。

14. 锁定与保存

执行 save_draft 节点,将以上 13 层轨道数据锁定在云端工程中。

15. 加密 JSON 输出

最终输出一个加密的 JSON 链接,这是通往本地剪映的唯一“钥匙”。


三、 核心技术亮点与“避坑”指南

Q: 为什么要区分 all_timelinestimelines
A: 这是自动化剪辑的基础。背景图、BGM、进度条是全局元素,必须使用 all_timelines;而人声和对应的字幕是局部元素,必须使用分段的 timelines,否则会出现严重的音画不同步。

Q: 滚动进度条的原理是什么?
A: 我们利用了剪映的关键帧机制。通过在 Coze 中预设起始(0% 进度)和结束(100% 进度)的 X 轴坐标位移(-3840 到 0),让原本静止的图片在 1920 的画布上“跑”起来。

Q: 如何节省 AI 生图额度?
A: 核心在于 group_content。LLM 会将语义相关的 2-3 句文案分到一组,让它们共用一张图片。这不仅节省了 Token,更让视频画面不会切换过快,给人留出思考空间。


四、 实战配置:从零搭建你的应用

1. 必收插件列表

2. UI 界面搭建

在 Coze 应用界面,添加三个输入框(书名、作者、IP 名)和一个表单提交按钮。下方配置一个“一键复制”组件,用于获取生成的加密链接。

3. PC 端无缝衔接

  1. 下载并打开“剪映小助手”客户端。
  2. 在客户端设置中配置你的剪映草稿存放路径。
  3. 将 Coze 生成的链接粘贴进客户端,点击“解析”。
  4. 回到剪映,你的全自动视频草稿已经静静地躺在那里,等待你最后的点击导出。

五、 总结与未来展望

通过 Coze 搭建的这套 AI 书单流,不仅仅是提高了效率,更重要的是它将创意与劳动力解耦。你可以把精力放在书籍的挑选和文案的打磨上,而那些琐碎的剪辑工作,全部交给 AI。

未来的短视频赛道,拼的不再是谁的手速快,而是谁的 AI 自动化工作流更稳。基于此框架,你还可以扩展出“AI 故事机”、“AI 每日英语”等更多垂直赛道。

提示:关注公众号,回复书单视频,免费获取工作流。微信公众号


Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐