大家好,我是沉迷 AI 的 Zero君。

这两天我认真把 Replicate 在 2026 年 4 月 15 日 发的那篇 How to make remarkable videos with Seedance 2.0 从头到尾看了一遍。

我看完最大的感受是,这篇文章真正有价值的地方,不是又给你看了几段很炸的 AI 视频。

而是它把一件事讲透了。

Seedance 2.0 已经不太像我们以前理解的那种视频模型了。它不是你丢一句 prompt,等它帮你碰碰运气出片。它更像一个开始懂镜头、懂声音、懂参考素材怎么一起工作的导演型工具。

这也是为什么,我觉得这篇博客值得专门翻成中文聊一遍。

第一件事,Seedance 2.0 已经不是单纯的文生视频

Replicate 在原文里提到,Seedance 2.0 一次最多可以吃 9 张图片、3 段视频、3 段音频,再加一段文字 prompt。

这个信息很关键。

因为它意味着,工作方式已经变了。

以前你写 prompt,更像是在碰概率。

现在你可以把角色长相交给图片,把动作节奏交给参考视频,把口播和氛围交给音频,再用 prompt 把这些东西拧到一起。

它更像在做导片,而不是抽卡。

原文里有个我很喜欢的例子,就是把一个角色放进指定空间里,再让他按参考音频开口说话。

原始视频:
interior-character

这个例子厉害的地方,不是单帧有多好看,而是它把 ImageAudioPrompt 这三类控制源真正揉到了一起。

再往下,原文还演示了一个我觉得特别实用的方向,就是做风格流体变形。

原始视频:
fluid-morphs

这类东西以前你要么靠后期慢慢做,要么就直接接受一堆不连贯的转场。

但在 Seedance 2.0 这里,参考图不只是起点,它真的会变成约束条件。

这也是我觉得它和很多旧视频模型最不一样的地方。

第二件事,它的音画不是后贴的,是一起长出来的

原文有一句我很认同。

它说 Seedance 2.0 不是先生成视频,再把音频贴上去。音频和视频来自同一个统一架构,所以同步是从底层开始做的。

这件事看起来像技术描述,但对创作者非常重要。

因为只要音画不是一体生成的,你就会在口型、乐器动作、环境声层次这些地方立刻感觉到假。

博客里给的爵士钢琴例子就很能说明问题。

原始视频:
jazz-pianist

它不是简单地给你一个会动的乐手,再配一层背景音乐。

你能明显感觉到,按键、贝斯、鼓刷和整体氛围是一起被组织出来的。这种感觉一旦有了,视频就会开始有那种真正的完成度。

对话也一样。

原文用了一个很抽象也很有传播感的例子,两个人在雨天街头吵 SOURDOUGH PRETZEL

原始视频:
sourdough-pretzel

你看这种内容,第一反应不是它会不会说话,而是它说话的时候嘴型、停顿、情绪和字词强调能不能对得上。

博客这部分其实已经在提醒你了。

以后做 AI 视频,声音不再是最后补的配件,而是 prompt 里必须提前设计的一部分。

第三件事,Seedance 2.0 真正开始可怕的地方,是它终于比较懂物理了

这一点我觉得是整篇文章最容易让人低估的地方。

很多老视频模型最常见的问题,不是不会动,而是动得像塑料。

物体不受力,液体不守规律,碰撞没有反馈,镜头一复杂就全是破绽。

但 Replicate 这篇博客里给的几个例子,恰恰都在打这个点。

比如空间站碰撞。

原始视频:
space-collision-physics

再比如根据一张静态图去做车辆运动,车不是僵硬往前平移,而是会随着地面起伏产生颠簸反馈。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

原始视频:
vehicle-animation

还有一个我很喜欢的点,是它连油画风格下的水体运动都尽量维持了物理合理性。

原始视频:
oil-painting-water

这说明什么。

说明它不是只会把表面纹理做得更像了,而是开始在更深的层面理解,什么东西应该怎么动。

对想做广告片、科幻片、游戏概念片、短剧情绪戏的人来说,这个提升比单纯清晰度提高更重要。

第四件事,这篇博客把 15 秒多镜头 prompt 讲明白了

我觉得这部分是全篇最值钱的实操内容。

Replicate 提到,Seedance 2.0 最长可以生成 15 秒 的多镜头视频,而且你可以直接在 prompt 里写时间码,让模型按镜头规划去走。

这就不是普通的描述式 prompt 了。

这已经是分镜思维了。

原文给了四个很典型的案例,我最建议你重点看这三个。

第一个是香水广告。

原始视频:
perfume-commercial

第二个是火星登陆。

原始视频:
mars-landing

第三个是霓虹东京雨夜。

原始视频:
neon-tokyo

这三个例子放在一起看,你会很容易明白一个新结论。

以后真正强的 Seedance 2.0 prompt,不会只是堆形容词。

它会越来越像这样去写。

0-4 秒 做什么镜头。

4-8 秒 情绪怎么升级。

8-12 秒 切到哪里。

12-15 秒 用什么近景或者特写收尾。

也就是说,AI 视频 prompt 正在从一句话愿望,变成一段可执行的镜头语言。

所以普通创作者现在最该做什么

如果你看完这篇 Replicate 博客,已经对 Seedance 2.0 心痒了,我给你一个很直接的建议。

先别急着到处找更花的案例。

先把两个入口握住。

第一个入口,是你真正去跑模型的地方。

如果你想少折腾一点,直接找一个能稳定上手的成品入口,我会建议你先用 Cyberbara Seedance 2.0

https://cyberbara.com/seedance2.0

它更适合那种不想自己再拼一层底层工作流,想直接上手试角色、试广告、试短片的人。

第二个入口,是你补基本功的地方。

如果你不想每次都从空白 prompt 开始硬想,我建议直接把 awesome-seedance 这个 Seedance 2.0 提示词仓库收藏起来:

https://github.com/ZeroLu/awesome-seedance

我一直觉得,真正拉开差距的,不是你有没有看过一条很炸的视频。

而是你手里有没有一套能反复拆、反复改、反复复用的 prompt 参考。

Cyberbara Seedance 2.0 解决的是你怎么更快开始。

awesome-seedance 解决的是你开始之后,怎么持续变强。

最后一句

Replicate 这篇博客如果你只扫一眼,很容易把它当成一篇普通的模型宣传稿。

但我觉得不是。

它真正透露出来的信息是,Seedance 2.0 这类视频模型已经开始越过那个分水岭了。

它不再只是给你看几个能发朋友圈的炫技样片。

它开始变成一个可以认真纳入创作工作流的工具。

而一旦你意识到这一点,你看 prompt 的方式、看镜头的方式、看参考素材的方式,都会变。

我是沉迷 AI 的 Zero君。

如果你后面还想看我继续把这篇 Replicate 博客里的更多 prompt 拆成能直接抄作业的中文版,我可以继续往下整理。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐