📋 本文整理自 Mx-Shell 公开分享的提示词文档(2026.03.15 + 2026.05.10 粉丝群 docx)+ 抖音直播录屏(2026.05.12,两段约 13 万字文字版)。方法论、5 段式模板、所有提示词节选、引语数据均来自他本人公开材料,无虚构、无脑补。原作者 Mx-Shell 保留全部署名权,本文仅做学习交流,不构成任何商业用途授权。


开头钩子

一个 29 岁的云南中专生,2026 年 1 月才第一次接触 AI 视频,4 个月后做出了一部 3 分钟短片 —— 让好莱坞导演 PJ Ace 在推特上公开寻找他。

转发数 6700+。PJ 的配文是:“This is one of the best short films I’ve seen in years.”(“近年来最佳短片之一”)

“If anyone can find the director, please link his socials. I would love to hire him.”
—— PJ Ace, @PJaccetturo, 5 月 11 日

请添加图片描述

人也找到了:Mx-Shell,云南玉溪人,摄影是副业。他做的这部片叫《丧尸清道夫》。

讲的故事简单得让人想笑:末日丧尸危机过去后,一只孤独的原子朋克机器人来到滨海别墅,遇到了一只呆头呆脑的鸵鸟。机器人吓得直发抖,鸵鸟歪着脖子吐着舌头,然后机器人切换 LED 表情,开始跳起迈克尔·杰克逊的霹雳舞,顺势踢飞一颗丧尸的脑袋。

[📷 配图 2:《丧尸清道夫》成片画面 —— 机器人 + 鸵鸟同框]

视频画面是 60 年代复古橙 + 海盐蓝的电影色调,丧尸尸体散落在豪华别墅的水磨石地面,海面波光粼粼。

10 天做完。一个人。中专学历。 第一部 AI 作品是给姐姐家的酒店做的宣传片。

5 月 12 日晚他开了一场两个多小时的抖音直播,主动回应了"垫图"和"3D 渲染"的质疑:

“我直接做。我没有垫过图。我用我自己编写的文案,让 AI 做成这个样子。”
“我这部剧 95% 的词都是手搓的。”

[📷 配图 3:Mx-Shell 直播间画面(资料/视频截图/frame_01m30s.jpg)]

直播里他几乎把自己写提示词的整套方法毫无保留地讲了出来。然后说:“我无所谓了,你们要学习也可以,要拿去干什么都可以。”

我把他两段直播录屏 + 公开分享的提示词文档全部整理、归纳、结构化,做成了一个开源仓库 ai-shortfilm-prompts(github.com/jnMetaCode/ai-shortfilm-prompts),还附带了一个 Claude Code Skill —— 输入一句话就能让 AI 按 Mx-Shell 的套路生成提示词。下面这套方法,是从仓库里提炼的精华版。

📌 本文资料来源:Mx-Shell 2026.05.12 抖音直播录屏(两段,约 13 万字文字版) + 2026.03.15 / 2026.05.10 公开 docx 提示词文档(共约 70 个完整作品段落)。文中所有引语、数据、提示词节选都来自上述材料,无虚构、无脑补。详细出处见仓库 来源与致谢.md

如果你也想做 AI 视频,但写出来的东西总是五毛特效感,下面的内容值得你认真读完。


一、为什么大多数人写的 AI 提示词都不行?

先看一段对比。

普通人写的提示词

“一个酷酷的机甲战士在末日战场上变身,画面要有冲击力,电影感拉满。”

Mx-Shell 写的提示词(节选)

核心主题:写实暗黑特摄 | BLACK SUN 美学 | 破碎肉身 | 战损变身 | 末日战场

【人物与基础设定】
面部:参照上传图片,五官、脸型、发型百分百还原,杜绝美化。面部伤口,纱布,血渍保持一致。刘海覆额,表情全程阴郁。变身瞬间,眉心仅轻微蹙起,拒绝昂扬斗志与眼神高光,保持压抑感。

服装:哑光黑色皮质长风衣,金属腰带为哑光质地,腰带核心为暗红色水晶。

场景:末日战场,微风,硝烟弥漫,阴天荒野,灰蓝色调天空。天空中划过带有火焰与浓烟的陨石。

差别在哪?

不是词更花哨,而是把"导演脑子里看到的画面"逐字翻译成了 AI 能理解的指令。AI 不知道"酷"是什么,但 AI 知道"哑光黑色皮质长风衣"。AI 不知道"电影感"是什么,但 AI 知道"IMAX 胶片摄影机 + Panavision C 系列镜头 35mm f4"。

Mx-Shell 在直播里说了一句话,我觉得是整套方法论的核心:

“你得把 AI 当作你的同事、你的牛马这样去指挥它。你不能完全把它当人,但也不能真把它当机器人。”

也就是说 —— 用对待真人摄影团队的方式给 AI 下达指令。一个摄影团队需要知道:用什么机器、什么镜头、人物穿什么、站在哪、做什么动作、镜头怎么动、灯怎么打、几点钟开始几点钟结束。

这些你都得写清楚。


二、Mx-Shell 反复使用的"5 段式模板"

把他公开过的全部提示词读完,会发现一个惊人的事实 —— 不论是假面骑士变身、卡莎 LOL 变身、丧尸清道夫、合金装备打斗,他用的都是同一套结构

只是替换了里面的变量。

1. 核心主题:3-6 个 tag,定调子
2. 人物与基础设定:面部 / 服装 / 场景
3. 氛围与画质:视觉基调 / 色彩与影调 / 风格核心
4. 运镜规则:单镜头 or 多分镜 / 角度 / 呼吸感
5. 分镜(时间轴):按秒切片 or 按镜头切片

下面一段段拆开看。

段 1 · 核心主题

一行风格标签,用 | 分隔。从"画面类型 → 题材 → 美学风格"层层递进。

作品 核心主题
假面骑士战损变身 写实暗黑特摄 | BLACK SUN 美学 | 破碎肉身 | 战损变身 | 末日战场
丧尸清道夫 原子朋克 | 末日丧尸 | 电影级质感 | 超写实 | 杜绝游戏 CG 感
重型机甲 写实科技感 | 科幻机甲 | 磅礴史诗 | 重工业机械美学 | 真人演绎

这一行就像告诉同事:“今天我们拍的是 XX 类型 + XX 风格”。3-6 个 tag,不多不少。

段 2 · 人物与基础设定

三行:面部 / 服装 / 场景

最关键的是细节质感。"哑光黑色皮质"比"黑色皮衣"信息量大三倍

Mx-Shell 反复强调的一个反直觉点

“尽量使用面部清晰的大头照,不要过度美颜的那种。有自信的兄弟直接用素颜照(你看哪部电影是有美颜的)。过于完美就假。适当保留缺陷不是坏事。真实的世界里任何东西都是有瑕疵的。”

所以他每次都会在描述里加:“保留轻微面部瑕疵” / “面部伤口、纱布、血渍” / “战衣整体远非平整,各处战损痕迹触目惊心”

写瑕疵 = 写真实。 这是整套方法论里最反直觉但最有效的发现。

段 3 · 氛围与画质(核心技巧在这一段)

这一段是 Mx-Shell 的独家秘诀:模拟真实摄影机 + 镜头

视觉基调:变形宽荧幕电影质感。模拟 IMAX 胶片摄影机,
        搭配 Panavision C 系列镜头(焦段 35mm,光圈 f4)。
色彩与影调:低饱和灰蓝主调。暗部信息压缩,保留细节。
          边缘添加轻微柔焦与适度的胶片颗粒感。

为什么有效?

因为 AI 训练数据里大量真实电影的画面元数据都和具体摄影机型号绑定。给 AI 一个"IMAX 胶片摄影机",它就有了一个非常具体的视觉风格锚点 —— 比你说"电影感强烈"这种模糊词高维多了。

Mx-Shell 在直播里直说了:

“你可以去模拟我的粉丝就应该了解了,模拟真实的摄影机去拍摄。我比较喜欢这款摄影机,这款是诺兰导演经常会用的,就是拍《星际穿越》的那位导演。”

他常用的摄影机组合,我整理了一下:

想要的风格 摄影机 + 镜头
史诗感 / 大场面 IMAX 胶片摄影机 + Panavision C 系列镜头(35mm,f4)
暗调赛博 / 写实硬核 索尼威尼斯电影机 + 佳能 K-35 系列镜头
港片 / 武侠 柯达 35mm 复古胶片,跳过漂白胶片质感
商业人像 Canon EF 85mm f/1.2

[📷 配图 5:Mx-Shell Word 提示词原稿截图(资料/视频截图/frame_06m00s.jpg)—— 强力视觉证据,证明这真是手写]

这一段你抄下来直接用,立刻看到效果。

段 4 · 运镜规则

三行:单镜头 / 角度 / 呼吸感

注意最后一行 —— “呼吸感”

“手持拍摄,全程保持极其轻微的、如呼吸般的镜头浮动,增强临场感。”

这一句几乎在 Mx-Shell 每个视频提示词里都出现。为什么?

因为 AI 默认输出的镜头是绝对静止的 CG 感。加上"呼吸般的浮动",画面立刻像真人手持摄影机拍的。

这是个一句话改变质感的写法。

段 5 · 分镜(时间轴)

最关键、也最容易被忽略的部分。两种写法

写法 A:按秒切片(适合单镜头一镜到底,比如变身、武器充能)

0-3 秒 · 凝视
动作:主角略微低头,目光锁定腰带...
镜头:极缓向前推进...
特效:整颗眼球骤然亮起白金色光芒...

3-6 秒 · 启动
声音:低语「HENSHIN」
动作:手掌用力按压腰带核心...
特效:金属机械装置被暴力唤醒...
镜头:低频嗡鸣由远及近,镜头随之一同产生应激性的 0.1 秒微颤。

关键:每段都有"动作 + 镜头 + 特效"三件套,可选加"声音、面部"。

写法 B:按镜头切片(适合多镜头叙事,比如《丧尸清道夫》)

分镜一:
景别:中景,拍摄机器人腿部以上位置
构图:机器人背影作为前景居中位于画面中心
运镜手法:跟随运动拍摄
画面内容:机器人背对镜头向前方移动,手舞足蹈进入别墅...

关键:每个分镜四件套 ——景别 / 构图 / 运镜手法 / 画面内容。

这套模板真能复用 —— 看这 5 个变体

光说"骨架通用"没用,看证据。

Mx-Shell 早期火过的"战损变身"系列,共 5 个变体。从假面骑士的暗黑美学到女武神的紫色玻璃质感 —— 全部使用同一套 5 段式骨架,只在 4-5 个变量上做替换:

变量 蟑螂侠 火焰恶魔 雷龙 彩虹麋鹿 紫鸢女武神
主色 黑红 黑红 白金 白金 深紫+乳白
水晶 暗红 暗红 暗蓝 暗蓝 暗紫
触发词 低语「HENSHIN」 低语「HENSHIN」 怒喊「AMAZONS」 怒喊「AMAZONS」 御姐音韩语「변신」
头盔造型 复眼+触角 长冠状犄角+喷火 龙角+龙鳞 雄性麋鹿角 玻璃棱镜触角
时长 15s 一镜到底 15s 一镜到底 15s 一镜到底 15s 一镜到底 15s 一镜到底

[📷 配图 4:5 个变体成片拼图(抖音 Mx-Shell 频道自截 + Canva 拼图)]

只改 4-5 个变量,能产出 5 个截然不同的变身视频。

这才是这套方法论真正的价值 —— 你学会一套结构,可以做出无限多的作品。

仓库里 原始提示词/假面骑士-变身系列.md 完整记录了 5 个变体的对比,你可以一眼看到"哪些是常量、哪些是变量"。


三、《丧尸清道夫》是怎么用这套方法做出来的?

直接看原文(节选自他公开的提示词):

【基础设定】
机器人清道夫(Portrait1):身形修长的人形机器人,1960 年代原子朋克风格设计。拥有自主意识。面部 LED 显示屏代替五官,显示马赛克像素风格的表情。身穿美式西部牛仔复古风格的生棕色牛仔帽、黑色哑光高腰设计皮衣夹克、黑色哑光皮手套、牛仔腰带和枪套。

非洲鸵鸟(Portrait2):成年非洲公鸵鸟,样貌看起来呆傻,双眼不聚焦,歪吐着舌头。

场景(Portrait6):末日爆发丧尸危机大战过后的滨海半山度假别墅,1960 年代原子朋克建筑风格。窗外正午刺眼阳光漫射,海面波光粼粼,烈日下空气微微热浪扭曲。场景四处均有丧尸的尸体、撕裂的四肢、杂乱的生活用品、钞票、酒瓶酒杯以及血渍。

整体氛围奢华松弛,兼具度假慵懒感与复古未来主义的高级质感。休闲惬意的环境与丧尸的尸体形成极大的反差对比。

读完上面这段你会发现一个细节 —— 反差对比是这部短片情绪的核心。

  • 度假别墅 ↔ 丧尸尸体
  • 机器人呆萌 ↔ 末日废墟
  • 跳 MJ 舞 ↔ 战斗后死寂

3 个反差叠加在 3 分钟里,观众无法不被冲击。这是好故事的写法,不是 AI 的功劳。

[📷 配图 6:《丧尸清道夫》反差对比画面 —— 豪华别墅水磨石地面 + 散落丧尸尸体 + 跳舞的机器人]

然后他用 7 个分镜讲完了"机器人与鸵鸟相遇"这一段:

  1. 机器人跳着舞进入 → 听到声音吓到(绿色微笑 → 黄色害怕)
  2. 空镜对准吧台,画外传来悉悉簌簌声响(铺垫)
  3. 特写机器人发抖防御姿态
  4. 过肩长焦,鸵鸟从画面下方探头 → 机器人被吓
  5. 全景对称构图,机器人慢慢站直
  6. 长焦特写鸵鸟歪头吐舌
  7. 长焦特写机器人侧 45 度,表情从害怕切换为思考(黄 → 白)

每个镜头都明确:景别 + 构图 + 运镜手法 + 画面内容

观众看完会觉得"这导演真懂镜头" —— 实际上 Mx-Shell 在直播里说:

“我没有完整剧本。我都是跟朋友聊了一下,简单的拍做了两个镜头看到这个质感好像还 OK,才开始想要以什么开场。我边做边想边改。


四、几个能让你的 AI 视频立刻变好的"小技巧"

整理自他两段直播 Q&A,按实战频率排序。

1. 不要给 AI 参考图(除非画质够高)

“我所有假面骑士的战衣造型都是靠描述让 AI 自由发挥的。”

垫图最大的副作用:AI 容易复现参考图的画风(包括 CG 感、动漫感),而不是参考它的设计

例外:参考图本身就是 3D 渲染、写实大片质感、或自己用 GPT Image 生成的高质量图。

2. 摄影机型号是质感的最大锚点

写"电影感" → 没用。
写"模拟 IMAX 胶片摄影机 + Panavision C 系列镜头 35mm f4" → 立刻变样。

3. 描述瑕疵就是描述真实

战损痕迹、磨损掉漆、关节油污、轻微面部瑕疵 —— 完美的画面 = 假的画面

4. 给镜头加"呼吸感"

手持拍摄,全程保持极其轻微的、如呼吸般的镜头浮动,增强临场感。

一句话,AI 输出立刻像真人摄影机。

5. 抽卡是常态,不要追求一次成型

Mx-Shell 单镜头抽卡数:

  • 多的可能 20 次
  • 少的两三次
  • 整部《丧尸清道夫》生成了 400 张图片 + 200+ 个视频镜头

“我可以同时抽着两个场景的卡,然后编写着第三个场景的词。”

把"卡"当游戏里的"抽卡"。运气好一次出,运气不好二十次出。不要怪自己提示词写得不行,是 AI 本来就有随机性

6. 提示词违规 → 删字眼、换近义词

Seedance 2.0 对版权词敏感。钢铁侠 → 原子朋克未来主义复古风HENSHIN → 自创音节

7. 长视频 = 短片段 + 剪辑拼接

小云雀网页端有"生成视频后续"功能。Mx-Shell 的《合金装备》打斗段就是分两段(武器充能 + 打斗)单独生成 + 后期剪辑。

不要追求 30 秒一镜到底,抽不出来

8. 同一颜色调,前后镜头才能拼

剪辑时最大坑:A 镜头偏暖橙,B 镜头偏冷蓝,剪在一起色差爆炸。

对策:在场景图阶段就把色调定死,所有视频提示词的"色彩与影调"段统一。

9. 没必要做 4K,720p 够了

“我的视频基本都是 720p。”

国内平台会再压缩一遍,4K 给你压成 1080p 也无所谓。省下来的算力多抽几次卡更重要

10. 不一定要用人脸 —— 戴头盔/面具/机器人也行

“不是任何的故事非要有人脸才能创作。我近两期的作品都是这样。你为什么就是非要卡着那个人脸呢?”

机器人的好处:审核免疫 + LED 显示器演表情,比真人还灵活。这就是《丧尸清道夫》选机器人主角的真正原因。


五、他用了什么工具?

按使用频率排序:

用途 工具
视频生成(80%) 小云雀里的 Seedance 2.0(不要用 Fast 版)
图像生成(80%) GPT Image
图像生成(辅助) Midjourney / Krea
材质优化 Flux Max(金属、瓷砖、皮肤细节单独过一遍)
三视图 Nanobanana
文案辅助 豆包(打斗戏让豆包写后自己改)
剪辑 剪映
配乐 Artlist.io(版权音乐,不是 AI 生成)

注意:音乐不是 AI 做的

“音乐是本来就有的版权音乐。我整部片子下来,只有那一句配音是 AI 生成的,前面那个清理完毕的提示音都不算配音。”


六、他到底花了多少钱?

网传"10 天 3000 元"的数据流传很广,但直播里实际细节稍微复杂。

直播原文:

观众:“3000 美金怎么可能?”
Mx-Shell:“3000 美金?3000 块钱多少了?嗯,几万块了吧?是按 G2 两万多块钱了吧?”
后面又说:“3000 块钱人民币。”

合理推测:

  • 作品成本 ≈ 3000 RMB(对外宣传口径)
  • 实际买额度的总开销可能在 2 万 RMB 上下(算上抽卡损耗)
  • 但即便按 2 万算,也仍然远低于真人拍摄 3 分钟同等质感短片的成本

10 天 + 一两万 + 一个云南中专生,做出"近年最佳短片"。
这就是 AI 这一波最值得思考的事


七、他不是什么天才

直播里有这么几段对话,我觉得是这场直播最有价值的部分。

观众问:“你是什么专业的?”

“中专中专我中专。”

观众问:“你研究 AI 多久了?”

“今年一月份开始接触的。”

观众问:“斯皮尔伯格找你了吗?”

“斯皮尔伯格找我?哈哈想太多了。”

观众问:“好莱坞找你怎么说?”

“我跟那位 CEO 才开始聊,我们才彼此来往了三四封邮件。”

观众问:“是怎么自学的?”

“看自己摸索呗,看一下别人怎么做的,学习一下。”

观众问:“剧本灵感怎么来?”

“灵感来自机器人总动员。”

观众问:“这部片有没有完整的剧本?”

“你们看到的清道夫这个没有完整的剧本,一开始就都是你一点一点挤出来。”

他对自己没有任何吹捧。 全程都在说"我也是自学的,没怎么系统学习过",“我说的不一定对”,“建议大家学一下别的老师”。

这种朴实和自嘲,让那两个多小时直播听起来一点都不像"AI 大佬开课",更像是一个手艺人被人围着问"你这玩意儿是怎么做的",他不藏着掖着地一点一点讲出来。

“对于创作来说,设备不是重要的。想法才是最重要的。”
—— Mx-Shell


写在最后

你不需要等到 GPT-5、Sora 2、可灵 3 才开始做 AI 视频。
你需要的只是:

  1. 一个想法
  2. 一份结构化的提示词
  3. 接受抽卡的耐心
  4. 一点剪辑功底

工具都在那里。方法就是这一套。

剩下的,就是你自己愿不愿意花 10 天,把"我有个想法"做成一部完整的片子。

Mx-Shell 在直播末尾说:

“如果说真的有需要,也希望今天看了直播的朋友能够对自己有提升。包括也希望国内的这个 AI 行业 —— 不说以我为标杆,这种话不是这个意思 —— 在我今天的分享上汲取一些创新的灵感,能够帮助到大家。”

希望这篇拆解,也能帮你一点。


📦 拿走这个仓库

完整原始提示词、5 段式方法论、模板骨架、Claude Code Skill 全部归档在开源仓库:

🔗 github.com/jnMetaCode/ai-shortfilm-prompts

里面有:

  • 🎬 10+ 个完整作品原始提示词(丧尸清道夫、假面骑士 ×5、卡莎 LOL 变身、环太平洋高达、合金装备打斗、赛博江湖)
  • 📋 去 IP 的通用模板(15 秒变身模板 + 多分镜叙事模板 + 7 种氛围骨架)
  • 🛠️ Claude Code Skill —— 输入 /shortfilm-prompt,AI 自动按 Mx-Shell 的 5 段式帮你写
  • 📚 完整方法论 + 17 条实战 FAQ + 直播 Q&A

全部 MIT / CC BY-NC-SA 协议开源。原作者 Mx-Shell 全部署名。

点 ⭐ Star 不要钱,但能帮我继续做更多 AI 创作者的方法论翻译和整理 —— 后续会收录其他 AI 短片创作者的写法。


关于本文
本文整理自 Mx-Shell 在 2026 年 5 月 12 日抖音直播的两段录屏文字版(共约 13 万字),及他在 2026 年 3 月和 5 月公开分享给粉丝的提示词文档(共约 70 个完整作品 / 段落)。原作者保留全部署名权。

完整原始提示词、5 段式方法论、模板骨架、Claude Code Skill 全部归档在开源仓库
🔗 github.com/jnMetaCode/ai-shortfilm-prompts

仅做学习交流用途,不构成任何平台 / 工具的背书。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐