好莱坞全网找的中国创作者,他的 AI 短片提示词全开源了+直播讲解整理
📋 本文整理自 Mx-Shell 公开分享的提示词文档(2026.03.15 + 2026.05.10 粉丝群 docx)+ 抖音直播录屏(2026.05.12,两段约 13 万字文字版)。方法论、5 段式模板、所有提示词节选、引语数据均来自他本人公开材料,无虚构、无脑补。原作者 Mx-Shell 保留全部署名权,本文仅做学习交流,不构成任何商业用途授权。
开头钩子
一个 29 岁的云南中专生,2026 年 1 月才第一次接触 AI 视频,4 个月后做出了一部 3 分钟短片 —— 让好莱坞导演 PJ Ace 在推特上公开寻找他。
转发数 6700+。PJ 的配文是:“This is one of the best short films I’ve seen in years.”(“近年来最佳短片之一”)
“If anyone can find the director, please link his socials. I would love to hire him.”
—— PJ Ace, @PJaccetturo, 5 月 11 日

人也找到了:Mx-Shell,云南玉溪人,摄影是副业。他做的这部片叫《丧尸清道夫》。
讲的故事简单得让人想笑:末日丧尸危机过去后,一只孤独的原子朋克机器人来到滨海别墅,遇到了一只呆头呆脑的鸵鸟。机器人吓得直发抖,鸵鸟歪着脖子吐着舌头,然后机器人切换 LED 表情,开始跳起迈克尔·杰克逊的霹雳舞,顺势踢飞一颗丧尸的脑袋。
[📷 配图 2:《丧尸清道夫》成片画面 —— 机器人 + 鸵鸟同框]
视频画面是 60 年代复古橙 + 海盐蓝的电影色调,丧尸尸体散落在豪华别墅的水磨石地面,海面波光粼粼。
10 天做完。一个人。中专学历。 第一部 AI 作品是给姐姐家的酒店做的宣传片。
5 月 12 日晚他开了一场两个多小时的抖音直播,主动回应了"垫图"和"3D 渲染"的质疑:
“我直接做。我没有垫过图。我用我自己编写的文案,让 AI 做成这个样子。”
“我这部剧 95% 的词都是手搓的。”
[📷 配图 3:Mx-Shell 直播间画面(资料/视频截图/frame_01m30s.jpg)]
直播里他几乎把自己写提示词的整套方法毫无保留地讲了出来。然后说:“我无所谓了,你们要学习也可以,要拿去干什么都可以。”
我把他两段直播录屏 + 公开分享的提示词文档全部整理、归纳、结构化,做成了一个开源仓库 ai-shortfilm-prompts(github.com/jnMetaCode/ai-shortfilm-prompts),还附带了一个 Claude Code Skill —— 输入一句话就能让 AI 按 Mx-Shell 的套路生成提示词。下面这套方法,是从仓库里提炼的精华版。
📌 本文资料来源:Mx-Shell 2026.05.12 抖音直播录屏(两段,约 13 万字文字版) + 2026.03.15 / 2026.05.10 公开 docx 提示词文档(共约 70 个完整作品段落)。文中所有引语、数据、提示词节选都来自上述材料,无虚构、无脑补。详细出处见仓库
来源与致谢.md。
如果你也想做 AI 视频,但写出来的东西总是五毛特效感,下面的内容值得你认真读完。
一、为什么大多数人写的 AI 提示词都不行?
先看一段对比。
普通人写的提示词:
“一个酷酷的机甲战士在末日战场上变身,画面要有冲击力,电影感拉满。”
Mx-Shell 写的提示词(节选):
核心主题:写实暗黑特摄 | BLACK SUN 美学 | 破碎肉身 | 战损变身 | 末日战场
【人物与基础设定】
面部:参照上传图片,五官、脸型、发型百分百还原,杜绝美化。面部伤口,纱布,血渍保持一致。刘海覆额,表情全程阴郁。变身瞬间,眉心仅轻微蹙起,拒绝昂扬斗志与眼神高光,保持压抑感。服装:哑光黑色皮质长风衣,金属腰带为哑光质地,腰带核心为暗红色水晶。
场景:末日战场,微风,硝烟弥漫,阴天荒野,灰蓝色调天空。天空中划过带有火焰与浓烟的陨石。
差别在哪?
不是词更花哨,而是把"导演脑子里看到的画面"逐字翻译成了 AI 能理解的指令。AI 不知道"酷"是什么,但 AI 知道"哑光黑色皮质长风衣"。AI 不知道"电影感"是什么,但 AI 知道"IMAX 胶片摄影机 + Panavision C 系列镜头 35mm f4"。
Mx-Shell 在直播里说了一句话,我觉得是整套方法论的核心:
“你得把 AI 当作你的同事、你的牛马这样去指挥它。你不能完全把它当人,但也不能真把它当机器人。”
也就是说 —— 用对待真人摄影团队的方式给 AI 下达指令。一个摄影团队需要知道:用什么机器、什么镜头、人物穿什么、站在哪、做什么动作、镜头怎么动、灯怎么打、几点钟开始几点钟结束。
这些你都得写清楚。
二、Mx-Shell 反复使用的"5 段式模板"
把他公开过的全部提示词读完,会发现一个惊人的事实 —— 不论是假面骑士变身、卡莎 LOL 变身、丧尸清道夫、合金装备打斗,他用的都是同一套结构。
只是替换了里面的变量。
1. 核心主题:3-6 个 tag,定调子
2. 人物与基础设定:面部 / 服装 / 场景
3. 氛围与画质:视觉基调 / 色彩与影调 / 风格核心
4. 运镜规则:单镜头 or 多分镜 / 角度 / 呼吸感
5. 分镜(时间轴):按秒切片 or 按镜头切片
下面一段段拆开看。
段 1 · 核心主题
一行风格标签,用 | 分隔。从"画面类型 → 题材 → 美学风格"层层递进。
| 作品 | 核心主题 |
|---|---|
| 假面骑士战损变身 | 写实暗黑特摄 | BLACK SUN 美学 | 破碎肉身 | 战损变身 | 末日战场 |
| 丧尸清道夫 | 原子朋克 | 末日丧尸 | 电影级质感 | 超写实 | 杜绝游戏 CG 感 |
| 重型机甲 | 写实科技感 | 科幻机甲 | 磅礴史诗 | 重工业机械美学 | 真人演绎 |
这一行就像告诉同事:“今天我们拍的是 XX 类型 + XX 风格”。3-6 个 tag,不多不少。
段 2 · 人物与基础设定
三行:面部 / 服装 / 场景。
最关键的是细节质感。"哑光黑色皮质"比"黑色皮衣"信息量大三倍。
Mx-Shell 反复强调的一个反直觉点:
“尽量使用面部清晰的大头照,不要过度美颜的那种。有自信的兄弟直接用素颜照(你看哪部电影是有美颜的)。过于完美就假。适当保留缺陷不是坏事。真实的世界里任何东西都是有瑕疵的。”
所以他每次都会在描述里加:“保留轻微面部瑕疵” / “面部伤口、纱布、血渍” / “战衣整体远非平整,各处战损痕迹触目惊心”。
写瑕疵 = 写真实。 这是整套方法论里最反直觉但最有效的发现。
段 3 · 氛围与画质(核心技巧在这一段)
这一段是 Mx-Shell 的独家秘诀:模拟真实摄影机 + 镜头。
视觉基调:变形宽荧幕电影质感。模拟 IMAX 胶片摄影机,
搭配 Panavision C 系列镜头(焦段 35mm,光圈 f4)。
色彩与影调:低饱和灰蓝主调。暗部信息压缩,保留细节。
边缘添加轻微柔焦与适度的胶片颗粒感。
为什么有效?
因为 AI 训练数据里大量真实电影的画面元数据都和具体摄影机型号绑定。给 AI 一个"IMAX 胶片摄影机",它就有了一个非常具体的视觉风格锚点 —— 比你说"电影感强烈"这种模糊词高维多了。
Mx-Shell 在直播里直说了:
“你可以去模拟我的粉丝就应该了解了,模拟真实的摄影机去拍摄。我比较喜欢这款摄影机,这款是诺兰导演经常会用的,就是拍《星际穿越》的那位导演。”
他常用的摄影机组合,我整理了一下:
| 想要的风格 | 摄影机 + 镜头 |
|---|---|
| 史诗感 / 大场面 | IMAX 胶片摄影机 + Panavision C 系列镜头(35mm,f4) |
| 暗调赛博 / 写实硬核 | 索尼威尼斯电影机 + 佳能 K-35 系列镜头 |
| 港片 / 武侠 | 柯达 35mm 复古胶片,跳过漂白胶片质感 |
| 商业人像 | Canon EF 85mm f/1.2 |
[📷 配图 5:Mx-Shell Word 提示词原稿截图(资料/视频截图/frame_06m00s.jpg)—— 强力视觉证据,证明这真是手写]
这一段你抄下来直接用,立刻看到效果。
段 4 · 运镜规则
三行:单镜头 / 角度 / 呼吸感。
注意最后一行 —— “呼吸感”:
“手持拍摄,全程保持极其轻微的、如呼吸般的镜头浮动,增强临场感。”
这一句几乎在 Mx-Shell 每个视频提示词里都出现。为什么?
因为 AI 默认输出的镜头是绝对静止的 CG 感。加上"呼吸般的浮动",画面立刻像真人手持摄影机拍的。
这是个一句话改变质感的写法。
段 5 · 分镜(时间轴)
最关键、也最容易被忽略的部分。两种写法:
写法 A:按秒切片(适合单镜头一镜到底,比如变身、武器充能)
0-3 秒 · 凝视
动作:主角略微低头,目光锁定腰带...
镜头:极缓向前推进...
特效:整颗眼球骤然亮起白金色光芒...
3-6 秒 · 启动
声音:低语「HENSHIN」
动作:手掌用力按压腰带核心...
特效:金属机械装置被暴力唤醒...
镜头:低频嗡鸣由远及近,镜头随之一同产生应激性的 0.1 秒微颤。
关键:每段都有"动作 + 镜头 + 特效"三件套,可选加"声音、面部"。
写法 B:按镜头切片(适合多镜头叙事,比如《丧尸清道夫》)
分镜一:
景别:中景,拍摄机器人腿部以上位置
构图:机器人背影作为前景居中位于画面中心
运镜手法:跟随运动拍摄
画面内容:机器人背对镜头向前方移动,手舞足蹈进入别墅...
关键:每个分镜四件套 ——景别 / 构图 / 运镜手法 / 画面内容。
这套模板真能复用 —— 看这 5 个变体
光说"骨架通用"没用,看证据。
Mx-Shell 早期火过的"战损变身"系列,共 5 个变体。从假面骑士的暗黑美学到女武神的紫色玻璃质感 —— 全部使用同一套 5 段式骨架,只在 4-5 个变量上做替换:
| 变量 | 蟑螂侠 | 火焰恶魔 | 雷龙 | 彩虹麋鹿 | 紫鸢女武神 |
|---|---|---|---|---|---|
| 主色 | 黑红 | 黑红 | 白金 | 白金 | 深紫+乳白 |
| 水晶 | 暗红 | 暗红 | 暗蓝 | 暗蓝 | 暗紫 |
| 触发词 | 低语「HENSHIN」 | 低语「HENSHIN」 | 怒喊「AMAZONS」 | 怒喊「AMAZONS」 | 御姐音韩语「변신」 |
| 头盔造型 | 复眼+触角 | 长冠状犄角+喷火 | 龙角+龙鳞 | 雄性麋鹿角 | 玻璃棱镜触角 |
| 时长 | 15s 一镜到底 | 15s 一镜到底 | 15s 一镜到底 | 15s 一镜到底 | 15s 一镜到底 |
[📷 配图 4:5 个变体成片拼图(抖音 Mx-Shell 频道自截 + Canva 拼图)]
只改 4-5 个变量,能产出 5 个截然不同的变身视频。
这才是这套方法论真正的价值 —— 你学会一套结构,可以做出无限多的作品。
仓库里 原始提示词/假面骑士-变身系列.md 完整记录了 5 个变体的对比,你可以一眼看到"哪些是常量、哪些是变量"。
三、《丧尸清道夫》是怎么用这套方法做出来的?
直接看原文(节选自他公开的提示词):
【基础设定】
机器人清道夫(Portrait1):身形修长的人形机器人,1960 年代原子朋克风格设计。拥有自主意识。面部 LED 显示屏代替五官,显示马赛克像素风格的表情。身穿美式西部牛仔复古风格的生棕色牛仔帽、黑色哑光高腰设计皮衣夹克、黑色哑光皮手套、牛仔腰带和枪套。非洲鸵鸟(Portrait2):成年非洲公鸵鸟,样貌看起来呆傻,双眼不聚焦,歪吐着舌头。
场景(Portrait6):末日爆发丧尸危机大战过后的滨海半山度假别墅,1960 年代原子朋克建筑风格。窗外正午刺眼阳光漫射,海面波光粼粼,烈日下空气微微热浪扭曲。场景四处均有丧尸的尸体、撕裂的四肢、杂乱的生活用品、钞票、酒瓶酒杯以及血渍。
整体氛围奢华松弛,兼具度假慵懒感与复古未来主义的高级质感。休闲惬意的环境与丧尸的尸体形成极大的反差对比。
读完上面这段你会发现一个细节 —— 反差对比是这部短片情绪的核心。
- 度假别墅 ↔ 丧尸尸体
- 机器人呆萌 ↔ 末日废墟
- 跳 MJ 舞 ↔ 战斗后死寂
3 个反差叠加在 3 分钟里,观众无法不被冲击。这是好故事的写法,不是 AI 的功劳。
[📷 配图 6:《丧尸清道夫》反差对比画面 —— 豪华别墅水磨石地面 + 散落丧尸尸体 + 跳舞的机器人]
然后他用 7 个分镜讲完了"机器人与鸵鸟相遇"这一段:
- 机器人跳着舞进入 → 听到声音吓到(绿色微笑 → 黄色害怕)
- 空镜对准吧台,画外传来悉悉簌簌声响(铺垫)
- 特写机器人发抖防御姿态
- 过肩长焦,鸵鸟从画面下方探头 → 机器人被吓
- 全景对称构图,机器人慢慢站直
- 长焦特写鸵鸟歪头吐舌
- 长焦特写机器人侧 45 度,表情从害怕切换为思考(黄 → 白)
每个镜头都明确:景别 + 构图 + 运镜手法 + 画面内容。
观众看完会觉得"这导演真懂镜头" —— 实际上 Mx-Shell 在直播里说:
“我没有完整剧本。我都是跟朋友聊了一下,简单的拍做了两个镜头看到这个质感好像还 OK,才开始想要以什么开场。我边做边想边改。”
四、几个能让你的 AI 视频立刻变好的"小技巧"
整理自他两段直播 Q&A,按实战频率排序。
1. 不要给 AI 参考图(除非画质够高)
“我所有假面骑士的战衣造型都是靠描述让 AI 自由发挥的。”
垫图最大的副作用:AI 容易复现参考图的画风(包括 CG 感、动漫感),而不是参考它的设计。
例外:参考图本身就是 3D 渲染、写实大片质感、或自己用 GPT Image 生成的高质量图。
2. 摄影机型号是质感的最大锚点
写"电影感" → 没用。
写"模拟 IMAX 胶片摄影机 + Panavision C 系列镜头 35mm f4" → 立刻变样。
3. 描述瑕疵就是描述真实
战损痕迹、磨损掉漆、关节油污、轻微面部瑕疵 —— 完美的画面 = 假的画面。
4. 给镜头加"呼吸感"
手持拍摄,全程保持极其轻微的、如呼吸般的镜头浮动,增强临场感。
一句话,AI 输出立刻像真人摄影机。
5. 抽卡是常态,不要追求一次成型
Mx-Shell 单镜头抽卡数:
- 多的可能 20 次
- 少的两三次
- 整部《丧尸清道夫》生成了 400 张图片 + 200+ 个视频镜头
“我可以同时抽着两个场景的卡,然后编写着第三个场景的词。”
把"卡"当游戏里的"抽卡"。运气好一次出,运气不好二十次出。不要怪自己提示词写得不行,是 AI 本来就有随机性。
6. 提示词违规 → 删字眼、换近义词
Seedance 2.0 对版权词敏感。钢铁侠 → 原子朋克未来主义复古风。HENSHIN → 自创音节。
7. 长视频 = 短片段 + 剪辑拼接
小云雀网页端有"生成视频后续"功能。Mx-Shell 的《合金装备》打斗段就是分两段(武器充能 + 打斗)单独生成 + 后期剪辑。
不要追求 30 秒一镜到底,抽不出来。
8. 同一颜色调,前后镜头才能拼
剪辑时最大坑:A 镜头偏暖橙,B 镜头偏冷蓝,剪在一起色差爆炸。
对策:在场景图阶段就把色调定死,所有视频提示词的"色彩与影调"段统一。
9. 没必要做 4K,720p 够了
“我的视频基本都是 720p。”
国内平台会再压缩一遍,4K 给你压成 1080p 也无所谓。省下来的算力多抽几次卡更重要。
10. 不一定要用人脸 —— 戴头盔/面具/机器人也行
“不是任何的故事非要有人脸才能创作。我近两期的作品都是这样。你为什么就是非要卡着那个人脸呢?”
机器人的好处:审核免疫 + LED 显示器演表情,比真人还灵活。这就是《丧尸清道夫》选机器人主角的真正原因。
五、他用了什么工具?
按使用频率排序:
| 用途 | 工具 |
|---|---|
| 视频生成(80%) | 小云雀里的 Seedance 2.0(不要用 Fast 版) |
| 图像生成(80%) | GPT Image |
| 图像生成(辅助) | Midjourney / Krea |
| 材质优化 | Flux Max(金属、瓷砖、皮肤细节单独过一遍) |
| 三视图 | Nanobanana |
| 文案辅助 | 豆包(打斗戏让豆包写后自己改) |
| 剪辑 | 剪映 |
| 配乐 | Artlist.io(版权音乐,不是 AI 生成) |
注意:音乐不是 AI 做的。
“音乐是本来就有的版权音乐。我整部片子下来,只有那一句配音是 AI 生成的,前面那个清理完毕的提示音都不算配音。”
六、他到底花了多少钱?
网传"10 天 3000 元"的数据流传很广,但直播里实际细节稍微复杂。
直播原文:
观众:“3000 美金怎么可能?”
Mx-Shell:“3000 美金?3000 块钱多少了?嗯,几万块了吧?是按 G2 两万多块钱了吧?”
后面又说:“3000 块钱人民币。”
合理推测:
- 作品成本 ≈ 3000 RMB(对外宣传口径)
- 实际买额度的总开销可能在 2 万 RMB 上下(算上抽卡损耗)
- 但即便按 2 万算,也仍然远低于真人拍摄 3 分钟同等质感短片的成本
10 天 + 一两万 + 一个云南中专生,做出"近年最佳短片"。
这就是 AI 这一波最值得思考的事。
七、他不是什么天才
直播里有这么几段对话,我觉得是这场直播最有价值的部分。
观众问:“你是什么专业的?”
“中专中专我中专。”
观众问:“你研究 AI 多久了?”
“今年一月份开始接触的。”
观众问:“斯皮尔伯格找你了吗?”
“斯皮尔伯格找我?哈哈想太多了。”
观众问:“好莱坞找你怎么说?”
“我跟那位 CEO 才开始聊,我们才彼此来往了三四封邮件。”
观众问:“是怎么自学的?”
“看自己摸索呗,看一下别人怎么做的,学习一下。”
观众问:“剧本灵感怎么来?”
“灵感来自机器人总动员。”
观众问:“这部片有没有完整的剧本?”
“你们看到的清道夫这个没有完整的剧本,一开始就都是你一点一点挤出来。”
他对自己没有任何吹捧。 全程都在说"我也是自学的,没怎么系统学习过",“我说的不一定对”,“建议大家学一下别的老师”。
这种朴实和自嘲,让那两个多小时直播听起来一点都不像"AI 大佬开课",更像是一个手艺人被人围着问"你这玩意儿是怎么做的",他不藏着掖着地一点一点讲出来。
“对于创作来说,设备不是重要的。想法才是最重要的。”
—— Mx-Shell
写在最后
你不需要等到 GPT-5、Sora 2、可灵 3 才开始做 AI 视频。
你需要的只是:
- 一个想法
- 一份结构化的提示词
- 接受抽卡的耐心
- 一点剪辑功底
工具都在那里。方法就是这一套。
剩下的,就是你自己愿不愿意花 10 天,把"我有个想法"做成一部完整的片子。
Mx-Shell 在直播末尾说:
“如果说真的有需要,也希望今天看了直播的朋友能够对自己有提升。包括也希望国内的这个 AI 行业 —— 不说以我为标杆,这种话不是这个意思 —— 在我今天的分享上汲取一些创新的灵感,能够帮助到大家。”
希望这篇拆解,也能帮你一点。
📦 拿走这个仓库
完整原始提示词、5 段式方法论、模板骨架、Claude Code Skill 全部归档在开源仓库:
🔗 github.com/jnMetaCode/ai-shortfilm-prompts
里面有:
- 🎬 10+ 个完整作品原始提示词(丧尸清道夫、假面骑士 ×5、卡莎 LOL 变身、环太平洋高达、合金装备打斗、赛博江湖)
- 📋 去 IP 的通用模板(15 秒变身模板 + 多分镜叙事模板 + 7 种氛围骨架)
- 🛠️ Claude Code Skill —— 输入
/shortfilm-prompt,AI 自动按 Mx-Shell 的 5 段式帮你写 - 📚 完整方法论 + 17 条实战 FAQ + 直播 Q&A
全部 MIT / CC BY-NC-SA 协议开源。原作者 Mx-Shell 全部署名。
点 ⭐ Star 不要钱,但能帮我继续做更多 AI 创作者的方法论翻译和整理 —— 后续会收录其他 AI 短片创作者的写法。
关于本文:
本文整理自 Mx-Shell 在 2026 年 5 月 12 日抖音直播的两段录屏文字版(共约 13 万字),及他在 2026 年 3 月和 5 月公开分享给粉丝的提示词文档(共约 70 个完整作品 / 段落)。原作者保留全部署名权。完整原始提示词、5 段式方法论、模板骨架、Claude Code Skill 全部归档在开源仓库:
🔗 github.com/jnMetaCode/ai-shortfilm-prompts仅做学习交流用途,不构成任何平台 / 工具的背书。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)