重构AI视频工作流：Qwen3.5-Omni拉片Skill全流程解析（附提示词）

may1992heihei

1131人浏览 · 2026-04-06 11:22:26

may1992heihei · 2026-04-06 11:22:26 发布

大家好，我是AI培训韩老师！

有没有那么一个时刻，刷到一个超燃的AI视频，画面、节奏、运镜都完美到离谱。你盯着屏幕研究了半小时，脑子里只有三个字：怎么做到的？

你尝试去拆解它的提示词，但看来看去也只能看懂"a beautiful landscape"这种基本款。剩下的，全是咱看不懂的高级活。

怎么办？

阿里刚开源了一个叫 Qwen3.5-Omni 的模型。它能直接看懂你的视频，然后把它"反推"成完整的提示词。

也就是说——

你不再需要去猜别人的提示词了。你可以让AI帮你"逆向工程"。在此之前只有google gemini可以实现，而如今国内也实现了突破。

其实这个过程有个很技术的名字——拉片。

什么是拉片？

“拉片”是一种深度、细致地分析电影（或电视剧）的方法。它就像用放大镜一帧一帧、一场戏一场戏地研究影片，目的是拆解和领悟主创的创作意图、叙事技巧、视听语言和情感调动方式。

简单来说，拉片不是普通的“看电影”，而是带着明确目的去“解构”电影，是影视爱好者、学生、编剧、导演等从业者学习和提升创作能力的重要工具。

01｜反推视频提示词：它是怎么创作的？

实测案例

我在网上找了汤臣倍健那个品牌宣传片《敢探极镜》，把这个视频上传到 Qwen3.5-Omni，打字告诉它：

"完整看一遍视频，把每一个分析叙事结构，视听语言，主角的表情、情感，主题全部都罗列出来，告诉我每一秒的变化。"

当然，你也可以从专业角度拉片

叙事与结构分析：

分析“电影没讲的内容”。例如在《药神》拉片中，通过分析一场戏“为什么这么短”，来推理主创的取舍如何避免情节重复、优化节奏、服务整体情绪。
分析“信息节拍”和视角切换。例如在《危情时速》拉片中，指出因为事件集中，所以通过增加视角（切换场景）来拓展叙事宽度。
识别故事类型。例如在《猩球崛起》拉片中，讨论其属于“金羊毛”型（有明确目标）还是“被制度化”型（想融入又想逃离）。

视听语言分析：

场面调度：分析场景、人物运动、摄影机运动如何共同表意。例如，走向高处或摄影机上升常寓意“提升与光明”；反之则寓意“否定与困境”。
剪辑：分析蒙太奇风格。多调度、多剪辑通常更戏剧化、更奇幻；而长镜头（一镜到底）则更纪实、更现实。
色彩与光影：分析色彩如何象征情绪、阶层或心理。例如在《小丑》拉片中，黄色出租车和衣物被解读为“理性”的象征；在《繁花》拉片中，冷暖色调用于区分回忆与现实、不同的人物情绪。

角色与主题分析：

分析人物弧光、欲望、以及人物关系如何推动剧情。
挖掘影片的社会隐喻和深层主题。例如《寄生虫》拉片分析了阶级固化；《小偷家族》拉片探讨了非血缘家庭与社会边缘人群。

然后它给了我什么？

一份逐帧的详细解析。

看到这一幕的我真的惊叹不已

wxv_4457333803585634305

这意味着什么？

意味着以后你看到任何喜欢的AI视频，都可以这样"偷师"——让它帮你分析，帮你反推，然后你自己改一改、换个风格，就是你自己的作品了。

过去那种"看了半天学不会"的无力感，终于结束了。

不，只是反推还不够，还得精准复刻！

02｜根据拉片文本，反推关键帧图片提示词

提示词：我是一个AI视频创作者。我需要做一个简单的网页工具，叫'关键帧提示词生成器'。界面要有一个文本上传区，下面有一个'生成关键帧提示词'按钮。点击后，调用你的逻辑，分析视频结构，输出一段包含主体+背景+视角+光影+风格+氛围的关键帧提示词。关键帧组合后能完整复现原视频，风格要暗黑堕落风，背景用深灰，按钮用暗金色。请直接给我完整的 HTML/CSS/JS 代码，我要能直接在浏览器打开运行。示例文本“XXX”

把上一步生成的拉片文本作为示例给他，吭哧吭哧开始干活了

下载应用网页，以浏览器打开，提示词就这么出了，我去生成看看效果

图片生成

还别说，真的有那味了

批量生成，效果也不赖

03｜反推图片提示词：90%的还原度

视频能反推，图片就更不在话下。

直接截取视频中的关键帧反推

"请你详细描述这张图的文生图提示词，非常详细的描述出来所有关键参数"

它给我返回了一套完整的提示词。

我把这套提示词原封不动生成图片

原图

Qwen出图

生成的图，和原图的相似度，至少90%。除了色彩上更亮，根本看不出来差异，好牛！

不管是配色、材质感、光影走向，还是构图逻辑，全部对得上。

这是什么概念？

以前你看到一张特别美的AI图，你想知道它怎么生成的——你只能靠猜。

现在不需要了。直接甩给Qwen3.5-Omni，它会告诉你每一个参数。

你甚至可以直接拿这套提示词去改、去迭代、去批量生成同类型的图。

它就是一个会自动拆解的提示词库。

04 ｜反推分镜9宫格

我们发现仅靠一些关键帧还无法完全生成一个完整的视频，需要更加丰富，我们就生成九宫格分镜，让画面更加丰富，连贯

帮我制作一个可以按照这样的格式生成。根据一张或者多张参考图写分镜的网页。我的要求很简单，可以根据上传的图片反推场景提示词可以选择不同的分镜的景别，最后生成的提示词要有中英文切换按钮”

根据[xxxxxxxxxx]，生成一张具有凝聚力的[3x3]网格图像，包含在同一环境中的[9]个不同摄像机镜头，严格保持人物/物体、服装和光线的一致性，[8K]分辨率，[16:9]画幅。

镜头01:

镜头02:

镜头03:

镜头04:

镜头05:

镜头06:

镜头07:

镜头08:

镜头09:“

然后生成九宫格图片

我接入了nano banana模型，效果更加真实

也可以用我之前讲过的九宫格提示词：

帮我以这张图作为基础，生成一个3X3的9宫格分镜，9宫格分镜在一张图上，不同景别。展示这个场景下不同角度的完整故事，生成的图片画风与参考图保持一致，探索极镜主题，写实风格，不同角度，充满美感，比例16:9。

05 ｜九宫格图片拆分

提示词：

帮我制作一个可以把九宫格图片或者任何拼图拆分成单张图片的网页，要有上传跟下载图片的按钮。增加批量处理批量上传和批量打包下载的功能

分分钟生成好了

单独下载了这一张，真的不错哟！

06｜9宫格视频提示词生成网站

提示词示例：

学习下列提示词结构，生成一个分析九宫格图片，输出九宫格转视频的提示词生成网站应用，提示词示例“生成一个时尚的视频,展示一款亮粉色无线耳机产品在多个场景中的使用。视频中是一位穿着黑色皮夹克和白色T恤的年轻亚洲女性。场景1 (0-3秒): 女性走进一个宽敞明亮的工业风格房间,有大窗户。她走向一张桌子上放置的粉色耳机。摄像机缓慢推进,聚焦在桌上的耳机上。场景2 (3-6秒): 女性从桌子上拿起耳机,仔细检查。特写镜头展示耳机的细节——耳罩、连接线和端口。粉色在中性背景上非常抢眼。场景3 (6-9秒): 女性戴上耳机。她闭上眼睛微笑,享受音乐。她的表情显示出放松和满足。摄像机从不同角度捕捉她的动作。场景4 (9-12秒): 女性背对镜头,戴着耳机,在繁华的城市街道上行走,背景是高层建筑。她自信地走着,展示耳机在户外城市环境中的使用。视频应该具有现代时尚的美学风格,摄像机运动流畅。光线明亮自然,突出耳机的鲜艳粉色。包含音乐播放的细微音效。整体氛围应该是充满活力、时尚和有抱负的,突出产品的设计和生活方式吸引力。”

得到了提示词：

15 秒极地破冰船主题视频描述提示词

生成一个震撼的 15 秒纪实风格视频，展示红色极地破冰船在北极冰原航行的壮阔场景，全程保持船只主体、极地环境风格统一，镜头衔接流畅，氛围感拉满。

场景 1 (0-3 秒)：远景镜头，红色破冰船航行在布满浮冰的极地海域，远处是覆雪的山脉，阴沉的天空透出黄昏的暖光，船只破开冰面，留下航行的尾迹，镜头缓慢推进，展现极地的辽阔与船只的坚毅。
场景 2 (3-6 秒)：中近景特写，破冰船船头猛烈撞击厚重冰层，冰屑飞溅、浪花翻涌，镜头跟随船头的冲击动作，捕捉船只破冰的力量感，船体的锈迹与冰面的洁白形成强烈视觉对比。
场景 3 (6-9 秒)：驾驶舱视角，船员们身着防寒服，站在船舷边眺望冰原，镜头从船员身后缓缓扫过，展现他们眼前的极地盛景，背景是连绵的雪山与破碎的冰面，传递出探险的使命感。
场景 4 (9-12 秒)：甲板跟拍镜头，船员们在积雪覆盖的甲板上作业，镜头环绕拍摄船只的细节 —— 结冰的救生艇、布满霜雪的栏杆、运转的机械，展现极地航行的真实工作场景，氛围冷峻而充满力量。
场景 5 (12-15 秒)：高空俯拍镜头，红色破冰船在碎裂的冰原中开辟出航道，船只如同冰海中的红色巨兽，镜头拉远，完整呈现船只在极地冰原中的航行姿态，收尾定格在壮阔的极地全景中。

视频采用写实纪实摄影风格，8K 超高清画质，画面冷调为主，保留极地的真实光影质感，镜头运动自然流畅，搭配冰面碎裂、船只轰鸣的环境音效，整体氛围壮阔、冷峻，充满极地探险的史诗感，突出破冰船的力量感与极地的极致风光。

使用seedance生成视频，看看效果

wxv_4457336786909757440

07 ｜封装skill

既然完成了从拉片-分镜提示词-分镜图-分镜九宫格-分镜视频制作的全流程，如果我们能将整个过程封装起来，然后加入对应的工具API，不就是一个完整的skill

我将这个想法给了我的腾讯虾，不出意料，skill真的出来了，太牛了实在是

有了这个过程，以后所有的经验都可以转化为持续生产力了

08｜写在最后

Qwen3.5-Omni 这个模型，原生支持文本、图像、音频、视频四大模态。

它不仅能理解你给它的内容，还能实时响应你的语音和摄像头输入。

使用地址：https://chat.qwen.ai/

重点是：开源、免费、人人能用的。

但我想提醒你一句：

当所有人都在用同一套工具的时候，信息差本身就是最大的竞争力。

未来的AI视频赛道，拼的不再是谁的提示词写得长、谁的插件装得多。

拼的是——谁的审美更独特，谁的叙事更有张力，谁能更快地把脑海中的画面变成现实。

当你还在手动逐帧调光影，别人已经通过逆向工程复刻了顶级大片的质感。

赶紧实操起来吧！我将本文的所有流程提示词、对应的应用网站代码、skill都整理好了，有需要的朋友回复【拉片】即可领取。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

直播预约｜鸿蒙 PC AI 编译框架实战：高效搞定开源库迁移适配

AtomGit开源社区

G-Star 精选开源项目推荐｜第十九期

BuildAdmin 是一个基于 Vue 3、ThinkPHP 6、TypeScript、Vite、Pinia 和 Element Plus 的后台管理系统，面向中后台业务系统快速开发场景。项目提供可视化 CRUD 代码生成、权限管理、Web 终端、数据回收站、字段级修改保护等能力，帮助开发者减少重复后台开发工作。对于需要快速搭建管理后台、业务配置台或二开系统的团队来说，它提供了一套相对完整的工程