本地Qwen + ComfyUI 制作AI漫剧完整教程(2026最新版)

前言

AI漫剧是2026年最火的内容赛道之一——成本低、效率高、变现路径清晰。

但很多人卡在第一步:用什么工具?怎么搭建工作流?

这篇教程给你一套完全本地化、零成本、无限生成的AI漫剧解决方案:

Qwen(通义千问)负责写剧本 + 分镜
ComfyUI 负责AI绘画 + 视频合成

全程离线运行,不需要任何订阅费。一台普通电脑就能跑。


一、环境准备

1.1 硬件要求(最低配置)

组件 最低要求 推荐配置
显卡 GTX 1660 (6GB显存) RTX 4060 (8GB+)
内存 16GB 32GB
硬盘 50GB 可用空间 100GB SSD
CPU 4核 6核+

没有独显? 可以用 Qwen3-8B-Q4 量化版,纯CPU也能跑(速度慢一些)。

1.2 安装 Ollama(本地运行 Qwen)

# Windows / macOS 一键安装
# 访问 https://ollama.com 下载安装包

# 安装完成后,拉取 Qwen3 模型
ollama pull qwen3:8b
ollama pull qwen3:32b   # 有条件的话装32B,效果显著更好

验证安装:

ollama list
# 应该看到 qwen3:8b

二、安装 ComfyUI(AI绘画引擎)

2.1 安装 ComfyUI

# 克隆 ComfyUI 仓库
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

# 创建虚拟环境
python -m venv venv

# 安装依赖
pip install -r requirements.txt

# 启动
python main.py

启动成功后,浏览器访问 http://127.0.0.1:8188

2.2 安装必需插件

在 ComfyUI 的 custom_nodes 目录安装以下插件:

cd custom_nodes

# 必装:ComfyUI-Manager(插件管理)
git clone https://github.com/ltdrdata/ComfyUI-Manager.git

# 必装:图片放大
git clone https://github.com/ssitu/ComfyUI_UltimateSDUpscale.git

# 可选:视频生成(需要额外显存)
git clone https://github.com/FizzleDorf/ComfyUI_FizzleDorf_CustomNodes.git

重启 ComfyUI。


三、用 Qwen 生成漫剧剧本 + 分镜

3.1 剧本 Prompt 模板

在 Ollama 里运行 Qwen,使用以下 Prompt:

你是一个专业漫剧编剧。请为一个3分钟的AI漫剧生成完整方案:

【题材】:都市修仙
【主角】:林辰,25岁,意外获得600年修仙记忆
【核心冲突】:现代职场 vs 修仙能力

请输出:
1. 3分钟漫剧的完整剧本(分5个场景)
2. 每个场景的分镜描述(用于AI绘画)
3. 每个分镜的 Stable Diffusion Prompt(中文描述)

格式:
## 场景1:标题
- 剧本台词:
- 分镜描述:
- SD Prompt:

3.2 示例输出(场景1)

## 场景1:醒来的修仙者
- 剧本台词:
  林辰睁开眼,天花板上的LED灯刺得他眯起眼。
  "我...不是在渡劫吗?"
  手机屏幕亮起:2066年6月8日。

- 分镜描述:
  近景,25岁男性从床上惊醒,冷汗浸湿头发,
  手机屏幕发出冷光,背景是简陋的单间出租屋。

- SD Prompt:
  一个25岁的中国青年男性,黑色短发,惊醒表情,
  躺在简陋的单人床上,昏暗房间,手机屏幕发光,
  赛博朋克风格,电影级打光,细节丰富,8K

3.3 批量生成所有分镜提示词

让 Qwen 把5个场景、每个场景3-5个分镜,全部生成 SD Prompt,保存为 prompts.txt


四、ComfyUI 批量生成漫剧图片

4.1 加载漫剧工作流

下载预置的漫剧工作流 JSON(或手动搭建):

核心节点连接

Checkpoint加载器(选择动漫模型,如 CounterfeitXL)
    ↓
正向Prompt输入(从 prompts.txt 读取)
    ↓
KSampler(采样设置:Steps=30, CFG=7)
    ↓
VAE解码
    ↓
保存图片(输出到 output/comic/)

4.2 推荐漫剧模型(Checkpoint)

模型名 风格 下载地址
CounterfeitXL 日系动漫 Civitai 搜索 “Counterfeit XL”
Cetus-Mix 写实动漫 Civitai 搜索 “Cetus Mix”
Animagine XL V3.1 高质量二次元 HuggingFace 免费下载

4.3 批量生成脚本

# batch_generate.py
import requests
import json

# 读取 Qwen 生成的所有 Prompt
with open('prompts.txt', 'r', encoding='utf-8') as f:
    prompts = f.read().split('---')

# 调用 ComfyUI API 批量生成
for i, prompt in enumerate(prompts):
    payload = {
        "prompt": prompt.strip(),
        "negative_prompt": "低质量, 模糊, 变形, 水印",
        "steps": 30,
        "cfg_scale": 7,
        "width": 1024,
        "height": 576  # 16:9 横屏,适合视频
    }
    
    response = requests.post(
        "http://127.0.0.1:8188/prompt",
        json={"prompt": build_comfyui_workflow(payload)}
    )
    print(f"分镜 {i+1}/{len(prompts)} 已提交")

五、图片转视频(可选进阶)

如果你有更高显存(RTX 4070+),可以用以下工具把静态漫剧图片转成动态视频:

5.1 方案A:AnimateDiff(ComfyUI插件)

cd ComfyUI/custom_nodes
git clone https://github.com/ArtVentureX/comfyui-animatediff.git

在 ComfyUI 里加入 AnimateDiff 节点,输入漫剧图片,输出 3-5 秒动态视频片段。

5.2 方案B:调用线上API(省显存)

# 使用 Qwen-Image 或即梦AI 的图片转视频API
import requests

def image_to_video(image_path, prompt):
    # 即梦AI API 示例
    with open(image_path, 'rb') as f:
        response = requests.post(
            "https://api.jimeng.jianying.com/v1/video/generate",
            headers={"Authorization": f"Bearer {API_KEY}"},
            files={"image": f},
            data={"prompt": prompt, "duration": 3}
        )
    return response.json()["video_url"]

六、后期剪辑:拼成完整漫剧

6.1 工具选择

工具 优点 适合人群
剪映 免费、中文、AI配音 初学者推荐
CapCut 剪映国际版 需英文字幕
Adobe Premiere 专业级 有剪辑经验

6.2 剪辑流程

  1. 导入所有分镜图片/视频片段
  2. 添加AI配音(剪映内置「文本朗读」→ 选择「情感男声/女声」)
  3. 添加背景音乐(推荐:剪映版权音乐库)
  4. 添加字幕(「文本」→「识别字幕」自动生成)
  5. 导出:1080P,MP4格式

七、常见问题 FAQ

Q1:显存不够怎么办?

A:用 Qwen3-8B-Q4 量化版 + 降低 ComfyUI 出图分辨率到 768×432。

Q2:生成的图片人物不一致?

A:使用 LoRA 角色固定技术,或 ComfyUI 的「角色一致性插件」(IP-Adapter)。

Q3:Qwen 写的分镜不够详细?

A:在 Prompt 里加:「每个分镜描述不少于100字,包含人物表情、动作、背景细节」。

Q4:ComfyUI 工作流太复杂?

A:去 ComfyUI Workflow Share 下载现成的漫剧工作流 JSON,直接加载。

Q5:如何变现?

A:抖音/快手/B站发布 → 开通创作收益 → 接定制漫剧广告 → 出售 Prompt 模板。


八、总结

这套工作流的完整链路:

Qwen写剧本分镜 → ComfyUI批量出图 → 
(可选)AnimateDiff转视频 → 剪映剪辑成片

成本:0 元(全部本地运行)
时间:30分钟出一部3分钟漫剧
上限:取决于你的创意和批量运行时间

2026年是AI漫剧的红利期,趁现在门槛还低,赶紧上手。


参考链接


本文基于抖音博主「AI绘画毛弈老师」2026年6月6日视频内容整理,结合社区最佳实践补充。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐