1. Linux 安装 ComfyUI

# 系统更新
apt update

# 安装python
apt install -y python3 python3-dev

# 更新 pip
pip install --upgrade pip

# 从 PyTorch 官方专属源安装适配 CUDA 13.0 版本的 PyTorch 核心套件 ,适用于 N 卡
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu130

# ComfyUI 专属的命令行管理工具
pip install comfy-cli

# 安装 comfy
comfy --here install

# 安装 ComfyUI-Manager 插件的专属依赖
cd ComfyUI
cd custom_nodes
cd ComfyUI-Manager
git pull # 更新 ComfyUI-Manager 插件
pip install -r requirements.txt # 安装 ComfyUI-Manager 插件自身运行所需的专属 Python 依赖包

# 启动 ComfyUI
cd ComfyUI # 注意目录,需在此目录下执行下面的命令
python main.py --listen 0.0.0.0 --port 8188 #自定义端口启动Comfy
comfy launch # 启动comfy并使用默认端口

2. 模型

1. ComfyUI 主流模型核心差异对比表

模型名称 类型 核心定位 适用场景 推理步数 显存要求 推荐输出分辨率 ComfyUI核心适配
Stable Diffusion 1.5 基础原生型 生态最成熟的2D生成基座 人像、二次元、写实等通用创作 20-50步 8G+ 512×512 / 768×768 兼容所有控图插件,LoRA资源极丰富
Stable Diffusion 2.1 基础原生型 侧重高分辨率与版权优化 专业插画、商业视觉设计 20-50步 10G+ 768×768 / 1024×1024 对提示词要求更精准,适配高分辨率出图
Stable Diffusion 3.0 基础原生型 多模态升级的新一代基座 复杂场景、多主体交互创作 15-30步 16G+ 1024×1024 / 1280×1280 支持文本+图像输入,控图精度显著提升
SDXL 基础原生型 新一代2D画质天花板 高分辨率人像、商业海报、细腻插画 20-40步 12G+ 1024×1024 / 896×1152 原生支持1024×1024,色彩与细节表现优异
SDXL Turbo 极速蒸馏型 SDXL专属极速出图模型 快速预览、批量草图、低算力设备 2-4步 8G+ 512×512 / 768×768 需搭配低CFG(0-1),负向提示效果弱
Stable Video Diffusion (SVD) 视频生成型 文本/图像转短视频模型 图像生视频、短视频剪辑 10-20步 16G+ 768×768(视频帧) 需搭配视频生成节点,支持14帧输出
Stable Video Diffusion-XT 视频生成型 SVD的增强版 长时视频生成、高帧率内容 15-25步 20G+ 1024×576(视频帧) 支持25帧输出,动态稳定性更强
AuraFlow 加速蒸馏型 多步蒸馏的平衡款模型 兼顾速度与质量的生产级创作 8-12步 10G+ 1024×1024 / 1280×1280 适配通用采样器,细节保留优于Turbo
Flux 基础原生型 新一代多模态大模型 超写实创作、复杂场景生成 10-20步 16G+ 1024×1024 / 1536×1536 支持实时交互,对提示词理解精度极高

2. 模型下载

  • 下载模型网站
    LibLibhuggingface镜像站

  • hf 下载
    在 Linux 中 hf 默认文件的保存目录~/.cache/huggingface/hub/

# 指定下载目录
hf download 模型地址 --local-dir 目录
# hf 下载如果不指定目录,默认下载目录: /root/.cache/huggingface/hub

# 示例
hf download XLabs-AI/flux-controlnet-collections --local-dir ./flux-cn-models
  • aria2 下载\
# 下载 aria2
# aria2 非必须安装,这里使用它下载模型,也可以用别的
sudo apt-get update && sudo apt-get install -y aria2

# 分块下载 + 指定文件名 + 指定下载目录
aria2c https://hf-mirror.com/XLabs-AI/flux-controlnet-collections/resolve/main/controlnet-flux.safetensors \
  --dir=./models/controlnet \          # 指定下载目录
  --out=flux-controlnet-main.safetensors \  # 指定保存的文件名
  --split=8 \                         # 分8块下载(核心分块参数)
  --max-connection-per-server=8 \     # 每个服务器最多8个连接(配合分块)
  --continue=true \                   # 断点续传(断网后可继续)
  
# 简化命令后
aria2c https://hf-mirror.com/XLabs-AI/flux-controlnet-collections/resolve/main/controlnet-flux.safetensors \
  -d ./models/controlnet \
  -o flux-controlnet-main.safetensors \
  -s 8 \
  -x 8 \
  -c
# 最简
aria2c -s 8 -x 8 -o 文件名 -d 目标路径 下载链接

aria2c -s 8 -x 8 -o Qwen-Image-2512-Lightning-8steps-V1.0-bf16.safetensors 

3. 模型合集

https://github.com/comfyanonymous/ComfyUI_examples
链接中几乎涵盖了所有模型,在模型对应的ReadMe中有模型下载路径及基本工作流(兔女郎图片拖入ComfyUI工作流)

3. ComfyUI 路径

1. 模型对应的路径(常用)

模型类型 存放目录 对应加载节点 核心作用
基础大模型(SD/SDXL) checkpoints CheckpointLoaderSimple 生成图像的核心基底模型,决定基础风格、画质
LoRA 风格微调模型 loras LoraLoader 给基础模型注入特定风格/元素(如角色、画风),局部增强
VAE 色彩编码模型 vae VAELoader 优化图像色彩、细节、通透度,替换基础模型默认 VAE
ControlNet 控制模型 controlnet ControlNetLoader 精准控制图像构图、姿态、轮廓(如 Canny/Depth/Pose 控制)
CLIP 文本/图像编码器 clip/clip_vision CLIPTextEncode/CLIPVisionEncode 将提示词、参考图转换为模型可识别的特征
超分放大模型 upscale_models ImageUpscaleWithModel 提升图像分辨率、修复细节(如 ESRGAN/Real-ESRGAN)
文本嵌入模型(Embedding) embeddings CLIPTextEncode 精准控制负面元素(如减少畸形)、强化提示词效果
Hypernetwork 风格模型 hypernetworks HypernetworkLoader 比 LoRA 更强的风格微调模型,影响范围更大

2. ComfyUI 目录

📁 ComfyUI
├── 📁 ComfyUI # ComfyUI 主要文件夹
│ ├── 📁 .git # Git 版本控制文件夹,代码版本管理用
│ ├── 📁 .github # GitHub Actions 工作流文件夹
│ ├── 📁 comfy # ComfyUI 核心代码
│ ├── 📁 comfy_extras # ComfyUI 扩展功能代码
│ ├── 📁 custom_nodes # 自定义节点(插件)目录
│ ├── 📁 input # 上传文件夹,使用如 load image 节点时图片会存储于此
│ ├── 📁 models # 模型文件配置文件夹
│ │ ├── 📁 checkpoints # 检查点大模型存放路径
│ │ ├── 📁 clip # CLIP 模型存放路径
│ │ ├── 📁 clip_vision # CLIP_vision 模型存放路径
│ │ ├── 📁 configs # 配置文件
│ │ ├── 📁 controlnet # ControlNet 模型存放路径
│ │ ├── 📁 diffusers # Diffusers 相关模型
│ │ ├── 📁 embedding # embedding 模型存放路径
│ │ ├── 📁 gligen # GLIGEN 模型
│ │ ├── 📁 hypernetworks # 超网络模型
│ │ ├── 📁 loras # Lora 模型存放路径
│ │ ├── 📁 style_models # 风格模型
│ │ ├── 📁 unet # UNet 模型
│ │ ├── 📁 upscale_models # 放大模型存放路径
│ │ ├── 📁 vae # VAE 模型存放路径
│ │ └── 📁 vae_approx # 近似 VAE 模型
│ ├── 📁 notebooks # Jupyter 笔记本相关
│ ├── 📁 user # 用户信息(如配置、工作流等)
│ │ ├── 📁 default # 默认用户文件夹
│ │ │ ├── 📁 workflow # 用户保存的 workflow 文件
│ │ │ ├── xxx.json # 用户配置文件
│ │ │ └── … # 其它配置文件
│ │ └── …[username] # 多用户时显示不同用户名
│ ├── 📁 output # 图片输出文件夹,save image 节点生成图片存储于此
│ │ ├── 📁 checkpoints # 合并模型输出路径
│ │ └── … xxx.png # 生成的图片文件
│ ├── extra_model_paths.yaml.example # 额外模型路径配置文件,去掉 .example 后缀编辑生效
│ └── … # 其它文件
├── 📁 config # 配置文件夹
├── 📁 Python_embeded # 嵌入式 Python 文件
├── 📁 update
│ ├── update.py # ComfyUI 更新脚本
│ ├── update_comfyUI.bat # 推荐使用的 ComfyUI 升级批处理命令
│ └── update_comfyui_and_python_dependencies.bat # 依赖有问题时使用的批处理命令
├── comfyui.log # 运行日志文件
├── README_VERY_IMPORTANT.txt # 重要说明文档
├── run_cpu.bat # 仅有 CPU 或 A 卡时启动 ComfyUI 的批处理文件
└── run_nvidia_gpu.bat # Nvidia 显卡启动 ComfyUI 的批处理文件

4. 插件

名称 功能 来源
ComfyUI-Chinese-Translation 汉化 git clone https://github.com/a63976659/ComfyUI-Chinese-Translation.git
ComfyUI-Lumi-Batcher 全参数自由交叉测试 git clone https://github.com/bytedance/comfyui-lumi-batcher.git
ComfyUI-Prompt-Assistant clip 提示词助手,可翻译以及使用大模型完善提示词 git clone https://github.com/yawiii/ComfyUI-Prompt-Assistant.git
ComfyUI-Align 节点对齐 git clone https://github.com/Moooonet/ComfyUI-Align.git
rgthree-comfy Image Comparer (rgthree):实现图片对比 Manger 下载
ComfyUI-Custom-Scripts PlaySound 🐍:播放声音 Manger 下载

5. 快捷键

快捷键 作用
Ctrl + B 选中节点后使用此快捷键,屏蔽当前节点,但节点的输入和输出连接点可用
Ctrl + N 选中节点后使用此快捷键,屏蔽当前节点,但节点的输入和输出连接点不可用
Ctrl + ↑ 选中要增加权重的提示词使用此快捷键,提示词会变成(big eye: 1.1),权重一般不超过1.3
Ctrl + Shift + V 粘贴时会把节点中连接点的线也一同粘贴

6. SVI 模型

Stable Value Affinity,以 SVI 为标识,基于 Wan 2.2/Flux 1.0,14B 为主,I2V/V2V 专用,LOW+HIGH 成对,FP16/FP8 量化,主打无限长、低闪烁、时序稳定的视频生成模型。
例如:
在这里插入图片描述
在使用SVI规范的模型时,如果需要使用AI生成提示词,需要让AI生成符合SVI规范模型的提示词

SVI 规范提示词(必须包含「运动时序信息」)
必须包含 4 类信息:
1. 主体是什么(不变的内容)
2. 运动方式(缓慢 / 自然 / 轻微 / 柔和)
3. 运动范围(小幅度 / 局部运动)
4. 时序约束(stable、smooth、consistent、no flicker)
例子(SVI 规范):
A girl smiling, slight and natural head movement, slow blink, smooth motion, stable video, no flicker, consistent details

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐