1.  一百二十分钟电影级制作所需的完整节点清单

7.1 第一阶段:基础生成核心(15个节点)

序号

节点类型

功能说明

1

Load Checkpoint

加载大模型底模

2

Load VAE

加载外置VAE

3

CLIP Text Encode

编码正面提示词

4

CLIP Text Encode Neg

编码负面提示词

5

Empty Latent Image

创建空白潜空间画布

6

KSampler

采样生成图像

7

VAE Decode

潜空间解码为图像

8

Save Image

保存生成图像

9

Preview Image

预览图像

10

Load LoRA

加载LoRA微调模型

11

LoraLoader

应用LoRA到模型

12

Load Embedding

加载文本嵌入

13

Load Upscale Model

加载图像放大模型

14

Upscale Image

图像超分辨率

15

Image Resize

调整图像分辨率

7.1.1 Load Checkpoint 节点详解

节点外观

元素

说明

顶部标题

LOAD CHECKPOINT(可折叠)

下拉菜单

选择 .safetensors 或 .ckpt 模型文件

三个输出端

MODEL(模型权重)、CLIP(文本编码器)、VAE(图像编解码)

连接点

实心圆点,可拖拽连线到其他节点

功能介绍

属性

说明

核心作用

加载 Stable Diffusion / Flux / SDXL 等大模型的完整权重文件

输出拆分

将完整 Checkpoint 拆分为三个独立组件,供下游节点灵活调用

文件格式

.safetensors(推荐,安全快速)/ .ckpt(旧格式,有安全风险)

存放路径

ComfyUI/models/checkpoints/

内存占用

加载后常驻显存/内存,直到工作流结束或手动释放

三个输出详解

输出端

数据类型

用途

典型连接目标

MODEL

U-Net/DiT 模型

核心去噪网络,决定图像生成质量

KSampler 的 model 输入

CLIP

文本编码器

将提示词转换为语义向量

CLIP Text Encode 的 clip 输入

VAE

变分自编码器

潜空间与像素空间转换

VAE Decode / VAE Encode 的 vae 输入

最小流程结构(7 节点,SD 1.5,4GB 显存可运行)

节点清单与参数

序号

节点

参数设置

1

Load Checkpoint

选择 v1-5-pruned-emaonly.safetensors

2

CLIP Text Encode

输入 "a cat",连接 Load Checkpoint.CLIP

3

CLIP Text Encode

输入 "lowres, blurry",连接 Load Checkpoint.CLIP

4

Empty Latent Image

宽 512,高 512,批次 1

5

KSampler

步数 20,CFG 7,采样器 euler,调度器 normal

6

VAE Decode

连接 Load Checkpoint.VAE

7

Save Image

默认文件名前缀

连线颜色说明

颜色

数据类型

本案例中的连线

紫色

MODEL

Load Checkpoint.MODEL → KSampler.model

黄色

CLIP

Load Checkpoint.CLIP → CLIP Text Encode.clip

橙色

VAE

Load Checkpoint.VAE → VAE Decode.vae

浅绿色

CONDITIONING

CLIP Text Encode.CONDITIONING → KSampler.positive/negative

粉红色

LATENT

Empty Latent Image.LATENT → KSampler.latent_image → VAE Decode.samples

浅蓝色

IMAGE

VAE Decode.IMAGE → Save Image.images

常用技巧

技巧

说明

模型切换

下拉菜单实时切换,无需重启 ComfyUI

显存不足

使用 GGUF 量化版或 FP8 版本

VAE 外置

若 Checkpoint 内置 VAE 效果差,可用 Load VAE 单独加载

CLIP 跳过层

部分模型需设置 CLIP skip: 2(SD 1.5 动漫模型常见)

模型缓存

首次加载慢,后续同模型复用快

多模型对比

用 Switch 节点或并行多个 Load Checkpoint 对比效果

一句话总结

Load Checkpoint 是 ComfyUI 的心脏——它把 2GB–23GB 的 AI 模型载入内存,拆分为 MODEL/CLIP/VAE 三条动脉,供养整个生成流程。最小只需 SD 1.5 pruned(2GB,4GB显存) 就能跑通你的第一张 AI 图片,是入门的第一块敲门砖。

好的,我逐个详细列出这14个节点。先从 Load VAE 开始:

7.1.2  Load VAE

节点外观

节点介绍

属性

说明

核心作用

加载独立的 VAE(变分自编码器)模型,替代或补充 Checkpoint 内置的 VAE

使用场景

Checkpoint 内置 VAE 色彩发灰/发暗时,外置高质量 VAE 改善效果

文件格式

.safetensors / .pt / .ckpt

存放路径

ComfyUI/models/vae/

与 Load Checkpoint 的关系

Checkpoint 通常内置 VAE,但 Load VAE 可覆盖,优先级更高

最小完整流程结构(外置 VAE 替换内置 VAE)

与内置 VAE 的对比流程

方式

结构

效果

内置 VAE

Checkpoint.VAE → VAE Decode.vae

默认,可能色彩一般

外置 VAE

Load VAE.VAE → VAE Decode.vae

色彩更鲜艳,细节更好

常用外置 VAE 推荐

VAE 名称

适用底模

特点

vae-ft-mse-840000-ema-pruned

SD 1.5

社区最常用,色彩饱和,面部改善

ClearVAE

SD 1.5 / SDXL

清晰度强,画面通透

BlessedVAE

SD 1.5

色彩鲜艳,二次元首选

SDXL VAE

SDXL

官方配套,修复发灰问题

ae.safetensors

Flux

Flux 官方 VAE,必须外置

7.1.3  CLIP Text Encode

节点外观

节点介绍

属性

说明

核心作用

将人类文本提示词编码为 CLIP 模型可理解的语义向量(CONDITIONING)

输入

clip(CLIP 模型实例)、text(字符串提示词)

输出

CONDITIONING(条件向量,引导扩散模型生成方向)

使用方式

通常成对使用:一个正面提示词(想要的内容),一个负面提示词(排除的内容)

提示词技巧

质量词前置(masterpiece, best quality),描述词具体,逗号分隔

最小完整流程结构(正面提示词)

7.1.4  CLIP Text Encode Neg(负面提示词)

节点外观

节点介绍

属性

说明

核心作用

与正面 CLIP Text Encode 完全相同,只是输入负面提示词,告诉模型不要生成什么

本质

同一个节点类型,只是用途不同,ComfyUI 中通常拖出两个实例分别连接 positive 和 negative

负面提示词作用

抑制低质量、畸形、水印、模糊等不良元素

必备负面词

EasyNegative、badhandv4、lowres、bad anatomy

最小完整流程结构(正负提示词配对)

7.1.5  Empty Latent Image

节点外观

节点介绍

属性

说明

核心作用

创建一张空白的潜空间(Latent Space)图像,作为 KSampler 的起始噪声画布

本质

纯随机噪声,经过 KSampler 逐步去噪后变成有意义的图像

width/height

必须是 8 的倍数(64×64 潜空间块),常用 512、768、1024

batch_size

一次生成几张图,显存允许可加大

与 VAE 的关系

潜空间分辨率 = 像素分辨率 ÷ 8(如 512×512 像素 = 64×64 潜空间)

最小完整流程结构

7.1.6  KSampler

节点外观

节点介绍

属性

说明

核心作用

扩散模型的核心采样器,将潜空间噪声逐步去噪为有意义图像

model

接收 Load Checkpoint 的 MODEL,提供去噪网络

positive/negative

接收 CONDITIONING,引导生成方向(要/不要)

latent_image

起始潜空间,通常是 Empty Latent Image 的随机噪声

seed

随机种子,相同种子+相同参数=相同结果

steps

采样步数,越多细节越丰富但越慢(20–50 常用)

cfg

Classifier-Free Guidance,提示词遵循强度(7–12 常用)

sampler_name

采样算法(euler、euler_ancestral、dpmpp_2m 等)

scheduler

噪声调度策略(normal、karras、simple 等)

denoise

去噪强度,1.0=完全从噪声生成,<1.0=保留部分原图(图生图)

采样器选择参考

采样器

特点

适用场景

euler

稳定快速,基础首选

日常生成

euler_ancestral

有随机性,细节丰富

创意探索

dpmpp_2m

质量高,收敛好

最终输出

dpmpp_sde

随机性强,艺术感

风格化

uni_pc

步数少质量好

快速出图

最小完整流程结构

7.1.7. VAE Decode

节点外观

节点介绍

属性

说明

核心作用

将 KSampler 生成的潜空间图像解码为可见的像素图像

samples

接收 KSampler 输出的 LATENT(潜空间数据)

vae

接收 VAE 模型(内置或外置),执行解码

本质

压缩/解压过程:像素 → 潜空间(编码)→ 像素(解码)

输出

IMAGE(RGB 像素图像,可直接预览或保存)

最小完整流程结构

7.1.8  Save Image

节点外观

节点介绍

属性

说明

核心作用

保存生成的图像到磁盘,并在界面显示预览

images

接收 IMAGE 数据(来自 VAE Decode 或 Upscale)

filename_prefix

文件名前缀,自动追加序号和时间戳

输出路径

ComfyUI/output/

预览功能

节点内直接显示缩略图,右键可查看大图

格式

自动保存为 PNG(无损)

7.1.9  Preview Image

节点外观

节点介绍

属性

说明

核心作用

仅预览图像,不保存到磁盘

与 Save Image 的区别

Preview 只看不存,Save 既看又存

使用场景

调试阶段快速查看效果,确认后再用 Save Image

内存占用

预览图缓存在内存中,大量预览可能占内存

Save Image vs Preview Image 对比

特性

Save Image

Preview Image

保存到磁盘

✅ 是

❌ 否

界面显示

✅ 是

✅ 是

适用阶段

最终输出

调试预览

文件管理

自动编号,可回溯

无文件,只看当前

性能开销

磁盘 I/O

内存占用

7.1.10  Load LoRA

节点外观

节点介绍

属性

说明

核心作用

加载 LoRA(Low-Rank Adaptation)轻量级微调模型

lora_name

选择 .safetensors 格式的 LoRA 文件

strength_model

LoRA 对模型权重的影响强度(0=无效果,1=满效果,>1可能过拟合)

strength_clip

LoRA 对 CLIP 文本编码器的影响强度(通常与 model 相同)

输出

MODEL(叠加后的模型)、CLIP(叠加后的编码器)、LORA(原始 LoRA 权重)

存放路径

ComfyUI/models/loras/

与 Checkpoint 的关系

LoRA 必须依附于 Checkpoint,不能单独使用

最小完整流程结构(单 LoRA)

7.1.11  LoraLoader

节点外观

节点介绍

属性

说明

核心作用

与 Load LoRA 功能相同,但输入接口不同——接收上游的 MODEL 和 CLIP,输出叠加后的 MODEL 和 CLIP

与 Load LoRA 的区别

LoraLoader 需要上游输入,适合链式叠加多个 LoRA;Load LoRA 直接读取 Checkpoint,适合单 LoRA

典型用法

多个 LoRA 串联:Checkpoint → LoraLoader1 → LoraLoader2 → KSampler

strength 范围

通常 0.3–1.0,多个 LoRA 叠加时建议各自降低

最小完整流程结构(多 LoRA 串联)

7.1.12  Load Embedding

节点外观

节点介绍

属性

说明

核心作用

加载文本嵌入(Textual Inversion),将复杂概念压缩为单个关键词

本质

一组训练好的向量,代表特定视觉概念(风格、人物、负面特征)

使用方式

在提示词中写触发词(如 EasyNegative),自动调用嵌入

文件格式

.pt / .safetensors / .bin

存放路径

ComfyUI/models/embeddings/

与 LoRA 的区别

Embedding 只影响文本编码,不改变模型权重;LoRA 改变模型权重

最小完整流程结构(负面 Embedding)

注:Embedding 的触发词直接写在文本框中,无需额外节点连接。

7.1.13. Load Upscale Model

节点外观

节点介绍

属性

说明

核心作用

加载图像超分辨率模型(Upscaler),用于放大图像并补充细节

模型类型

ESRGAN、SwinIR、RealESRGAN 等

文件格式

.pth / .safetensors

存放路径

ComfyUI/models/upscale_models/

与 Checkpoint 的区别

Upscale 模型只负责放大,不参与生成

常用模型

模型

放大倍数

特点

RealESRGAN_x4plus

写实照片首选

RealESRGAN_x4plus_anime_6B

动漫/插画专用

4x-UltraSharp

锐化效果强

SwinIR

2×/4×

艺术图全局感知好

7.1.14  Upscale Image

节点外观

节点介绍

属性

说明

核心作用

使用加载的超分模型,将低分辨率图像放大为高分辨率

image

输入待放大的图像

upscale_model

接收 Load Upscale Model 加载的模型

输出

IMAGE(放大后的高清图像)

特点

纯像素级算法放大,速度快,不改变内容

最小完整流程结构(生成 + 放大)

7.1.15  Image Resize

节点外观

节点介绍

属性

说明

核心作用

调整图像分辨率,支持放大和缩小

与 Upscale Image 的区别

Image Resize 是简单缩放(可能模糊),Upscale Image 是 AI 超分(补充细节)

interpolation

插值算法:nearest-exact(精确最近邻)、bilinear(双线性)、area(区域平均)

使用场景

匹配模型输入尺寸、调整构图比例、批量统一分辨率

最小完整流程结构

完整串联:从生成到超分的完整工作流

一句话总结

这14个节点是ComfyUI的"基础语法"——Load Checkpoint 是主语,CLIP Text Encode 是谓语,KSampler 是动词,VAE Decode 是宾语,Save Image 是句号。掌握它们,你就能写出第一句完整的"AI图像句子"。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐