Comfyui 教程-20
- 一百二十分钟电影级制作所需的完整节点清单
7.1 第一阶段:基础生成核心(15个节点)
|
序号 |
节点类型 |
功能说明 |
|
1 |
Load Checkpoint |
加载大模型底模 |
|
2 |
Load VAE |
加载外置VAE |
|
3 |
CLIP Text Encode |
编码正面提示词 |
|
4 |
CLIP Text Encode Neg |
编码负面提示词 |
|
5 |
Empty Latent Image |
创建空白潜空间画布 |
|
6 |
KSampler |
采样生成图像 |
|
7 |
VAE Decode |
潜空间解码为图像 |
|
8 |
Save Image |
保存生成图像 |
|
9 |
Preview Image |
预览图像 |
|
10 |
Load LoRA |
加载LoRA微调模型 |
|
11 |
LoraLoader |
应用LoRA到模型 |
|
12 |
Load Embedding |
加载文本嵌入 |
|
13 |
Load Upscale Model |
加载图像放大模型 |
|
14 |
Upscale Image |
图像超分辨率 |
|
15 |
Image Resize |
调整图像分辨率 |
7.1.1 Load Checkpoint 节点详解
节点外观

|
元素 |
说明 |
|
顶部标题 |
LOAD CHECKPOINT(可折叠) |
|
下拉菜单 |
选择 .safetensors 或 .ckpt 模型文件 |
|
三个输出端 |
MODEL(模型权重)、CLIP(文本编码器)、VAE(图像编解码) |
|
连接点 |
实心圆点,可拖拽连线到其他节点 |
功能介绍
|
属性 |
说明 |
|
核心作用 |
加载 Stable Diffusion / Flux / SDXL 等大模型的完整权重文件 |
|
输出拆分 |
将完整 Checkpoint 拆分为三个独立组件,供下游节点灵活调用 |
|
文件格式 |
.safetensors(推荐,安全快速)/ .ckpt(旧格式,有安全风险) |
|
存放路径 |
ComfyUI/models/checkpoints/ |
|
内存占用 |
加载后常驻显存/内存,直到工作流结束或手动释放 |
三个输出详解
|
输出端 |
数据类型 |
用途 |
典型连接目标 |
|
MODEL |
U-Net/DiT 模型 |
核心去噪网络,决定图像生成质量 |
KSampler 的 model 输入 |
|
CLIP |
文本编码器 |
将提示词转换为语义向量 |
CLIP Text Encode 的 clip 输入 |
|
VAE |
变分自编码器 |
潜空间与像素空间转换 |
VAE Decode / VAE Encode 的 vae 输入 |
最小流程结构(7 节点,SD 1.5,4GB 显存可运行)

节点清单与参数
|
序号 |
节点 |
参数设置 |
|
1 |
Load Checkpoint |
选择 v1-5-pruned-emaonly.safetensors |
|
2 |
CLIP Text Encode |
输入 "a cat",连接 Load Checkpoint.CLIP |
|
3 |
CLIP Text Encode |
输入 "lowres, blurry",连接 Load Checkpoint.CLIP |
|
4 |
Empty Latent Image |
宽 512,高 512,批次 1 |
|
5 |
KSampler |
步数 20,CFG 7,采样器 euler,调度器 normal |
|
6 |
VAE Decode |
连接 Load Checkpoint.VAE |
|
7 |
Save Image |
默认文件名前缀 |
连线颜色说明
|
颜色 |
数据类型 |
本案例中的连线 |
|
紫色 |
MODEL |
Load Checkpoint.MODEL → KSampler.model |
|
黄色 |
CLIP |
Load Checkpoint.CLIP → CLIP Text Encode.clip |
|
橙色 |
VAE |
Load Checkpoint.VAE → VAE Decode.vae |
|
浅绿色 |
CONDITIONING |
CLIP Text Encode.CONDITIONING → KSampler.positive/negative |
|
粉红色 |
LATENT |
Empty Latent Image.LATENT → KSampler.latent_image → VAE Decode.samples |
|
浅蓝色 |
IMAGE |
VAE Decode.IMAGE → Save Image.images |
常用技巧
|
技巧 |
说明 |
|
模型切换 |
下拉菜单实时切换,无需重启 ComfyUI |
|
显存不足 |
使用 GGUF 量化版或 FP8 版本 |
|
VAE 外置 |
若 Checkpoint 内置 VAE 效果差,可用 Load VAE 单独加载 |
|
CLIP 跳过层 |
部分模型需设置 CLIP skip: 2(SD 1.5 动漫模型常见) |
|
模型缓存 |
首次加载慢,后续同模型复用快 |
|
多模型对比 |
用 Switch 节点或并行多个 Load Checkpoint 对比效果 |
一句话总结
Load Checkpoint 是 ComfyUI 的心脏——它把 2GB–23GB 的 AI 模型载入内存,拆分为 MODEL/CLIP/VAE 三条动脉,供养整个生成流程。最小只需 SD 1.5 pruned(2GB,4GB显存) 就能跑通你的第一张 AI 图片,是入门的第一块敲门砖。
好的,我逐个详细列出这14个节点。先从 Load VAE 开始:
7.1.2 Load VAE
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
加载独立的 VAE(变分自编码器)模型,替代或补充 Checkpoint 内置的 VAE |
|
使用场景 |
Checkpoint 内置 VAE 色彩发灰/发暗时,外置高质量 VAE 改善效果 |
|
文件格式 |
.safetensors / .pt / .ckpt |
|
存放路径 |
ComfyUI/models/vae/ |
|
与 Load Checkpoint 的关系 |
Checkpoint 通常内置 VAE,但 Load VAE 可覆盖,优先级更高 |
最小完整流程结构(外置 VAE 替换内置 VAE)

与内置 VAE 的对比流程
|
方式 |
结构 |
效果 |
|
内置 VAE |
Checkpoint.VAE → VAE Decode.vae |
默认,可能色彩一般 |
|
外置 VAE |
Load VAE.VAE → VAE Decode.vae |
色彩更鲜艳,细节更好 |
常用外置 VAE 推荐
|
VAE 名称 |
适用底模 |
特点 |
|
vae-ft-mse-840000-ema-pruned |
SD 1.5 |
社区最常用,色彩饱和,面部改善 |
|
ClearVAE |
SD 1.5 / SDXL |
清晰度强,画面通透 |
|
BlessedVAE |
SD 1.5 |
色彩鲜艳,二次元首选 |
|
SDXL VAE |
SDXL |
官方配套,修复发灰问题 |
|
ae.safetensors |
Flux |
Flux 官方 VAE,必须外置 |
7.1.3 CLIP Text Encode
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
将人类文本提示词编码为 CLIP 模型可理解的语义向量(CONDITIONING) |
|
输入 |
clip(CLIP 模型实例)、text(字符串提示词) |
|
输出 |
CONDITIONING(条件向量,引导扩散模型生成方向) |
|
使用方式 |
通常成对使用:一个正面提示词(想要的内容),一个负面提示词(排除的内容) |
|
提示词技巧 |
质量词前置(masterpiece, best quality),描述词具体,逗号分隔 |
最小完整流程结构(正面提示词)

7.1.4 CLIP Text Encode Neg(负面提示词)
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
与正面 CLIP Text Encode 完全相同,只是输入负面提示词,告诉模型不要生成什么 |
|
本质 |
同一个节点类型,只是用途不同,ComfyUI 中通常拖出两个实例分别连接 positive 和 negative |
|
负面提示词作用 |
抑制低质量、畸形、水印、模糊等不良元素 |
|
必备负面词 |
EasyNegative、badhandv4、lowres、bad anatomy |
最小完整流程结构(正负提示词配对)

7.1.5 Empty Latent Image
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
创建一张空白的潜空间(Latent Space)图像,作为 KSampler 的起始噪声画布 |
|
本质 |
纯随机噪声,经过 KSampler 逐步去噪后变成有意义的图像 |
|
width/height |
必须是 8 的倍数(64×64 潜空间块),常用 512、768、1024 |
|
batch_size |
一次生成几张图,显存允许可加大 |
|
与 VAE 的关系 |
潜空间分辨率 = 像素分辨率 ÷ 8(如 512×512 像素 = 64×64 潜空间) |
最小完整流程结构

7.1.6 KSampler
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
扩散模型的核心采样器,将潜空间噪声逐步去噪为有意义图像 |
|
model |
接收 Load Checkpoint 的 MODEL,提供去噪网络 |
|
positive/negative |
接收 CONDITIONING,引导生成方向(要/不要) |
|
latent_image |
起始潜空间,通常是 Empty Latent Image 的随机噪声 |
|
seed |
随机种子,相同种子+相同参数=相同结果 |
|
steps |
采样步数,越多细节越丰富但越慢(20–50 常用) |
|
cfg |
Classifier-Free Guidance,提示词遵循强度(7–12 常用) |
|
sampler_name |
采样算法(euler、euler_ancestral、dpmpp_2m 等) |
|
scheduler |
噪声调度策略(normal、karras、simple 等) |
|
denoise |
去噪强度,1.0=完全从噪声生成,<1.0=保留部分原图(图生图) |
采样器选择参考
|
采样器 |
特点 |
适用场景 |
|
euler |
稳定快速,基础首选 |
日常生成 |
|
euler_ancestral |
有随机性,细节丰富 |
创意探索 |
|
dpmpp_2m |
质量高,收敛好 |
最终输出 |
|
dpmpp_sde |
随机性强,艺术感 |
风格化 |
|
uni_pc |
步数少质量好 |
快速出图 |
最小完整流程结构

7.1.7. VAE Decode
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
将 KSampler 生成的潜空间图像解码为可见的像素图像 |
|
samples |
接收 KSampler 输出的 LATENT(潜空间数据) |
|
vae |
接收 VAE 模型(内置或外置),执行解码 |
|
本质 |
压缩/解压过程:像素 → 潜空间(编码)→ 像素(解码) |
|
输出 |
IMAGE(RGB 像素图像,可直接预览或保存) |
最小完整流程结构

7.1.8 Save Image
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
保存生成的图像到磁盘,并在界面显示预览 |
|
images |
接收 IMAGE 数据(来自 VAE Decode 或 Upscale) |
|
filename_prefix |
文件名前缀,自动追加序号和时间戳 |
|
输出路径 |
ComfyUI/output/ |
|
预览功能 |
节点内直接显示缩略图,右键可查看大图 |
|
格式 |
自动保存为 PNG(无损) |
7.1.9 Preview Image
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
仅预览图像,不保存到磁盘 |
|
与 Save Image 的区别 |
Preview 只看不存,Save 既看又存 |
|
使用场景 |
调试阶段快速查看效果,确认后再用 Save Image |
|
内存占用 |
预览图缓存在内存中,大量预览可能占内存 |
Save Image vs Preview Image 对比
|
特性 |
Save Image |
Preview Image |
|
保存到磁盘 |
✅ 是 |
❌ 否 |
|
界面显示 |
✅ 是 |
✅ 是 |
|
适用阶段 |
最终输出 |
调试预览 |
|
文件管理 |
自动编号,可回溯 |
无文件,只看当前 |
|
性能开销 |
磁盘 I/O |
内存占用 |
7.1.10 Load LoRA
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
加载 LoRA(Low-Rank Adaptation)轻量级微调模型 |
|
lora_name |
选择 .safetensors 格式的 LoRA 文件 |
|
strength_model |
LoRA 对模型权重的影响强度(0=无效果,1=满效果,>1可能过拟合) |
|
strength_clip |
LoRA 对 CLIP 文本编码器的影响强度(通常与 model 相同) |
|
输出 |
MODEL(叠加后的模型)、CLIP(叠加后的编码器)、LORA(原始 LoRA 权重) |
|
存放路径 |
ComfyUI/models/loras/ |
|
与 Checkpoint 的关系 |
LoRA 必须依附于 Checkpoint,不能单独使用 |
最小完整流程结构(单 LoRA)

7.1.11 LoraLoader
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
与 Load LoRA 功能相同,但输入接口不同——接收上游的 MODEL 和 CLIP,输出叠加后的 MODEL 和 CLIP |
|
与 Load LoRA 的区别 |
LoraLoader 需要上游输入,适合链式叠加多个 LoRA;Load LoRA 直接读取 Checkpoint,适合单 LoRA |
|
典型用法 |
多个 LoRA 串联:Checkpoint → LoraLoader1 → LoraLoader2 → KSampler |
|
strength 范围 |
通常 0.3–1.0,多个 LoRA 叠加时建议各自降低 |
最小完整流程结构(多 LoRA 串联)

7.1.12 Load Embedding
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
加载文本嵌入(Textual Inversion),将复杂概念压缩为单个关键词 |
|
本质 |
一组训练好的向量,代表特定视觉概念(风格、人物、负面特征) |
|
使用方式 |
在提示词中写触发词(如 EasyNegative),自动调用嵌入 |
|
文件格式 |
.pt / .safetensors / .bin |
|
存放路径 |
ComfyUI/models/embeddings/ |
|
与 LoRA 的区别 |
Embedding 只影响文本编码,不改变模型权重;LoRA 改变模型权重 |
最小完整流程结构(负面 Embedding)

注:Embedding 的触发词直接写在文本框中,无需额外节点连接。
7.1.13. Load Upscale Model
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
加载图像超分辨率模型(Upscaler),用于放大图像并补充细节 |
|
模型类型 |
ESRGAN、SwinIR、RealESRGAN 等 |
|
文件格式 |
.pth / .safetensors |
|
存放路径 |
ComfyUI/models/upscale_models/ |
|
与 Checkpoint 的区别 |
Upscale 模型只负责放大,不参与生成 |
常用模型
|
模型 |
放大倍数 |
特点 |
|
RealESRGAN_x4plus |
4× |
写实照片首选 |
|
RealESRGAN_x4plus_anime_6B |
4× |
动漫/插画专用 |
|
4x-UltraSharp |
4× |
锐化效果强 |
|
SwinIR |
2×/4× |
艺术图全局感知好 |
7.1.14 Upscale Image
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
使用加载的超分模型,将低分辨率图像放大为高分辨率 |
|
image |
输入待放大的图像 |
|
upscale_model |
接收 Load Upscale Model 加载的模型 |
|
输出 |
IMAGE(放大后的高清图像) |
|
特点 |
纯像素级算法放大,速度快,不改变内容 |
最小完整流程结构(生成 + 放大)

7.1.15 Image Resize
节点外观

节点介绍
|
属性 |
说明 |
|
核心作用 |
调整图像分辨率,支持放大和缩小 |
|
与 Upscale Image 的区别 |
Image Resize 是简单缩放(可能模糊),Upscale Image 是 AI 超分(补充细节) |
|
interpolation |
插值算法:nearest-exact(精确最近邻)、bilinear(双线性)、area(区域平均) |
|
使用场景 |
匹配模型输入尺寸、调整构图比例、批量统一分辨率 |
最小完整流程结构

完整串联:从生成到超分的完整工作流

一句话总结
这14个节点是ComfyUI的"基础语法"——Load Checkpoint 是主语,CLIP Text Encode 是谓语,KSampler 是动词,VAE Decode 是宾语,Save Image 是句号。掌握它们,你就能写出第一句完整的"AI图像句子"。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)