Comfyui 教程-20

放大的EZ

80人浏览 · 2026-06-11 10:12:56

放大的EZ · 2026-06-11 10:12:56 发布

一百二十分钟电影级制作所需的完整节点清单

7.1 第一阶段：基础生成核心（15个节点）

序号	节点类型	功能说明
1	Load Checkpoint	加载大模型底模
2	Load VAE	加载外置VAE
3	CLIP Text Encode	编码正面提示词
4	CLIP Text Encode Neg	编码负面提示词
5	Empty Latent Image	创建空白潜空间画布
6	KSampler	采样生成图像
7	VAE Decode	潜空间解码为图像
8	Save Image	保存生成图像
9	Preview Image	预览图像
10	Load LoRA	加载LoRA微调模型
11	LoraLoader	应用LoRA到模型
12	Load Embedding	加载文本嵌入
13	Load Upscale Model	加载图像放大模型
14	Upscale Image	图像超分辨率
15	Image Resize	调整图像分辨率

7.1.1 Load Checkpoint 节点详解

节点外观

元素	说明
顶部标题	LOAD CHECKPOINT（可折叠）
下拉菜单	选择 .safetensors 或 .ckpt 模型文件
三个输出端	MODEL（模型权重）、CLIP（文本编码器）、VAE（图像编解码）
连接点	实心圆点，可拖拽连线到其他节点

功能介绍

属性	说明
核心作用	加载 Stable Diffusion / Flux / SDXL 等大模型的完整权重文件
输出拆分	将完整 Checkpoint 拆分为三个独立组件，供下游节点灵活调用
文件格式	.safetensors（推荐，安全快速）/ .ckpt（旧格式，有安全风险）
存放路径	ComfyUI/models/checkpoints/
内存占用	加载后常驻显存/内存，直到工作流结束或手动释放

三个输出详解

输出端	数据类型	用途	典型连接目标
MODEL	U-Net/DiT 模型	核心去噪网络，决定图像生成质量	KSampler 的 model 输入
CLIP	文本编码器	将提示词转换为语义向量	CLIP Text Encode 的 clip 输入
VAE	变分自编码器	潜空间与像素空间转换	VAE Decode / VAE Encode 的 vae 输入

最小流程结构（7 节点，SD 1.5，4GB 显存可运行）

节点清单与参数

序号	节点	参数设置
1	Load Checkpoint	选择 v1-5-pruned-emaonly.safetensors
2	CLIP Text Encode	输入 "a cat"，连接 Load Checkpoint.CLIP
3	CLIP Text Encode	输入 "lowres, blurry"，连接 Load Checkpoint.CLIP
4	Empty Latent Image	宽 512，高 512，批次 1
5	KSampler	步数 20，CFG 7，采样器 euler，调度器 normal
6	VAE Decode	连接 Load Checkpoint.VAE
7	Save Image	默认文件名前缀

连线颜色说明

颜色	数据类型	本案例中的连线
紫色	MODEL	Load Checkpoint.MODEL → KSampler.model
黄色	CLIP	Load Checkpoint.CLIP → CLIP Text Encode.clip
橙色	VAE	Load Checkpoint.VAE → VAE Decode.vae
浅绿色	CONDITIONING	CLIP Text Encode.CONDITIONING → KSampler.positive/negative
粉红色	LATENT	Empty Latent Image.LATENT → KSampler.latent_image → VAE Decode.samples
浅蓝色	IMAGE	VAE Decode.IMAGE → Save Image.images

常用技巧

技巧	说明
模型切换	下拉菜单实时切换，无需重启 ComfyUI
显存不足	使用 GGUF 量化版或 FP8 版本
VAE 外置	若 Checkpoint 内置 VAE 效果差，可用 Load VAE 单独加载
CLIP 跳过层	部分模型需设置 CLIP skip: 2（SD 1.5 动漫模型常见）
模型缓存	首次加载慢，后续同模型复用快
多模型对比	用 Switch 节点或并行多个 Load Checkpoint 对比效果

一句话总结

Load Checkpoint 是 ComfyUI 的心脏——它把 2GB–23GB 的 AI 模型载入内存，拆分为 MODEL/CLIP/VAE 三条动脉，供养整个生成流程。最小只需 SD 1.5 pruned（2GB，4GB显存） 就能跑通你的第一张 AI 图片，是入门的第一块敲门砖。

好的，我逐个详细列出这14个节点。先从 Load VAE 开始：

7.1.2 Load VAE

节点外观

节点介绍

属性	说明
核心作用	加载独立的 VAE（变分自编码器）模型，替代或补充 Checkpoint 内置的 VAE
使用场景	Checkpoint 内置 VAE 色彩发灰/发暗时，外置高质量 VAE 改善效果
文件格式	.safetensors / .pt / .ckpt
存放路径	ComfyUI/models/vae/
与 Load Checkpoint 的关系	Checkpoint 通常内置 VAE，但 Load VAE 可覆盖，优先级更高

最小完整流程结构（外置 VAE 替换内置 VAE）

与内置 VAE 的对比流程

方式	结构	效果
内置 VAE	Checkpoint.VAE → VAE Decode.vae	默认，可能色彩一般
外置 VAE	Load VAE.VAE → VAE Decode.vae	色彩更鲜艳，细节更好

常用外置 VAE 推荐

VAE 名称	适用底模	特点
vae-ft-mse-840000-ema-pruned	SD 1.5	社区最常用，色彩饱和，面部改善
ClearVAE	SD 1.5 / SDXL	清晰度强，画面通透
BlessedVAE	SD 1.5	色彩鲜艳，二次元首选
SDXL VAE	SDXL	官方配套，修复发灰问题
ae.safetensors	Flux	Flux 官方 VAE，必须外置

7.1.3 CLIP Text Encode

节点外观

节点介绍

属性	说明
核心作用	将人类文本提示词编码为 CLIP 模型可理解的语义向量（CONDITIONING）
输入	clip（CLIP 模型实例）、text（字符串提示词）
输出	CONDITIONING（条件向量，引导扩散模型生成方向）
使用方式	通常成对使用：一个正面提示词（想要的内容），一个负面提示词（排除的内容）
提示词技巧	质量词前置（masterpiece, best quality），描述词具体，逗号分隔

最小完整流程结构（正面提示词）

7.1.4 CLIP Text Encode Neg（负面提示词）

节点外观

节点介绍

属性	说明
核心作用	与正面 CLIP Text Encode 完全相同，只是输入负面提示词，告诉模型不要生成什么
本质	同一个节点类型，只是用途不同，ComfyUI 中通常拖出两个实例分别连接 positive 和 negative
负面提示词作用	抑制低质量、畸形、水印、模糊等不良元素
必备负面词	EasyNegative、badhandv4、lowres、bad anatomy

最小完整流程结构（正负提示词配对）

7.1.5 Empty Latent Image

节点外观

节点介绍

属性	说明
核心作用	创建一张空白的潜空间（Latent Space）图像，作为 KSampler 的起始噪声画布
本质	纯随机噪声，经过 KSampler 逐步去噪后变成有意义的图像
width/height	必须是 8 的倍数（64×64 潜空间块），常用 512、768、1024
batch_size	一次生成几张图，显存允许可加大
与 VAE 的关系	潜空间分辨率 = 像素分辨率 ÷ 8（如 512×512 像素 = 64×64 潜空间）

最小完整流程结构

7.1.6 KSampler

节点外观

节点介绍

属性	说明
核心作用	扩散模型的核心采样器，将潜空间噪声逐步去噪为有意义图像
model	接收 Load Checkpoint 的 MODEL，提供去噪网络
positive/negative	接收 CONDITIONING，引导生成方向（要/不要）
latent_image	起始潜空间，通常是 Empty Latent Image 的随机噪声
seed	随机种子，相同种子+相同参数=相同结果
steps	采样步数，越多细节越丰富但越慢（20–50 常用）
cfg	Classifier-Free Guidance，提示词遵循强度（7–12 常用）
sampler_name	采样算法（euler、euler_ancestral、dpmpp_2m 等）
scheduler	噪声调度策略（normal、karras、simple 等）
denoise	去噪强度，1.0=完全从噪声生成，<1.0=保留部分原图（图生图）

采样器选择参考

采样器	特点	适用场景
euler	稳定快速，基础首选	日常生成
euler_ancestral	有随机性，细节丰富	创意探索
dpmpp_2m	质量高，收敛好	最终输出
dpmpp_sde	随机性强，艺术感	风格化
uni_pc	步数少质量好	快速出图

最小完整流程结构

7.1.7. VAE Decode

节点外观

节点介绍

属性	说明
核心作用	将 KSampler 生成的潜空间图像解码为可见的像素图像
samples	接收 KSampler 输出的 LATENT（潜空间数据）
vae	接收 VAE 模型（内置或外置），执行解码
本质	压缩/解压过程：像素 → 潜空间（编码）→ 像素（解码）
输出	IMAGE（RGB 像素图像，可直接预览或保存）

最小完整流程结构

7.1.8 Save Image

节点外观

节点介绍

属性	说明
核心作用	保存生成的图像到磁盘，并在界面显示预览
images	接收 IMAGE 数据（来自 VAE Decode 或 Upscale）
filename_prefix	文件名前缀，自动追加序号和时间戳
输出路径	ComfyUI/output/
预览功能	节点内直接显示缩略图，右键可查看大图
格式	自动保存为 PNG（无损）

7.1.9 Preview Image

节点外观

节点介绍

属性	说明
核心作用	仅预览图像，不保存到磁盘
与 Save Image 的区别	Preview 只看不存，Save 既看又存
使用场景	调试阶段快速查看效果，确认后再用 Save Image
内存占用	预览图缓存在内存中，大量预览可能占内存

Save Image vs Preview Image 对比

特性	Save Image	Preview Image
保存到磁盘	✅ 是	❌ 否
界面显示	✅ 是	✅ 是
适用阶段	最终输出	调试预览
文件管理	自动编号，可回溯	无文件，只看当前
性能开销	磁盘 I/O	内存占用

7.1.10 Load LoRA

节点外观

节点介绍

属性	说明
核心作用	加载 LoRA（Low-Rank Adaptation）轻量级微调模型
lora_name	选择 .safetensors 格式的 LoRA 文件
strength_model	LoRA 对模型权重的影响强度（0=无效果，1=满效果，>1可能过拟合）
strength_clip	LoRA 对 CLIP 文本编码器的影响强度（通常与 model 相同）
输出	MODEL（叠加后的模型）、CLIP（叠加后的编码器）、LORA（原始 LoRA 权重）
存放路径	ComfyUI/models/loras/
与 Checkpoint 的关系	LoRA 必须依附于 Checkpoint，不能单独使用

最小完整流程结构（单 LoRA）

7.1.11 LoraLoader

节点外观

节点介绍

属性	说明
核心作用	与 Load LoRA 功能相同，但输入接口不同——接收上游的 MODEL 和 CLIP，输出叠加后的 MODEL 和 CLIP
与 Load LoRA 的区别	LoraLoader 需要上游输入，适合链式叠加多个 LoRA；Load LoRA 直接读取 Checkpoint，适合单 LoRA
典型用法	多个 LoRA 串联：Checkpoint → LoraLoader1 → LoraLoader2 → KSampler
strength 范围	通常 0.3–1.0，多个 LoRA 叠加时建议各自降低

最小完整流程结构（多 LoRA 串联）

7.1.12 Load Embedding

节点外观

节点介绍

属性	说明
核心作用	加载文本嵌入（Textual Inversion），将复杂概念压缩为单个关键词
本质	一组训练好的向量，代表特定视觉概念（风格、人物、负面特征）
使用方式	在提示词中写触发词（如 EasyNegative），自动调用嵌入
文件格式	.pt / .safetensors / .bin
存放路径	ComfyUI/models/embeddings/
与 LoRA 的区别	Embedding 只影响文本编码，不改变模型权重；LoRA 改变模型权重

最小完整流程结构（负面 Embedding）

注：Embedding 的触发词直接写在文本框中，无需额外节点连接。

7.1.13. Load Upscale Model

节点外观

节点介绍

属性	说明
核心作用	加载图像超分辨率模型（Upscaler），用于放大图像并补充细节
模型类型	ESRGAN、SwinIR、RealESRGAN 等
文件格式	.pth / .safetensors
存放路径	ComfyUI/models/upscale_models/
与 Checkpoint 的区别	Upscale 模型只负责放大，不参与生成

常用模型

模型	放大倍数	特点
RealESRGAN_x4plus	4×	写实照片首选
RealESRGAN_x4plus_anime_6B	4×	动漫/插画专用
4x-UltraSharp	4×	锐化效果强
SwinIR	2×/4×	艺术图全局感知好

7.1.14 Upscale Image

节点外观

节点介绍

属性	说明
核心作用	使用加载的超分模型，将低分辨率图像放大为高分辨率
image	输入待放大的图像
upscale_model	接收 Load Upscale Model 加载的模型
输出	IMAGE（放大后的高清图像）
特点	纯像素级算法放大，速度快，不改变内容

最小完整流程结构（生成 + 放大）

7.1.15 Image Resize

节点外观

节点介绍

属性	说明
核心作用	调整图像分辨率，支持放大和缩小
与 Upscale Image 的区别	Image Resize 是简单缩放（可能模糊），Upscale Image 是 AI 超分（补充细节）
interpolation	插值算法：nearest-exact（精确最近邻）、bilinear（双线性）、area（区域平均）
使用场景	匹配模型输入尺寸、调整构图比例、批量统一分辨率