AIGC（Stable Diffusion 生态）常用知识与参数速查手册

风落无尘

424人浏览 · 2026-05-19 20:50:55

风落无尘 · 2026-05-19 20:50:55 发布

本文针对游戏开发、日常出图、工业化生产场景，整理了SD生态最核心、最常用的知识与参数，覆盖基础概念、核心参数、模型体系、工作流与避坑指南，可直接作为日常工具书使用。

一、基础核心概念（必懂）

1. SD 核心组件

组件	作用	通俗理解
UNet	图像生成的核心，负责去噪生成画面	AI的"画笔"，决定画什么、怎么画
VAE	负责图像的编码与解码，控制色彩和细节	AI的"调色板+放大镜"
CLIP	文本编码器，将提示词转换为AI能理解的向量	AI的"翻译官"，把文字变成指令
Scheduler（调度器）	控制去噪的步骤和方式	AI的"绘画节奏"

2. 模型类型与区别

模型类型	大小	作用	存放路径
底模（Checkpoint）	2GB~14GB	基础大模型，决定整体画风和能力	`models/Stable-diffusion`
LoRA	50MB~300MB	微调特定风格、角色、道具	`models/Lora`
VAE	300MB~1GB	优化色彩、对比度和细节	`models/VAE`
ControlNet	1.5GB~4GB	精确控制画面构图、姿势、线条	`models/ControlNet`
Embedding	几MB~几十MB	优化提示词理解，过滤负面效果	`models/embeddings`

3. 主流架构对比

架构	代表版本	显存要求	适用场景
SD 1.5	v1.5	6GB+	二次元、游戏素材、快速量产
SDXL 1.0	base+refiner	8GB+	写实、高清、复杂场景
Flux	schnell/dev	12GB+	新一代画质天花板，文字生成

二、核心生成参数（直接抄）

1. 基础通用参数（所有场景通用）

参数	含义	推荐值	调整技巧
采样器（Sampler）	去噪算法	DPM++ 2M Karras	速度画质均衡首选；Euler a 适合创意发散
采样步数（Steps）	迭代绘制次数	20~25	低于15画质差，高于35提升不明显
CFG Scale	提示词遵循度	6~8	数值越高越贴合提示词，过高会画面僵硬
分辨率	输出图片尺寸	512×768（角色） 768×512（场景）	SD1.5 不要超过1024，否则会出现多人物
种子（Seed）	随机数种子	-1（随机）	固定种子可复刻同款画面
批量数量（Batch size）	单次生成数量	1（6G显存）	显存越大可设越高，6G显存固定为1

2. 进阶参数（高清修复/图生图）

参数	含义	推荐值	调整技巧
高清修复（Hires.fix）	低分辨率生成后放大	开启	放大倍数1.5~2倍，过高会变形
重绘幅度（Denoising strength）	对原图的修改程度	0.25_{0.4（高清修复）<br>0.5}0.7（风格迁移）	数值越低越接近原图，越高改动越大
CLIP Skip	CLIP模型跳过层数	2（二次元） 1（写实）	二次元模型必设为2，提升画风还原度

3. ControlNet 核心参数

预处理器	对应模型	作用	权重推荐
openpose	control_openpose	控制人物姿势、骨骼	0.7~0.9
canny	control_canny	控制画面轮廓、边缘	0.6~0.8
lineart	control_lineart	用线稿生成上色图	0.7~0.8
depth	control_depth	控制画面景深、空间关系	0.5~0.7

4. 不同显存启动参数（必加）

显存	启动参数
6GB（RTX3060/2060）	`--xformers --medvram --no-half-vae`
8GB（RTX3060Ti/4060）	`--xformers --no-half-vae`
12GB+（RTX3080/4070Ti+）	`--xformers`

三、提示词工程（核心技能）

1. 标准提示词结构

[画质词] + [风格词] + [主体描述] + [动作/姿势] + [环境/背景] + [光影/色彩]

示例：

masterpiece, best quality, ultra detailed, genshin impact style, 1girl, klee, blonde hair, twin tails, holding bomb, standing, forest background, sunny day, soft lighting

2. 万能通用词库

正向画质词：masterpiece, best quality, ultra detailed, 8k, sharp focus, vibrant colors
反向防崩词：lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, blurry, watermark

3. 权重控制语法

(关键词:1.2)：提升权重
(关键词:0.8)：降低权重
[关键词1|关键词2]：随机选择一个关键词

四、常用模型推荐（游戏开发向）

1. 底模推荐

类型	模型名称	大小	特点
二次元通用	A333ANYTSimpler	2GB	线条干净，提示词兼容性好
碧蓝档案风格	bartstyledbBlueArchive	2GB	手游标杆画风，出图稳定
写实二次元	canistermix4	2GB	光影质感好，适合场景
国风仙侠	Chinese style illustration	2GB	水墨工笔质感，古风游戏首选

2. LoRA 推荐

类型	LoRA名称	大小	最佳权重
Q版角色	Blue Archive cute Chibi	144MB	0.6~0.8
线稿生成	novice-sketch-style	72MB	0.4~0.6
国风插画	Chinese style illustration v2	72MB	0.5~0.7

3. ControlNet 必装模型

control_openpose：姿势控制
control_canny：轮廓控制
control_lineart：线稿上色
control_depth：景深控制

五、常用工具与工作流

1. 主流客户端对比

客户端	特点	适用人群
Stable Diffusion WebUI	界面直观，插件丰富	新手入门、日常出图
ComfyUI	节点工作流，可自动化	进阶玩家、工业化生产
绘世启动器	一键部署，内置优化	国内用户首选

2. 必装插件

ADetailer：自动修复人脸和手部
ControlNet：精确控图
Ultimate SD Upscale：高清放大
WD1.4 Tagger：自动反推提示词

3. 标准游戏素材工作流

角色立绘：底模 + 角色LoRA + 正向/反向提示词 → 高清修复 → ADetailer 修脸
三视图：底模 + ControlNet OpenPose（三视图骨骼）→ 批量生成 → 统一风格
场景生成：写实底模 + 场景LoRA + ControlNet Canny（草图）→ 高清放大

六、常见问题与解决方案

问题	原因	解决方案
显存不足（Out of Memory）	分辨率过高、批量数量过大	降低分辨率，开启`--medvram`，关闭高清修复
画面发黑、色彩暗淡	VAE未加载或不兼容	手动选择对应VAE，添加`--no-half-vae`参数
人物畸形、多手多脚	提示词问题、分辨率过高	完善反向提示词，降低分辨率，使用ADetailer
模型不显示	路径错误、格式不支持	检查模型存放路径，确保是`.safetensors`格式
启动失败	中文路径、环境冲突	安装到纯英文路径，使用秋叶整合包