本文针对游戏开发、日常出图、工业化生产场景,整理了SD生态最核心、最常用的知识与参数,覆盖基础概念、核心参数、模型体系、工作流与避坑指南,可直接作为日常工具书使用。
一、基础核心概念(必懂)
1. SD 核心组件
| 组件 |
作用 |
通俗理解 |
| UNet |
图像生成的核心,负责去噪生成画面 |
AI的"画笔",决定画什么、怎么画 |
| VAE |
负责图像的编码与解码,控制色彩和细节 |
AI的"调色板+放大镜" |
| CLIP |
文本编码器,将提示词转换为AI能理解的向量 |
AI的"翻译官",把文字变成指令 |
| Scheduler(调度器) |
控制去噪的步骤和方式 |
AI的"绘画节奏" |
2. 模型类型与区别
| 模型类型 |
大小 |
作用 |
存放路径 |
| 底模(Checkpoint) |
2GB~14GB |
基础大模型,决定整体画风和能力 |
models/Stable-diffusion |
| LoRA |
50MB~300MB |
微调特定风格、角色、道具 |
models/Lora |
| VAE |
300MB~1GB |
优化色彩、对比度和细节 |
models/VAE |
| ControlNet |
1.5GB~4GB |
精确控制画面构图、姿势、线条 |
models/ControlNet |
| Embedding |
几MB~几十MB |
优化提示词理解,过滤负面效果 |
models/embeddings |
3. 主流架构对比
| 架构 |
代表版本 |
显存要求 |
适用场景 |
| SD 1.5 |
v1.5 |
6GB+ |
二次元、游戏素材、快速量产 |
| SDXL 1.0 |
base+refiner |
8GB+ |
写实、高清、复杂场景 |
| Flux |
schnell/dev |
12GB+ |
新一代画质天花板,文字生成 |
二、核心生成参数(直接抄)
1. 基础通用参数(所有场景通用)
| 参数 |
含义 |
推荐值 |
调整技巧 |
| 采样器(Sampler) |
去噪算法 |
DPM++ 2M Karras |
速度画质均衡首选;Euler a 适合创意发散 |
| 采样步数(Steps) |
迭代绘制次数 |
20~25 |
低于15画质差,高于35提升不明显 |
| CFG Scale |
提示词遵循度 |
6~8 |
数值越高越贴合提示词,过高会画面僵硬 |
| 分辨率 |
输出图片尺寸 |
512×768(角色)
768×512(场景) |
SD1.5 不要超过1024,否则会出现多人物 |
| 种子(Seed) |
随机数种子 |
-1(随机) |
固定种子可复刻同款画面 |
| 批量数量(Batch size) |
单次生成数量 |
1(6G显存) |
显存越大可设越高,6G显存固定为1 |
2. 进阶参数(高清修复/图生图)
| 参数 |
含义 |
推荐值 |
调整技巧 |
| 高清修复(Hires.fix) |
低分辨率生成后放大 |
开启 |
放大倍数1.5~2倍,过高会变形 |
| 重绘幅度(Denoising strength) |
对原图的修改程度 |
0.250.4(高清修复)<br>0.50.7(风格迁移) |
数值越低越接近原图,越高改动越大 |
| CLIP Skip |
CLIP模型跳过层数 |
2(二次元)
1(写实) |
二次元模型必设为2,提升画风还原度 |
3. ControlNet 核心参数
| 预处理器 |
对应模型 |
作用 |
权重推荐 |
| openpose |
control_openpose |
控制人物姿势、骨骼 |
0.7~0.9 |
| canny |
control_canny |
控制画面轮廓、边缘 |
0.6~0.8 |
| lineart |
control_lineart |
用线稿生成上色图 |
0.7~0.8 |
| depth |
control_depth |
控制画面景深、空间关系 |
0.5~0.7 |
4. 不同显存启动参数(必加)
| 显存 |
启动参数 |
| 6GB(RTX3060/2060) |
--xformers --medvram --no-half-vae |
| 8GB(RTX3060Ti/4060) |
--xformers --no-half-vae |
| 12GB+(RTX3080/4070Ti+) |
--xformers |
三、提示词工程(核心技能)
1. 标准提示词结构
[画质词] + [风格词] + [主体描述] + [动作/姿势] + [环境/背景] + [光影/色彩]
示例:
masterpiece, best quality, ultra detailed, genshin impact style, 1girl, klee, blonde hair, twin tails, holding bomb, standing, forest background, sunny day, soft lighting
2. 万能通用词库
- 正向画质词:
masterpiece, best quality, ultra detailed, 8k, sharp focus, vibrant colors
- 反向防崩词:
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, blurry, watermark
3. 权重控制语法
(关键词:1.2):提升权重
(关键词:0.8):降低权重
[关键词1|关键词2]:随机选择一个关键词
四、常用模型推荐(游戏开发向)
1. 底模推荐
| 类型 |
模型名称 |
大小 |
特点 |
| 二次元通用 |
A333ANYTSimpler |
2GB |
线条干净,提示词兼容性好 |
| 碧蓝档案风格 |
bartstyledbBlueArchive |
2GB |
手游标杆画风,出图稳定 |
| 写实二次元 |
canistermix4 |
2GB |
光影质感好,适合场景 |
| 国风仙侠 |
Chinese style illustration |
2GB |
水墨工笔质感,古风游戏首选 |
2. LoRA 推荐
| 类型 |
LoRA名称 |
大小 |
最佳权重 |
| Q版角色 |
Blue Archive cute Chibi |
144MB |
0.6~0.8 |
| 线稿生成 |
novice-sketch-style |
72MB |
0.4~0.6 |
| 国风插画 |
Chinese style illustration v2 |
72MB |
0.5~0.7 |
3. ControlNet 必装模型
control_openpose:姿势控制
control_canny:轮廓控制
control_lineart:线稿上色
control_depth:景深控制
五、常用工具与工作流
1. 主流客户端对比
| 客户端 |
特点 |
适用人群 |
| Stable Diffusion WebUI |
界面直观,插件丰富 |
新手入门、日常出图 |
| ComfyUI |
节点工作流,可自动化 |
进阶玩家、工业化生产 |
| 绘世启动器 |
一键部署,内置优化 |
国内用户首选 |
2. 必装插件
- ADetailer:自动修复人脸和手部
- ControlNet:精确控图
- Ultimate SD Upscale:高清放大
- WD1.4 Tagger:自动反推提示词
3. 标准游戏素材工作流
- 角色立绘:底模 + 角色LoRA + 正向/反向提示词 → 高清修复 → ADetailer 修脸
- 三视图:底模 + ControlNet OpenPose(三视图骨骼)→ 批量生成 → 统一风格
- 场景生成:写实底模 + 场景LoRA + ControlNet Canny(草图)→ 高清放大
六、常见问题与解决方案
| 问题 |
原因 |
解决方案 |
| 显存不足(Out of Memory) |
分辨率过高、批量数量过大 |
降低分辨率,开启--medvram,关闭高清修复 |
| 画面发黑、色彩暗淡 |
VAE未加载或不兼容 |
手动选择对应VAE,添加--no-half-vae参数 |
| 人物畸形、多手多脚 |
提示词问题、分辨率过高 |
完善反向提示词,降低分辨率,使用ADetailer |
| 模型不显示 |
路径错误、格式不支持 |
检查模型存放路径,确保是.safetensors格式 |
| 启动失败 |
中文路径、环境冲突 |
安装到纯英文路径,使用秋叶整合包 |
七、工业化生产进阶知识
- API调用:SD WebUI 和 ComfyUI 均提供 RESTful API,可通过 Python 代码批量生成素材
- 工作流导出:ComfyUI 工作流可导出为 JSON 文件,一键复用和分享
- 模型量化:将模型量化为 4bit/8bit,降低显存占用,几乎不损失画质
- 批量生成:通过脚本批量生成不同参数的图片,快速筛选优质结果
所有评论(0)