本文针对游戏开发、日常出图、工业化生产场景,整理了SD生态最核心、最常用的知识与参数,覆盖基础概念、核心参数、模型体系、工作流与避坑指南,可直接作为日常工具书使用。


一、基础核心概念(必懂)

1. SD 核心组件

组件 作用 通俗理解
UNet 图像生成的核心,负责去噪生成画面 AI的"画笔",决定画什么、怎么画
VAE 负责图像的编码与解码,控制色彩和细节 AI的"调色板+放大镜"
CLIP 文本编码器,将提示词转换为AI能理解的向量 AI的"翻译官",把文字变成指令
Scheduler(调度器) 控制去噪的步骤和方式 AI的"绘画节奏"

2. 模型类型与区别

模型类型 大小 作用 存放路径
底模(Checkpoint) 2GB~14GB 基础大模型,决定整体画风和能力 models/Stable-diffusion
LoRA 50MB~300MB 微调特定风格、角色、道具 models/Lora
VAE 300MB~1GB 优化色彩、对比度和细节 models/VAE
ControlNet 1.5GB~4GB 精确控制画面构图、姿势、线条 models/ControlNet
Embedding 几MB~几十MB 优化提示词理解,过滤负面效果 models/embeddings

3. 主流架构对比

架构 代表版本 显存要求 适用场景
SD 1.5 v1.5 6GB+ 二次元、游戏素材、快速量产
SDXL 1.0 base+refiner 8GB+ 写实、高清、复杂场景
Flux schnell/dev 12GB+ 新一代画质天花板,文字生成

二、核心生成参数(直接抄)

1. 基础通用参数(所有场景通用)

参数 含义 推荐值 调整技巧
采样器(Sampler) 去噪算法 DPM++ 2M Karras 速度画质均衡首选;Euler a 适合创意发散
采样步数(Steps) 迭代绘制次数 20~25 低于15画质差,高于35提升不明显
CFG Scale 提示词遵循度 6~8 数值越高越贴合提示词,过高会画面僵硬
分辨率 输出图片尺寸 512×768(角色)
768×512(场景)
SD1.5 不要超过1024,否则会出现多人物
种子(Seed) 随机数种子 -1(随机) 固定种子可复刻同款画面
批量数量(Batch size) 单次生成数量 1(6G显存) 显存越大可设越高,6G显存固定为1

2. 进阶参数(高清修复/图生图)

参数 含义 推荐值 调整技巧
高清修复(Hires.fix) 低分辨率生成后放大 开启 放大倍数1.5~2倍,过高会变形
重绘幅度(Denoising strength) 对原图的修改程度 0.250.4(高清修复)<br>0.50.7(风格迁移) 数值越低越接近原图,越高改动越大
CLIP Skip CLIP模型跳过层数 2(二次元)
1(写实)
二次元模型必设为2,提升画风还原度

3. ControlNet 核心参数

预处理器 对应模型 作用 权重推荐
openpose control_openpose 控制人物姿势、骨骼 0.7~0.9
canny control_canny 控制画面轮廓、边缘 0.6~0.8
lineart control_lineart 用线稿生成上色图 0.7~0.8
depth control_depth 控制画面景深、空间关系 0.5~0.7

4. 不同显存启动参数(必加)

显存 启动参数
6GB(RTX3060/2060) --xformers --medvram --no-half-vae
8GB(RTX3060Ti/4060) --xformers --no-half-vae
12GB+(RTX3080/4070Ti+) --xformers

三、提示词工程(核心技能)

1. 标准提示词结构

[画质词] + [风格词] + [主体描述] + [动作/姿势] + [环境/背景] + [光影/色彩]

示例

masterpiece, best quality, ultra detailed, genshin impact style, 1girl, klee, blonde hair, twin tails, holding bomb, standing, forest background, sunny day, soft lighting

2. 万能通用词库

  • 正向画质词masterpiece, best quality, ultra detailed, 8k, sharp focus, vibrant colors
  • 反向防崩词lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, blurry, watermark

3. 权重控制语法

  • (关键词:1.2):提升权重
  • (关键词:0.8):降低权重
  • [关键词1|关键词2]:随机选择一个关键词

四、常用模型推荐(游戏开发向)

1. 底模推荐

类型 模型名称 大小 特点
二次元通用 A333ANYTSimpler 2GB 线条干净,提示词兼容性好
碧蓝档案风格 bartstyledbBlueArchive 2GB 手游标杆画风,出图稳定
写实二次元 canistermix4 2GB 光影质感好,适合场景
国风仙侠 Chinese style illustration 2GB 水墨工笔质感,古风游戏首选

2. LoRA 推荐

类型 LoRA名称 大小 最佳权重
Q版角色 Blue Archive cute Chibi 144MB 0.6~0.8
线稿生成 novice-sketch-style 72MB 0.4~0.6
国风插画 Chinese style illustration v2 72MB 0.5~0.7

3. ControlNet 必装模型

  • control_openpose:姿势控制
  • control_canny:轮廓控制
  • control_lineart:线稿上色
  • control_depth:景深控制

五、常用工具与工作流

1. 主流客户端对比

客户端 特点 适用人群
Stable Diffusion WebUI 界面直观,插件丰富 新手入门、日常出图
ComfyUI 节点工作流,可自动化 进阶玩家、工业化生产
绘世启动器 一键部署,内置优化 国内用户首选

2. 必装插件

  • ADetailer:自动修复人脸和手部
  • ControlNet:精确控图
  • Ultimate SD Upscale:高清放大
  • WD1.4 Tagger:自动反推提示词

3. 标准游戏素材工作流

  1. 角色立绘:底模 + 角色LoRA + 正向/反向提示词 → 高清修复 → ADetailer 修脸
  2. 三视图:底模 + ControlNet OpenPose(三视图骨骼)→ 批量生成 → 统一风格
  3. 场景生成:写实底模 + 场景LoRA + ControlNet Canny(草图)→ 高清放大

六、常见问题与解决方案

问题 原因 解决方案
显存不足(Out of Memory) 分辨率过高、批量数量过大 降低分辨率,开启--medvram,关闭高清修复
画面发黑、色彩暗淡 VAE未加载或不兼容 手动选择对应VAE,添加--no-half-vae参数
人物畸形、多手多脚 提示词问题、分辨率过高 完善反向提示词,降低分辨率,使用ADetailer
模型不显示 路径错误、格式不支持 检查模型存放路径,确保是.safetensors格式
启动失败 中文路径、环境冲突 安装到纯英文路径,使用秋叶整合包

七、工业化生产进阶知识

  1. API调用:SD WebUI 和 ComfyUI 均提供 RESTful API,可通过 Python 代码批量生成素材
  2. 工作流导出:ComfyUI 工作流可导出为 JSON 文件,一键复用和分享
  3. 模型量化:将模型量化为 4bit/8bit,降低显存占用,几乎不损失画质
  4. 批量生成:通过脚本批量生成不同参数的图片,快速筛选优质结果
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐