ComfyUI Stable Diffusion 稳定扩散

ComfyUI

最强大且模块化的具有图形/节点界面的稳定扩散GUI。

项目地址：https://gitcode.com/gh_mirrors/co/ComfyUI

免费下载资源

程序员晓晓

1323人浏览 · 2024-02-16 10:00:56

程序员晓晓 · 2024-02-16 10:00:56 发布

在这里插入图片描述

Stable Diffusion 简介

在 AIGC 绘画领域，无论是 Midjourney、SDWebUI 、DALL·E 以及 ComfyUI 都是基于 Stable Diffusion （稳定扩散）模型而开发的图像生成应用。

在这里插入图片描述

Stable Diffusion 指的是一种**“文本到图像”**的人工神经网络模型，能够理解用户输入的描述并生成相应的图像。这种模型基于大量的数据进行训练，其作用是学习如何将输入的文本描述转化为图像内容。

在这里插入图片描述

2022年8月首次亮相，由德国大学的计算机视觉小组 (ComVis) 和 Runway 公司合作研发，得益于 Stability AI 公司的资助以及 LAION 的数据集支持，模型的代码与权重均已开源。

在这里插入图片描述

Stable Diffusion 原理

Stable Diffusion 模型，原名为潜扩散模型（LDM），是一种基于深度学习的扩散模型，扩散过程发生在潜在空间中，用于合成高分辨率图片，其主要工作原理是从随机噪声中直接生成图片。

在这里插入图片描述

扩散是 Stable Diffusion 模型的最基本理论原理，一个标准扩散模型有两个主要过程：正向扩散和反向扩散

在这里插入图片描述

1、正向扩散：在正向扩散阶段，通过逐渐引入噪声来破坏图像，直到图像变成完全随机的噪声。

在这里插入图片描述

2、反向扩散：在反向扩散阶段，使用一系列马尔可夫链逐步去除预测噪声，从高斯噪声中恢复数据，最终生成一张图像。

在这里插入图片描述

对于非专业AI工程师，理解 Stable Diffusion 模型的大致概念就可以，非专业人士确实较难深入，之所以有点难理清，因为这里的模型概念指是对某一种事物的抽象表达，并非现实世界的实体产物。计算机最厉害的除了复制，还有其海量数据的存储与足够快的运算能力演化的学习能力。所以简单理解的话，模型就是经过训练学习后得到的产物（程序文件），略微了解这些概念只为之后能更好的使用 ComfyUI 。

在这里插入图片描述

图像生成的简单解析过程：就是用户输入一段描述后，这些信息首先会被文本编码器转化为机器可理解的形式，接着在潜在空间模型中生成相应的潜在向量，最后解码器将这些潜在向量转化为图像。

在这里插入图片描述

**应用中操作层面的生成过程：**第一步：选择一个风格合适的模型；第二步：输入画面描述的提示词；第三步：调节生成参数；第四步：点击生成，图像就被绘制出来了。

ComfyUI

最强大且模块化的具有图形/节点界面的稳定扩散GUI。

项目地址：https://gitcode.com/gh_mirrors/co/ComfyUI

在这里插入图片描述

目前 Stability AI 官方已发布的大模型主要版本有：SD1.5、SD2.1、SDXL 1.0 以及目前最新的 SDXL Turbo 等，就像 ChatGPT 的底层就是GPT大模型，版本有熟知的3.5和4.0，不同只是一个专注于聊天，一个专注于图像。下一节我们再一起了解这些已经发布的官方模型。

在这里插入图片描述

**总结：Stable Diffusion 简称（SD）指的是一种模型，**专注于图像领域，其作用是用于图像生成、去噪、修复、着色、提高分辨率等，已发布的版本很多，还在不停迭代。

写在最后

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。

AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

在这里插入图片描述