Chat with Wiki - stable diffusion通俗讲解

Answer

Stable Diffusion 是由 Stability AI 和 LAION 等公司共同开发的生成式模型，参数量约 1B，可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。

文生图任务是将一段文本输入模型，经过一定迭代次数生成符合描述的图片。例如输入“天堂，巨大的，海滩”，模型生成美丽沙滩图片。

图生图任务在输入文本基础上再输入一张图片，模型根据文本提示重绘输入图片使其更符合描述，如在沙滩图片上添加“海盗船”。

输入的文本信息需通过 CLIP Text Encoder 模型这一“桥梁”转换为机器数学信息，该模型将文本信息编码生成 Text Embeddings 特征矩阵用于控制图像生成。

初始 Latent Feature 经过图像解码器重建是纯噪声图片，而经过 SD 的“图像优化模块”处理后再重建是包含丰富内容的有效图片。U-Net 网络+Schedule 算法的迭代去噪过程的每一步结果用图像解码器重建，可直观感受从纯噪声到有效图片的全过程。

以下是 Stable Diffusion 模型工作的完整流程总结及前向推理流程图。

此外，关于 Stable Diffusion 还有系列资源，包括从 0 到 1 读懂其核心基础原理、训练全过程，核心网络结构解析，搭建使用模型进行 AI 绘画的多种方式，经典应用场景，以及上手训练自己的 AI 绘画模型等内容。

Content generated by AI large model, please carefully verify (powered by aily)

References

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

Stable Diffusion（SD）模型是由Stability AI和LAION等公司共同开发的生成式模型，总共有1B左右的参数量，可以用于文生图，图生图，图像inpainting，ControlNet控制生成，图像超分等丰富的任务，本节中我们以文生图（txt2img）和图生图（img2img）任务展开对Stable Diffusion模型的工作流程进行通俗的讲解。文生图任务是指将一段文本输入到SD模型中，经过一定的迭代次数，SD模型输出一张符合输入文本描述的图片。比如下图中输入了“天堂，巨大的，海滩”，于是SD模型生成了一个美丽沙滩的图片。SD模型的文生图（txt2img）过程而图生图任务在输入本文的基础上，再输入一张图片，SD模型将根据文本的提示，将输入图片进行重绘以更加符合文本的描述。比如下图中，SD模型将“海盗船”添加在之前生成的那个美丽的沙滩图片上。SD模型的图生图（img2img）过程那么输入的文本信息如何成为SD模型能够理解的机器数学信息呢？很简单，我们需要给SD模型一个文本信息与机器数据信息之间互相转换的“桥梁”——CLIP Text Encoder模型。如下图所示，我们使用CLIP Text Encoder模型作为SD模型中的前置模块，将输入的文本信息进行编码，生成与文本信息对应的Text Embeddings特征矩阵，再将Text Embeddings用于SD模型中来控制图像的生成：蓝色框就是CLIP Text Encoder模型，能够将输入文本信息进行编码，输出SD能够理解的特征矩阵

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

初始Latent Feature和经过SD的“图像优化模块”处理后的图像内容区别可以看到，上图左侧是初始Latent Feature经过图像解码器重建后的图片，显然是一个纯噪声图片；上图右侧是经过SD的“图像优化模块”处理后，再用图像解码器重建出来的图片，可以看到是一个张包含丰富内容信息的有效图片。我们再将U-Net网络+Schedule算法的迭代去噪过程的每一步结果都用图像解码器进行重建，我们可以直观的感受到从纯噪声到有效图片的全过程：U-Net网络+Schedule算法的迭代去噪过程的每一步结果以上就是SD模型工作的完整流程，下面Rocky再将其进行总结归纳制作成完整的Stable Diffusion前向推理流程图，方便大家更好的理解SD模型的前向推理过程：SD模型文生图和图生图的前向推理流程图

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

1.Stable Diffusion系列资源2.零基础深入浅出理解Stable Diffusion核心基础原理2.1通俗讲解Stable Diffusion模型工作流程（包含详细图解）2.2从0到1读懂Stable Diffusion模型核心基础原理（包含详细图解）2.3零基础读懂Stable Diffusion训练全过程（包含详细图解）2.4其他主流生成式模型介绍3.Stable Diffusion核心网络结构解析（全网最详细）3.1 SD模型整体架构初识3.2 VAE模型3.3 U-Net模型3.4 CLIP Text Encoder模型3.5 SD官方训练细节解析4.从0到1搭建使用Stable Diffusion模型进行AI绘画（全网最详细讲解）4.1零基础使用ComfyUI搭建Stable Diffusion推理流程4.2零基础使用SD.Next搭建Stable Diffusion推理流程4.3零基础使用Stable Diffusion WebUI搭建Stable Diffusion推理流程4.4零基础使用diffusers搭建Stable Diffusion推理流程4.5 Stable Diffusion生成示例5.Stable Diffusion经典应用场景5.1文本生成图像5.2图片生成图片5.3图像inpainting5.4使用controlnet辅助生成图片5.5超分辨率重建6.从0到1上手使用Stable Diffusion训练自己的AI绘画模型（全网最详细讲解）6.0 Stable Diffusion训练资源分享6.1 Stable Diffusion模型训练初识6.2配置训练环境与训练文件