Chat with Wiki - Stable Diffusion有哪些模型

Answer

Stable Diffusion 模型包括以下几种： 1. Stable Video Diffusion 模型： - 避坑指南：直接使用百度网盘准备好的资源可规避大部分坑；若报显存溢出问题，可调低帧数或增加 novram 启动参数；云部署实战部分，基础依赖模型权重有两个 models–laion–CLIP-ViT-H-14-laion2B-s32B-b79K 和 ViT-L-14.pt，需放到指定路径下。 - 总结：Sora 发布后，之前的视频生成模型略显逊色，Stable Video Diffusion 作为开源项目可自由创作无需充值，有独特优势。其生成的视频画质清晰、过渡自然，虽目前只能生成最多 4 秒视频，但在不断迭代。 2. 潜在扩散模型（Latent Diffusion Models）： - CLIP：将用户输入的 Prompt 文本转化成 text embedding。 - 核心组件：VAE Encoder-Decoder、UNET（进行迭代降噪，在文本引导下进行多轮预测）。 - 存放路径：ComfyUI 存放路径为 models/checkpoints/。 - 基础预训练模型：SD1.5、SDXL。 - 训练方法：DreamBooth（by Google）。 - 格式：.pt、.safetensor。 - 融合模型：checkpoint+checkpoint、Lora+Lora、checkpoint+Lora。 - 模型自带已适配的 VAE。 - 微调模型：概念学习、Checkpoint。 3. 不同版本模型对比： - Stable Diffusion 2.0 系列模型。 - Stable Diffusion 2.1 系列模型。 - Stable Diffusion 1.6 系列模型。 - SD Turbo 模型。 4. 性能优化方面： - 使用 TF32 精度加速 SD 模型训练与推理。 - 使用 FP16 半精度加速。 - 对注意力模块进行切片。 - 对 VAE 进行切片。 - 大图像切块。 - CPU<->GPU 切换。 - 变换 Memory Format。 - 使用 xFormers 加速 SD 模型训练与推理。 - 使用 tomesd 加速 SD 模型推理。 - 使用 torch.compile 加速 SD 推理速度。此外，还有关于 Stable Diffusion 训练数据集制作、微调训练、基于其训练 LoRA 模型、训练结果测试评估等方面的内容。

Content generated by AI large model, please carefully verify (powered by aily)

References

Stable Video Diffusion模型核心内容与部署实战

1、直接使用百度网盘里面准备好的资源，可以规避掉90%的坑；2、如果一直报显存溢出问题，可以调低帧数或增加novram启动参数；3、针对云部署实战部分，基础依赖模型权重有两个models–laion–CLIP-ViT-H-14-laion2B-s32B-b79K和ViT-L-14.pt，需要放到指定路径下；4、加入「AIGCmagic社区」群聊，一起交流讨论，涉及AI视频、AI绘画、Sora技术拆解、数字人、多模态、大模型、传统深度学习、自动驾驶等多个不同方向，可私信或添加微信号：【m_aigc2022】，备注不同方向邀请入群！！[heading1]——总结——[content]在Sora发布之后，似乎在这之前的所有视频生成模型都已黯淡无光，难以与之争锋！然而Stable Video Diffusion作为开源项目，我们可以在自己的机器上自由创作而无需充值，这也是其独特优势！从技术角度看，SVD生成的视频画质非常清晰，帧与帧之前的过渡也非常的自然，无论是背景闪烁的问题，还是人物一致性的保持都能够得到妥善解决！尽管目前只能生成最多4秒的视频，与Sora生成的60s视频差距很远，但是SVD还在不断迭代，相信其终将再次强大！！！同时，我们会持续关注SVD技术及前沿视频生成技术，尝试多种不同的部署微调方式，介绍更多视频生成的技术模型，更多精彩内容会在后续文章中放出，敬请期待！！！

第二课《ComfyUI基础知识》 By 郭佑萌 @ ?WaytoAGI 2024.8.15 .pdf

‎的去噪结果。然而，这种迭代性质在计算效率上带来了挑战，特别是在处理大尺寸图像和‎大量扩散步骤(T)时。在采样过程中，从高斯噪声中去噪图像可能需要很长时间。为了解‎决这一问题，一组研究人员提出了一种新的方法，称为稳定扩散（Stable Diffusion），‎最初称为潜在扩散模型（Latent Diffusion Models）‎Stable Diffusion‎Stable Diffusion是一种扩散模型（diffusion model）的变体，叫做“潜在扩散模[heading1]‎型”(Latent Diffusion Models)[content]‎CLIP‎将用户输入的Prompt文本转化成text embedding‎核心的组件‎VAE Encoder-Decoder‎UNET‎UNET进行迭代降噪，在文本引导下进行多轮预测‎High-Resolution Image Synthesis with Latent Diffusion Models‎ComfyUI存放路径：models/checkpoints/‎SD1.5‎SD基础预训练模型‎SDXL‎SD1.5‎模型实例‎SDXL‎训练方法‎DreamBooth，by Google‎EMA-only&pruned VS Full‎FP16&FP32‎格式‎.pt VS.safetensor‎Bake in VAE‎模型自带已适配的VAE‎SD微调模型‎概念学习‎Checkpoint‎作用‎source：stable-diffusion-art.com/models/#How_are_models_created‎1puppy‎训练要求‎sd1.5‎12G VARM‎SDXL‎16G VARM‎The merged model sits between the realistic F222 and the anime Anything V3‎styles.It is a very good model for generating illustration art with human figures.‎(source:stable-diffusion-art.com/models/#Example_of_a_merged_model)‎融合模型‎checkpoint+checkpoint‎Lora+Lora‎形式‎checkpoint+Lora‎Baking VAE

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

6.3 SD训练数据集制作6.4 Stable Diffusion微调（finetune）训练6.5基于Stable Diffusion训练LoRA模型6.6 SD训练结果测试评估7.Stable Diffusion不同版本模型的对比7.1 Stable Diffusion 2.0系列模型7.2 Stable Diffusion 2.1系列模型7.3 Stable Diffusion 1.6系列模型7.4 SD Turbo模型8.Stable Diffusion性能优化8.1使用TF32精度加速SD模型训练与推理8.2使用FP16半精度加速8.3对注意力模块进行切片8.4对VAE进行切片8.5大图像切块8.6 CPU<->GPU切换8.7变换Memory Format8.8使用xFormers加速SD模型训练与推理8.9使用tomesd加速SD模型推理8.10使用torch.compile加速SD推理速度9.推荐阅读9.1深入浅出完整解析Stable Diffusion XL核心基础知识9.2深入浅出完整解析Stable Diffusion中U-Net核心基础知识9.3深入浅出完整解析LoRA核心基础知识9.4深入浅出完整解析ControlNet核心基础知识9.5手把手教你如何成为AIGC算法工程师，斩获AIGC算法offer！9.6 AIGC产业深度思考与分析9.7算法工程师的独孤九剑秘籍