稳定扩散采样方法选择指南

发布时间:2024-06-23 18:34:23 浏览量:267次

Hello~o,朋友们~

欢迎回到AI趣闻屋。

Stable Diffusion webui 提供了多达22种采样方法,Euler a、Euler、LMS、Heun、DPM2、DDIM...

这么多选项,该怎么选呢?犯难了吗?

作为一个上进的大好青年,怎么能允许这“摆烂”?!决定了!

今天让我们聊一聊采样方法的基本介绍和分类,让大家能在绘图时快速选择合适的采样方法。

什么是采样方法?


Stable Diffusion 通过在潜在空间内生成一张完全随机的图像,噪声预测器估计图像的噪声,再减去。这个过程迭代N次后,得到一个没有噪声的精致图像。

去噪(降噪)过程被称为采样,需要通过Stable Diffusion在每一步生成新的样本图像。在此采样过程中采用的技术称为采样方法。

简单二分法:稳定性、随机性


观察一个15步的噪声添加时间表,从第一步的最大慢慢递减到最后一步的0,完成图像生成。

稳定性:随着采样步数(steps)的增加,噪声量的添加逐渐减少,而后得到的图像不会有太明显的变化;

随机性:每一步采样器都会使用指定算法添加一定量的噪声,让图像依然处于一个不稳定的状态,随着采样步数的变动而得到一张有明显区别于前一个步数的图像。

因为SD上的采样器大多数在30步之内都能得到清晰的图像,所以我们选择30,32,35这3个接近的采样步数(steps)的图像效果对比,来直观感受哪些采样器是稳定的,哪些是不稳定的。

稳定:

Euler

LMS

Heun

DPM2

DDIM

PLMS

UniPC

LMS Karras

DPM adaptive

DPM2 Karras

DPM++ 2M

DPM++ 2M Karras

不稳定:

Euler a

DPM fast

DPM2 a

DPM2 a Karras

DPM++ 2S a

DPM++ SDE

DPM++ 2M SDE

DPM++ 2S a Karras

DPM++ SDE Karras

DPM++ 2M SDE Karras

眼睛犀利的小伙伴可能已经发现,不稳定的采样器后面基本都带a或者SDE!

a 是英文 Ancestral 的缩写,译为“祖先”。基于 Katherine Crowson 的原始 k-diffusion实现。祖先采样器噪声不收敛。

SDE,全称 Stochastic Differential Equation,随机微分方程,它被注入到数据预测模型里,提升采样器效率的同时也为采样器的每一个采样步添加随机噪声。

进阶细分:带2、S、M、Karras是啥东西?


2 代表采样求解器(sampler solvers)2阶,意味着对U-Net进行2次降噪,在稳定扩散的过程中更为精确但增加了2倍的耗时。

S 代表单步(Singlestep)

M 代表多步(Multistep),是预测模型的算法的一个近似导数。

他们的区别简单来说,单步(Singlestep) 使用一个“固定值/随机值”,多步(Multistep) 使用的是前一个步数(steps)的值,从而产生更稳定的效果。

带有 Karras 的采样器使用了 Karras 论文中的噪声时间表。

论文地址:点击查看

采样器细节


1.Euler、Euler a

Euler是最直接的采样器,与解常微分方程(Ordinary Differential Equations)的欧拉方法相同。

2.Heun

Heun是Euler的2阶版本,精度较高,但速度慢2倍。

3.LMS

LMS(Linear multi-step)采样器,与Euler类似,是一种被广泛认可的求解常微分方程 (ODE) 的技术。

4.DPM、DPM2、DPM++

DPM(Diffusion probabilistic model solver)扩散概率模型求解器,是为Diffusion模型设计的新采样器。

DPM2 是 DPM 的2阶版本,DPM++是对 DPM 的优化改进。DPM离散化噪声预测模型的积分,而DPM ++则是离散化数据预测模型的积分。

论文地址:点击查看

5.DPM Fast、DPM Adaptive

DPM Fast 被标记为比其他方法更快的采样器,但在测试中性能差不多。

DPM Adaptive 自适应,不被输入的steps限制,生成有质量的图像,稳定。

如下:

6.DDIM、PLMS

DDIM(Denoising Diffusion Implicit Models)去噪扩散隐式模型,每一步都以最终图像、图像方向和随机噪声为引导,稳定。

PLMS (Pseudo Linear Multi-Step method) 伪线性多步方法,是DDIM的更新、更快的替代方案。

然而,在低步数下,DDIM 优于 PLMS,但35步之后,PLMS 略优于 DDIM。

7.UniPC

UniPC 是一个免训练的框架,专为扩散模型的快速采样而设计,可以在5-10步内生成较高质量的图像。

最后


其实更多时候在SD里选择的是模型来选采样方法,而不是采样方法来选模型。下载模型时,在主页提示选择哪些采样方法得到的图像质量更好。

艺术追求的是不可复制性!敢于挑战未知!

所以,大胆使用带s或者带a的采样方法吧!

最快、最具创意、最稳定的方法,选择合适的采样器,然后享受创作的快乐吧!


完~

感谢小伙伴们的阅读。喜欢就点赞和关注哦。


电梯:

AI绘画入门工具

AI绘画,文生图详解

AI绘画,图生图详解

高质量出图的4个技巧

AI绘画工作流

AI换装、inpaint 进阶技巧

画风转换


参考:

https://huggingface.co/docs/diffusers/api/schedulers/unipchttps://stable-diffusion-art.com/samplers/#DDIM_and_PLMShttps://www.reddit.com/r/StableDiffusion/comments/x4zs1r/comparison_between_different_samplers_in_stable/

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定