AI绘画神器Stable Diffusion XL模型评测:生成效果全面盘点!

发布时间:2024-07-25 11:17:35 浏览量:298次

大家好,这里是和你们聊设计的花生~

之前为大家对比了 6 款在线AI绘画软件在不同主题上的图像生成效果,最终是Midjourney的整体表现最好,而Stability AI官方模型Stable Diffusion v2.1则表现不尽如人意。最近Stability AI又推出了一个新模型Stable Diffusion XL,参数是SD v2.1的2.5倍,那这个新模型的图像生成效果如何呢?今天就继续来测试一下。

Stable Diffusion XL 简介

此次Stable Diffusion XL一共更新在两个平台上,一是Stability AI官方AI绘画软件DreamStudio,另一个则是之前被Stability AI收购的AI图像处理平台Clipdrop。二者的区别在于DreamStudio上有很多的可调节参数,比如画面比例、图像数量等,Clipdrop是统一的1:1的画面比例,一次生成4张,单张图像放大后可达到1024*1024px。

据Stability AI官网介绍,SD XL模型支持用更短的提示创建描述性图像,并可以在图像中生成文字,模型增强了图像的构图和脸部生成能力,使画面更加逼真和美观。

SD XL生成的图像

生成准确的文字和画手一样,一直是AI绘画中的难题,直到Controlnet插件出现,我们才能在SD WebUI中通过轮廓检测功能固定文字外形,从而生成精准的文字内容,而此次SD XL模型可以生成文字无疑是又是AI绘画的一大进步。我分别在Midjourney和SD XL中用文本提示词进行测试,结果是SD XL的文字生成效果的确比Midjourney好。

接着继续用和之前一样的主题进行图像生成测试。首先是人像,可以看出SD XL比v2.1的效果要好很多,构图正确,人物面部没有扭曲变形,整体质感也好很多,质量看起来并不比Midjourney差,说明XL模型在照片真实性上有进行专门的优化。

然后是动漫风,XL生成的图像在画面整体质量有明显提升,应该是对数据集进行了优化,但是有一个非常大的缺点就是五官和四肢不正常,在生成的2批8张图像中,每一张都有五官四肢不正常的情况,图像可用率极低。

而在3D风格上XL模型还是有比较明显的进步,无论是人物精细度还是画面整体美感都比之前的v2.1要好,不过和动漫风一样存在四肢不正常的情况,下面是我从生成的4张图像中挑出的双手看起来比较正常的一张,感觉XL模型在这一块的训练没做好。

最后再看一下矢量扁平插画和概念场景的表现,同样都有非常明显的美感提升,不过也能看出SD XL在文本提示的理解上还有缺陷,在扁平插画的测试中它忽略了“白色背景”这一关键词;而由于SD XL目前还是测试版,画面尺寸不能做到16:9,这也让图像的表现性受限。

通过上面的图像生成测试可以看出,Stable Diffusion的XL模型比V2.1在质量上有了明显进步,特别是在人像质量上,虽还不能达到midjourney V5的水平,但在目前的AI绘画工具中也算表现比较好的;新增的文字生成功能也是比较独特的,除了接入Controlnet的SD WebUI,其他AI绘画工具目前都还没有生成准确文字内容的能力。

同时Stable Diffusion XL的缺点也是比较明显的,即人物的四肢不正常,这点在动漫和3D风格中尤为突出;模型对提示文本的理解能力也有缺陷,会漏掉一些关键词语,期待Stability AI在后续的更新中能进一步优化现在这些问题。

想学习数字艺术、UI设计、动画培训等相关课程吗?欢迎了解更多,点击咨询

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定