当前位置：首页 >人工智能 >Stable Diffusion XL 1.0进化，体验不输Midjourney

Stable Diffusion XL 1.0进化，体验不输Midjourney

发布时间：2024-08-07 16:40:27 浏览量：144次

机器之心报道

编辑：蛋酱、梓文

Stable Diffusion XL 1.0闪亮登场，给你不一样的色彩体验。

在大模型开启的AIGC时代，由明星AI初创公司Stability AI打造的文本到图像生成模型Stable Diffusion可谓风靡全球。

虽然从文本到图像的生成模型并不少，但Stable Diffusion是最受欢迎的开源模型。各路开发者也基于Stable Diffusion模型进行二创，推出各种花式繁多的AIGC应用。

刚刚，Stability AI正式推出了Stable Diffusion XL（SDXL）1.0。文本到图像生成模型，又完成了进化过程中的一次重要迭代。

这是Stability AI最新的旗舰图像模型，也是当前图像生成领域最好的开源模型。

在SDXL 1.0版本发布之前，Stability AI在六月份推出的SDXL 0.9仅作研究用途。但从今天起，SDXL 1.0将通过Stability AI的API开源开放给开发者，普通人也可以通过消费级应用Clipdrop和DreamStudio访问。

如何马上体验到SDXL 1.0？目前有几种渠道：

Clipdrop：点击咨询

DreamStudio：点击咨询

Stability AI Platform：点击咨询

Github：点击咨询

此外，鉴于与亚马逊的密切合作关系，SDXL 1.0已经登陆亚马逊云科技的基础模型托管服务Amazon Bedrock，而且还会登陆Amazon SageMaker JumpStart。

SDXL 1.0，什么进化了？

1. 生成概念与风格更具挑战的作品

SDXL 1.0几乎能够生成任何艺术风格的高质量图像，并且是实现逼真效果的最佳开源模型。用户可以在没有任何特定的「灵感」的情况下进行提示，确保风格的绝对自由，生成各具特色的图像。SDXL 1.0在色彩的鲜艳度和准确度方面做了很好的调整，对比度、光线和阴影都比上一代更好，并全部采用原生1024x1024分辨率。

除此之外，SDXL 1.0可以生成图像模型难以渲染的概念，例如手、文本以及空间的排列。

图源：Stability AI官网

2. 语言更简洁、更智能

SDXL 1.0只需几句话就能创建复杂、细致、美观的图像。用户不再需要用华丽的辞藻进行修饰就能够获得想要的高质量图像。

它甚至能够区分「The Red Square」（红场，一个著名景点）和「red square」（红色正方形）。

3. 微调和高级控制

有了SDXL 1.0，根据自定义数据对模型进行微调比以往任何时候都要容易。可生成自定义LoRA或检查点，减少数据处理的需要。Stability AI正在利用专门用于SDXL的T2I / ControlNet构建下一代任务特定结构、样式和组成控制。这些功能目前处于测试预览阶段，可以随时关注微调的更新。SDXL 1.0上的图像控制也即将推出。

自4月13日发布SDXL beta版本以来，ClipDrop用户已经使用该模型生成超过3500万张图片，而Stability AI的Discord社区平均每天生成2万张图片。

看看用户使用SDXL 1.0的效果吧。

从网友的图片生成效果来看，SDXL 1.0在光线上把握更加精准，光线效果、色彩对比更加真实。

可以看到，在色彩的运用上，SDXL 1.0更加大胆，饱和度较高的情况下光线与阴影的细节依然在线。

在这张图片中可以看到，景深较为合适，主体突出，色彩之间的过渡，甚至真实度都十分优秀。

网友制作了SDXL 0.9与SDXL 1.0的对比图，左边为SDXL 0.9生成图像，右边为SDXL 1.0生成图像。可以明显看出二者对于色彩运用的差距。SDXL 1.0的色彩更加丰富且真实，光效表现也更加出色。

也有网友在SDXL 1.0中使用Midjourney中的旧prompt，评论中纷纷感叹，它的效果不比Midjourney差，甚至有些出乎意料的优秀。

SDXL 1.0细节：Base和Refiner模型

Stability AI将SDXL 1.0与各种模型进行了对比测试：与Stable Diffusion1.5/2.1、SDXL 0.9等模型相比，人们更喜欢由SDXL 1.0生成的图像。

SDXL 1.0也是所有开放式图像模型中参数量最多的模型之一，它建立在一个创新的新架构上，由一个35亿参数的基础模型和一个66亿参数的细化模型组成。

完整模型包括一个用于潜在扩散的专家混合管道：第一步，基础模型生成（噪声）潜在变量，然后用专门用于最终去噪步骤的细化模型对其进行进一步处理。

基础模型也可以作为独立模块使用。细化模型为基础模型的输出添加更精确的颜色、更高的对比度和更精细的细节。

这种两阶段架构可确保图像生成的稳健性，而且不会影响速度或需要过多的计算资源。SDXL 1.0可在配备8GB VRAM的消费级GPU或随时可用的云实例上有效运行。

论文地址：
https://arxiv.org/pdf/2307.01952.pdf

代码地址：
https://github.com/Stability-AI/generative-models

参考链接：
https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

点击咨询报名Stability AI的数字艺术培训课程，了解更多关于数字艺术的技能和知识。

上一篇北师大未来设计学院在第六届中国教博会发布五项PBL大挑战项目

下一篇为何AI绘画大神Midjourney选择QQ频道进军中国市场?探究Midjourney中文版真相

热门课程推荐

热门资讯

1. 华为手机神奇“AI修图”功能，一键消除衣服！原图变身大V领深V！

最近华为手机Pura70推出的“AI修图”功能引发热议，通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗？点击查看！
2. 四款值得推荐的AI以图生图软件，有需要的赶紧来试试!

近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
3. 照片变漫画效果，这4个方法操作简单有效，快来试试吧！

想将照片变成漫画效果？这篇文章分享了4个方法，包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图，简单操作就能实现，快来尝试一下吧！
4. 一款免费无限制的AI视频生成工具火了!国内无障碍访问!附教程

人人都可以动手制作AI视频! 打开网址https://pixverse.ai/,用邮箱注册后,点击右上角Create,就可以开始创作了。 PixVerse目前有文案生成视频,和图片生...
5. 赶紧收藏好!这4个完全免费的AI视频制作网站和工具

以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。用户可以使...
6. 零基础10分钟生成漫画，教大家如何用AI生成自己的漫画

接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
7. 四款软件让你一键生成AI美女!

就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
8. AI视频制作神器Viggle：让静态人物动起来，创意无限！

Viggle AI是一款免费制作视频的AI工具，能让静态人物图片动起来，快来了解Viggle AI的功能和优势吧！
9. 10个建筑AI工具，从设计到施工全覆盖!肯定有你从来没听过的

讲述了建筑业比较著名的AI公司小库科技做出的探索,在这儿就不多说了。今天,我们试着在规划设计、建筑方案设计、住宅设计、管道设计、出渲染图、3D扫...
10. Logo Diffusion——基于sd绘画模型的AI LOGO 生成器

这下LOGO设计彻底不用求人了。接下来详细演示一遍操作流程首先进入Logo D... 想学习更多AI技能,比如说关于怎么样利用AI来提高生产效率、还能做什么AI...

Stable Diffusion XL 1.0进化，体验不输Midjourney

请绑定手机号