Midjourney, Stable XL, Dall.E-3文生图三强效果对比

发布时间:2024-03-26 13:42:55 浏览量:253次


AI文生图的大争之世,各种文生图的模型此起彼伏,博眼球的更是不在少数。不过目前生成效果最好的依然还是老牌的三强,Midjourney, Stable Diffusion XL,以及Dall.E -3。


我们先来对比一下这三强生成的效果,希望可以为大家在选择图文模型提供一些参考。其他的模型只能说暂时略逊一筹,我们的文心一格4.0大模型的效果赶超很明显,已经可以初步商用了。


废话不说,正片开始。


1. 图片生成效果对比


PK 1: 生成要求:“一对老夫妻携手迎面走在乡间小路上,画面温馨,皮克斯动画风格, 暖色调”。


Stable Diffusion XL生成

Midjourney生成

Dall.E 3生成

PK 2: 生成要求:“生成圣诞电商大促活动的热闹宣传图,红色调,凸显大促,圣诞老人,喜庆”。



Stable XL生成

Midjourney生成

Dall.E 3 生成


PK 3: 生成要求:“生成开屏图片,AI的未来世界,方便人们的生活,充满科技感,高级感”。


Stable XL 生成


Midjourney生成

Dall.E 3 生成


PK 4: 生成要求:“生成一个logo,圆形,有质感,主题为“星辰大海”,蓝色系”。


Stable XL生成


Midjourney生成


Dall.E 3 生成


我们可以看到三大模型针对不同的场景生成的效果也是各有千秋, Midjourney各场景都比较均衡,Stable Diffusion XL的效果更加丰富,但是在logo等处理上效果不佳。Dall.E 3的效果更加生动,logo的处理也不错,并且对于中文效果的解析也还不错,不过在想象力方面略逊一筹。


2. 5分钟通过API接入三大模型


第一步,注册日月摘星,获取API Key, 注册地址: 日月摘星, 注册认证还送6.66。



第二部,调用模型生成接口,自由选择您所需要的模型。


https://api.riyuexinzhu.com/images/models/{model_name}/generate



目前支持的模型列表(model_name)如下所示:


模型名称

制作方

说明

dall-e

OpenAI

dall-e-2调用简洁,对中文识别度较好

dall-e-3

OpenAI

dall-e-3 生成效果大幅度提升,堪比midjourney

midjourney

Midjourney

生成效果好,得过大奖的就是它了,可以指定不同画家,不同风格。中文兼容度不佳,仅提供VIP用户调用

stable-diffusion-512-v2-1

StableAI

StabeAI的标准模型,效果略差,需要增加步长提升效果。中文兼容度不佳。 支持图片大小 262,144<=height * width <=1,048,576, height, width都需要为64的倍数,最小128

stable-diffusion-xl-1024-v1-0

StableAI

增强版模型,效果可以与Midjourney一拼。中文兼容度不佳。支持的图片大小为1024x1024, 1152x896, 1216x832, 1344x768, 1536x640, 640x1536, 768x1344, 832x1216, 896x1152


具体的调用示例如下:


https://api.riyuexinzhu.com/images/models/stable-diffusion-xl-1024-v1-0/generate

body入参:

 {
	'text': '一对老夫妻携手迎面走在乡间小路上,画面温馨,皮克斯动画风格, 暖色调',
	'options': {
		'return_mode': 'url'
	},
}



更多API接口内容欢迎您查看: 日月新著

无需东奔西走,日月摘星统一API接口助您5分钟接入AI新时代!

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定