腾讯开源新一代中文原生文生图大模型:效果领先、全面应用

发布时间:2024-08-12 12:28:21 浏览量:304次

5月14日,腾讯最新发布了全新一代文生图大模型,开源于Hugging Face平台及Github,乐见开发者免费使用。

这一中文原生的DiT架构文生图模型,支持中英文双语输入及理解,参数量高达15亿。采用与sora一致的DiT架构,不仅支持文生图还可用于多模态视觉生成。

新模型效果表现优异,超越开源的Stable Diffusion模型,属于目前效果最佳的开源文生图模型,整体实力达到国际领先水平。

模型效果展示

腾讯新一代文生图模型

新模型采用全新的DiT架构,基于Transformer架构的扩散模型,展现更好的扩展性与生成效率。腾讯混元团队在算法层面优化了长文本理解能力,最多支持256字符输入,达到行业领先水平。同时实现了多轮生图和对话能力,通过自然语言描述调整生成图片效果。

中文原生是新模型的一大特点,具备中英文双语理解生成能力,在中国元素的生成上表现出色。

评测结果显示,新一代文生图大模型效果整体提升超过20%,在多方面场景下表现优异。

全面开源,惠及行业

腾讯混元文生图广泛应用于素材创作、广告、新闻等领域,有效提高了生产与创意效率。开源模型能力让开发者和企业直接应用于推理,节约大量人力与算力。

广告创意应用

腾讯混元文生图负责人表示,希望通过开源分享腾讯在文生图领域的研究成果,丰富中文文生图开源生态,共同推动行业发展。

基于开放的文生图模型,有利于丰富中文文生图技术研发与应用,形成更多样的原生插件,推动技术发展。

腾讯一直持开放态度,已在Github上开源超过170个优质项目,涵盖各业务板块,获得超47万开发者关注。

想了解更多关于AI绘画应用的内容,欢迎点击咨询

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定