Llama也能做图像生成!港大字节推出开源自回归文生图模型

发布时间:2024-08-13 15:49:13 浏览量:172次

火星时代教育:Llama再升级!港大字节联手发布最新自回归模型

火星时代教育:最新推出自回归图像生成技术,Llama模型上线啦!只需Image Tokenizer,Llama也能做图像生成了,效果还超过了扩散模型。

据悉,港大和字节的研究团队推出了基于自回归模型Llama的图像生成方法,并已在GitHub上开源,获得近900颗星标的认可。

自扩散模型问世以来,曾一度成为主流技术,但LlamaGen却在ImageNet测试基准上表现出色,超越了LDM、DiT等扩散模型。

针对自回归模型的图像生成,如何实现呢?作者指出,在图像生成成功的关键设计包括图像压缩/量化器、可scale up的图像生成模型以及高质量的训练数据。

在LlamaGen的模型架构中,采用了预标准化、SwiGLU和RoPE等技术,以及Class-Conditional和Text-Conditional图像生成模型。

经过两个阶段的训练,LlamaGen在FID、IS、Precision和Recall等指标上展现出强大的竞争力,并优于传统模型。

值得一提的是,LlamaGen支持在线体验,欢迎体验!详情请访问:点击咨询

总的来说,LlamaGen模型开创了自回归模型的新局面,颠覆传统图像生成认知,带来更优异的性能表现。

火星时代教育一直致力于数字艺术教育领域,提供游戏设计培训、动画培训等课程,欢迎关注我们的官网:点击咨询

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定