腾讯推出混元文生图大模型开源 新一代中文AI模型问世

发布时间:2024-05-20 20:21:13 浏览量:240次

腾讯推出混元文生图大模型开源 新一代中文AI模型问世

腾讯在五月14日宣布推出混元文生图大模型并对外开源,开启了中文AI模型新一代技术的大门。该模型已在Hugging Face平台和Github发布,包含完整模型权重、推理代码和模型算法,支持企业与个人开发者免费商用。

在五月17日,腾讯集团副总裁蒋杰表示,腾讯混元大模型在持续迭代后,整体性能已居国内第一梯队,其中部分中文能力已赶超GPT-4。该模型支持多种视频生成能力,包括文生视频、图生视频、图文生视频、视频生视频,已实现16秒视频生成。在生3D层面,腾讯混元已布局文/图生3D,仅需30秒即可生成单图3D模型。

混元文生图大模型是首个中文原生DiT架构文生图开源模型,采用了Sora和Stable Diffusion 3的同款架构和关键技术。该模型通过Transformer架构实现了更好的扩展性,提升了生成质量和效率。

腾讯混元文生图

腾讯混元文生图负责人芦清林介绍|图片来源:腾讯

为何开源?

腾讯混元团队选择在这个时刻开源首先是因为他们认为现在自身已准备就绪,具备了开源条件。另一方面,业界需要这样的开源模型,以推动行业发展和技术进步。

腾讯混元团队表示,开源不仅能推动模型性能提升,还能促进整个行业的发展,让更多人参与到模型优化的过程中。

...

混元文生图模型未来商业化的策略主要路径是辅助腾讯内部不同业务场景的发展和应用,同时也在尝试着探索外部面向C端的AI应用。目前行业内的文生图应用虽然广受关注,但商业化应用仍处于探索阶段。

头图来源:混元官网

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定