腾讯混元大模型正式开放 “文生图” 功能、代码能力提升 20%

发布时间:2024-08-14 16:26:05 浏览量:177次

今天上午,腾讯混元大模型迎来全新升级,并正式开放 “文生图” 功能

官方公告称,升级后的腾讯混元中文效果整体超过 GPT-3.5,代码能力大幅提升 20%,达到业界领先水平。

腾讯混元通过学习增训,在多种语言代码文件和书籍上获得代码处理水平超过20%的提升。这使得腾讯混元在HumanEval公开测试集指标上胜出其他开源代码模型。

只需输入简单指令如“帮我用前端语言实现一个贪吃蛇”,腾讯混元即可自动生成可运行的代码,帮您快速制作贪吃蛇小游戏。除此之外,腾讯混元还支持Python、C++、Java、JavaScript等多种语言的指令生成,比如输入“用Python画红色的心形线”,腾讯混元将为您提供代码库选择、安装命令、绘制代码等操作步骤的指引。

对于大模型文生图功能,腾讯混元难点在于对提示词的语义理解、生成内容的合理性以及生成图片的效果。针对这三个技术难点,腾讯进行了专项的技术研究,提出了一系列原创算法,来保证生成图片的可用性和画质。

  • 在语义理解方面,腾讯混元采用了中英文双语细粒度的模型,优化算法提升了模型对细节的感知能力与生成效果。

  • 在内容合理性方面,混元文生图通过增强算法模型的图像二维空间位置感知能力,让生成的图像结构更合理。

  • 在画面质感方面,混元文生图基于多模型融合的方法,提升生成质感,人像模型和场景模型的效果均有所提升。

下面是官方提供的 “腾讯混元文生图” 使用案例。

  • 生成一幅照片:亚洲女子,魅力,中短发,戴墨镜,站在长城上,背景有红叶

  • 生成一张长城的照片,摄影风,真实感

  • 帮我画一个拿着奶茶的甄嬛,扁平插画,可爱 Q 版

  • 生成3D游戏军事场景动漫,城市战区,废墟瓦砾,焦黑的建筑,空气中弥漫硝烟

  • 画一幅渔舟唱晚的画

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定