当前位置:首页 >学院新闻

腾讯混元创新突破:首创美术级3D生成大模型,效率提升超七成

像素空间作者:像素空间 发布时间: 2025-08-01 13:45:52 浏览量:0次

说明:文中所有的配图均来源于网络

日前,腾讯混元3D迎来重大升级,推出业界首个美术级3D生成大模型——Hunyuan3D-PolyGen。

该模型结合腾讯自研的高压缩率表征BPT技术,能够生成面数达上万面的复杂几何模型。其布线精度更高、细节更丰富,还同时支持三边面和四边面,可满足不同专业管线的多样化需求。基于此,混元3D资产可无缝应用于UGC游戏资产生成,显著提升美术师的建模效率。

目前,这一能力已在腾讯混元3D AI创作引擎上线(体验地址:3d.hunyuan.tencent.com),诚邀大家体验。同时,该技术也集成到腾讯多个游戏管线中,助力美术师建模效率提升超70%。该模型旨在解决3D资产生成中布线质量不佳和复杂物体建模困难的问题,提升美术师工作效率。

当前,3D生成算法在几何建模上虽有显著进展,但生成的模型与美术制作专业标准仍有差距,难以直接用于游戏开发等专业场景。主要问题有三:一是生成网格面数过高,动辄数十万,无法满足游戏实时加载与渲染需求;二是布线质量欠佳,网格布线杂乱,影响模型美观,还阻碍后续UV展开、骨骼绑定等环节;三是编辑难度大,生成结果为单一整体网格,难以拆分,限制了美术师后期编辑。为攻克这些难题,PolyGen进行了一系列技术创新。

01
算法框架

为实现3D生成从“可看”迈向“可用”,Hunyuan3D-PolyGen采用自回归网格生成框架。它借助显式、离散的顶点与面片建模开展空间推理,进而生成高质量、契合美术规范的3D模型。其核心流程(见图2)分三步:第一步是网格序列化,把网格的顶点与面片转换成Token序列,以此表示Mesh结构;第二步为自回归建模,以点云作为输入Prompt,通过自回归模型生成Mesh的Token序列;第三步是序列解码,将生成的Token序列反向解码成顶点与面片,最终重建出3D网格。

02
技术难点与解决方案

1、难点聚焦:对于复杂物体的建模

现有mesh自回归方法存在明显短板,表达一个面需9个token(一个面片含三个顶点,每个顶点对应三个坐标),mesh表达冗余度高。受限于有限的上下文窗口,该方法仅能对低面片(2k面以下)的简单模型进行建模,难以满足复杂物体的建模需求。

破局之策:自研高压缩率表征BPT

为提升可建模面数、实现复杂mesh建模,我们自主研发了高压缩率mesh表征BPT(Blocked and Patchified Tokenization)。通过精心设计block索引和patch压缩机制,让表达相同mesh所需的token序列大幅缩短,有效突破了现有方法的局限,为复杂物体建模提供了有力支撑,具体效果如下图所示:

block索引:精简顶点表征,降低token数量

将网格空间划分成多个block,把顶点的(x,y,z)空间坐标转化为(block, offset)索引坐标。如此一来,token数量能有效降低33%,从源头减少了数据冗余,为后续的压缩处理奠定基础。

patch压缩:优化面片组合,进一步削减token

把相邻面片组成patch(包含一个中心顶点和边缘顶点),减少相邻面片共用顶点的冗余。再结合共享block等技巧,token数量可进一步降低约41%。

通过上述BPT压缩算法,表征mesh的token数量可压缩74%,平均2.3个token就能表征一个面,大幅提升模型可建模面数。从下图能明显看出,相较于现有mesh自回归方法,该方法可建模的模型更复杂(可达2w + 面),细节也更为丰富。

2、难点聚焦:mesh自回归生成稳定性难题

mesh自回归生成面临的一大挑战是稳定性欠佳,同一模型多次生成的结果可能差异显著,如图5所示。这主要有两方面原因:其一,mesh生成容错率低,一个坐标生成错误就可能导致整体生成失败;其二,mesh的token序列较长,可达上十万,这无疑增加了出错的概率。

破局之策:引入强化学习后训练

为解决这一问题,腾讯研发了mesh自回归的强化学习后训练框架,如图6所示。该框架在预训练模型基础上开展后训练,精心设计稳定生成和美术规范奖励机制,以此引导模型生成更优结果。借助强化学习,模型生成“好结果”的概率得以提升,生成“差结果”的概率降低,进而有效提升了mesh自回归生成的稳定性,为高质量3D模型生成提供了有力保障。

03
效果对比

Hunyuan3D-PolyGen 与 Mesh 自回归 SOTA 算法对比

在 3D 模型生成领域,传统的 mesh 自回归方法在处理复杂物体时,常出现模型破损、细节缺失、布线杂乱无章等状况,严重影响生成质量。而腾讯推出的混元 3D-PolyGen 表现卓越,在生成的稳定性、细节丰富度以及布线质量等多个关键维度上,均全面超越当前表现最优的 SOTA 模型,为复杂物体的高质量 3D 生成提供了更优解决方案。

Hunyuan3D-PolyGen 与业界重拓扑接口对比

为解决面数和布线难题,业界常借助传统图形学重拓扑算法优化布线。现有重拓扑方法虽能生成规整布线,但面片大小分布均匀,在低面数设定下,会导致模型细节大量丢失。相比之下,混元 3D-PolyGen 可依据几何结构自适应分配面数,以更低面数实现更精细的细节呈现。

输入

效果

END
火星时代教育 影视学院刘老师,为你解答

相关文章

×

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定