ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

PartCrafter:北大字节CMU联手,单图生成3D新纪元?

时间:2025-06-11 17:29:05来源:ITBEAR编辑:快讯团队

近期,3D建模技术领域迎来了一场革命性的变革。由北京大学、字节跳动及卡内基梅隆大学携手研发的PartCrafter项目震撼问世,该项目仅凭一张普通的RGB图像,就能迅速构建出高精度的结构化3D模型,彻底摒弃了以往“分割后再重建”的繁琐步骤。这一技术的问世,不仅极大地提升了生成效率,更展现了人工智能在3D生成领域的前所未有的潜力。

PartCrafter作为一款创新的3D生成模型,实现了从单张图像到结构化3D模型的直接转换,无需预分割,即可一步生成完整的3D场景。无论是处理单一物体还是复杂的多物体场景,PartCrafter都展现出了卓越的性能。这一特性使其在众多应用场景中具备了显著优势。

该技术的核心在于其创新的组合式潜在空间和层次化注意力机制。组合式潜在空间通过为每个3D部件分配独立的潜在token集合,确保了部件间的语义清晰度和编辑的灵活性。而层次化注意力机制则有效处理了部件内部和部件间的信息流,使得生成的3D模型在局部细节和全局一致性上达到了高度协调。

尤为值得一提的是PartCrafter的“透视”能力。即使输入图像中的某些部件被遮挡,该模型也能凭借强大的生成先验,准确推断并生成完整的3D几何结构。这一能力得益于其基于预训练的3D网格扩散Transformer(DiT),该模型不仅继承了大规模3D数据集的生成能力,还通过创新的架构设计进一步优化了性能。实验证明,PartCrafter在不可见部件的重建上超越了现有方法。

传统3D生成方法往往需要经历语义分割和逐一重建两个阶段,不仅效率低下,还容易受到分割错误的影响。而PartCrafter则通过统一的生成架构,消除了对预分割的依赖,实现了生成质量和计算效率的双重提升。据了解,PartCrafter能够在短短40秒内完成从单张图像到结构化3D模型的转换,这一速度远超传统方法。

在结构化3D生成任务上,PartCrafter取得了令人瞩目的成绩,甚至超越了其底层的3D生成模型。这一成果表明,理解物体的组合结构对于提升3D生成的整体质量具有关键作用。为了支持部件级生成,PartCrafter团队还构建了一个包含13万个3D对象的大型数据集,其中10万个对象具备多部件标注,为模型训练提供了丰富的监督信息。

PartCrafter的发布,标志着3D建模技术迈入了一个崭新的阶段。其强大的端到端生成能力和对复杂场景的处理能力,使其在游戏开发、虚拟现实、工业设计和数字孪生等多个领域展现出了广泛的应用前景。PartCrafter还支持灵活的部件编辑,为创作者提供了更高的自由度,受到了社交媒体上开发者们的热烈反响。

更多热门内容
90后领航者刘靖康携Insta360上市,重塑中国成像科技版图
"Insta360 is a bet on people," said Niu Kuiguang of IDGCapital. "We invested in Liu's continued abilit…

2025-06-12

迪士尼环球影业联手起诉AI公司Midjourney版权侵权
据央视新闻,当地时间6月11日,迪士尼和环球影业对人工智能公司Midjourney提起版权诉讼,指控Midjourney盗版了这两家好莱坞电影公司的版权库,用于生成和分发其著名角色的“无数未经授权的副本”。据…

2025-06-12