ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

腾讯开源混元-3D大模型:首创支持文生和图生双功能,引领3D生成新潮流

时间:2024-11-05 19:12:00来源:ITBEAR编辑:瑞雪

【ITBEAR】腾讯近日发布了一款名为Hunyuan3D-1.0的开源大模型,据官方介绍,这是首个能同时支持文本和图像生成的三维开源模型。

该模型采用了一种创新的两阶段生成方法,可以在保证高质量和可控性的基础上,仅需10秒就能生成3D资产。在第一阶段,团队利用多视角扩散模型,在约4秒内快速生成包含丰富纹理和几何信息的多视角图像。这一步骤有效地将任务从单视角重建转变为多视角重建,从而提高了生成的准确性和效率。

进入第二阶段,团队引入了一种前馈重建模型,该模型能够利用第一阶段生成的多视角图像,在约3秒内完成3D资产的快速且精确重建。这一重建模型不仅学会了处理多视角扩散过程中引入的噪声和不一致性,还能有效利用条件图像中的信息,高效地恢复3D结构。

官方强调,Hunyuan3D-1.0模型具有强大的泛化能力和可控性,能够重建各种尺度的物体,无论是宏伟的建筑还是精致的工具花草,都能得到高质量的重建效果。

为了方便开发者和研究者使用和学习该模型,腾讯已经将Hunyuan3D-1.0在Github和Huggingface平台上开源,并提供了详细的研究论文。感兴趣的读者可以通过以下链接获取更多信息:

Github:https://github.com/Tencent/Hunyuan3D-1

Huggingface:https://huggingface.co/tencent/Hunyuan3D-1

研究论文:https://3d.hunyuan.tencent.com/hunyuan3d.pdf

更多热门内容
埃安RT全新登场!售价11.98-16.58万元,智能驾驶硬件大升级,续航更强劲
11月6日,埃安RT正式上市。新车共推出5款车型,售价11.98-16.58万元。埃安RT基于AEP3.值得一提的是,新车还配备包括激光雷达在内的27个智驾硬件,以及英伟达Orin-X高算力芯片、第四代感知端…

2024-11-08

首幅由人形机器人绘制的艺术品在纽约拍卖会上以108万美元成交
该拍卖行在一份声明中表示:今天,首幅人形机器人艺术家作品以创纪录的价格拍卖,标志着现当代艺术史上的一个时刻,反映了人工智能技术与全球艺术市场日益紧密的交融。 图灵是一位数学家和早期计算机科学家,他作为一名密…

2024-11-08

亚马逊与Anthropic洽谈新投资:数十亿美元或将再度注入人工智能领域
鞭牛士报道,11月8日消息,据《信息报》周四援引一位知情人士报道称,该公司正在就第二笔数十亿美元的投资与人工智能初创公司 Anthropic进行谈判。 去年 9 月,这家云服务巨头宣布向 OpenAI 的竞…

2024-11-08