ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

EvoPhys-World登顶世界生成榜首 国产GPU与软件栈全栈赋能显实力

时间:2026-06-20 00:57:40来源:互联网编辑:快讯

北京大学EvoPhys团队近日在人工智能领域取得突破性进展,其研发的5D世界模型EvoPhys-World在斯坦福大学WorldScore公开评测中登顶“世界生成”赛道。该模型以人类为中心,突破传统AI在物理世界交互的局限,实现了从“可观看”到“可操控”的跨越式发展。值得注意的是,这项前沿研究全程基于国产摩尔线程MTT S5000全功能GPU完成训练,标志着我国在自主算力支撑高水平AI研究方面迈出关键一步。

传统AI模型在物理世界的应用长期面临“浅交互”瓶颈,而EvoPhys-World通过创新架构设计,将第一视角人类观察与手部动作作为核心交互接口。该模型从海量无标注人手视角数据中自主学习,构建了包含“万物孪生引擎”与“世界操控策略”的双重体系,形成从环境生成到动态操控的完整闭环。这种设计使AI不仅能生成逼真场景,更能理解物理规则并实现复杂操作,例如精准抓握、书写轨迹预测等深度交互行为。

支撑这项突破的算力底座来自摩尔线程旗舰级产品MTT S5000。这款专为大模型训练设计的全功能GPU,通过计算单元协同优化与原生FP8多精度训练技术,为长时序交互数据建模提供稳定算力。配套的MUSA软件栈展现出强大适应性,其分布式训练框架、高效卡间通信机制及软硬件协同优化能力,成功支撑起扩散式生成与多模态时空建模的复杂需求。在长达4万小时的训练过程中,系统保持了卓越的稳定性与扩展性。

实测数据显示,MTT S5000在集群扩展方面表现优异。从单机8卡扩展至20节点160卡时,训练吞吐量维持近线性增长,弱扩展效率达90%,这一指标与国际主流产品处于同一水平。在相同实验条件下,国产算力平台在训练吞吐量、多机扩展效率等核心指标上,与国际竞品基本持平。更关键的是,基于MTT S5000训练的模型在生成质量上达到国际先进水平,其输出的第一视角操作视频在物体抓握、书写笔迹、物理反馈等细节表现上,与使用国际主流产品训练的模型难分伯仲。

这项成果的背后,是国产软硬件生态的深度协同。摩尔线程与北京大学构建了从模型研发到算力部署的全链路闭环:MUSA软件栈提供从算子开发到分布式训练的全栈支持,MTT S5000集群保障大规模并行计算的稳定性,最终通过开源生态赋能开发者社区。这种协作模式不仅解决了科研团队的算力瓶颈,更为国内具身智能领域提供了自主可控的技术路径,显著提升了从实验室创新到产业落地的转化效率。

作为该项目的算力支持方,摩尔线程通过“灯塔计划”为前沿科研提供专项扶持。该计划面向全球科研机构开放优惠算力资源及工程支持,重点助力具有原创价值的AI项目突破资源限制。EvoPhys-World的成功验证了国产芯片在支撑高水平AI研究方面的可行性,为国内科研团队使用自主算力平台树立了标杆案例。随着MUSA软件栈生态的不断完善,国产GPU正在从基础训练支撑向全流程赋能演进,为AI技术创新提供更坚实的底层保障。

更多热门内容
基于宇树G1改装的人形机器人 Pemba 登顶火山,未来将挑战珠峰
配备摄像头、传感器、卫星通信和机载 AI 后,人形机器人可以自主巡查大范围区域,并持续收集环境数据。按照设想,Pemba 将在珠峰大本营和海拔近8000 米的四号营地之间活动,收集电池性能、行走能力、关节受…

2026-06-20

亚马逊自研AI芯片或对外售,英伟达市场格局待变
据媒体报道,亚马逊正洽谈将其定制的Trainium加速器出售给其他公司用于数据中心,这意味着其芯片将直接与主导当前AI市场的英伟达(NASDAQ: NVDA)GPU展开正面竞争。大型AI客户已做出采购承诺:O…

2026-06-19

Claude Code再升级:终端内一键生成交互网页,开启开发者协作新范式
想想一下,当你在终端里跟Claude Code对话写代码,它能把这段工作直接变成一个可交互的HTML网页,生成私密链接,浏览器里打开就能看。 Claude会把你的对话上下文、代码库、连接的工具数据全部吃进去…

2026-06-19

小米Miloco 2.0开源,智能家居迎Agent时代,超级AI管家走进现实
Xiaomi Miloco2.0,就是这样一个核心系统,可以化作Agent的“眼睛、耳朵、记忆”,各类米家设备作为全模态感知入口,Miloco 2.0通过视觉、声音、环境感知实现全屋理解,将用户需求传达给…

2026-06-19