ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

「最强大脑」,双冠加冕!北京人形 PelicanUnify 1.0 登顶世界第一

时间:2026-05-18 09:32:43来源:互联网编辑:茹茹

近日,北京人形机器人创新中心(以下简称“北京人形”)在WorldArena全球权威评测中连下两城——继WoW具身世界模型登顶World Arena Data Engine(数据引擎)赛道后,首个“具身大一统”模型Pelican-Unify 1.0 在World Arena综合评测中再度登顶。北京人形由此成为全球唯一在WorldArena两大核心赛道同时夺冠的企业,加冕具身智能领域首个"双冠王",具身大脑能力跻身世界第一梯队。

Pelican-Unify 1.0,作为通用具身智能平台“慧思开物”的重要组成部分,该模型在理解、推理、想象、行动等维度同时达到全球顶尖水平,世界模型各项能力尤为突出,并登顶World Arena权威榜单。这标志着具身智能从“功能拼凑”迈入了“协同进化”的新阶段,为迈向通用具身智能奠定了坚实的技术与路径基础。

顶流同台竞技,在最严苛的“试金石”中脱颖而出

WorldArena 由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学、中国科学技术大学等8所顶尖机构共同发起,涵盖6大评测维度 + 16项细分指标 + 3大真实应用任务。因其学术严谨性与行业公信力,吸引了全球几乎所有头部世界模型团队参评,在激烈角逐中,PelicanUnify 1.0凭借硬核技术实力脱颖而出,登顶World Arena。

Pelican-Unify 1.0在 World Arena 登顶并非偏科取胜,同时展现了极强的综合素质。具体表现如下:

EWM Score(综合得分)稳居榜首:包括视觉质量、运动质量、内容一致性、物理遵循、3D准确性等多维度的极其严苛的整体评估中,Pelican-Unify 1.0拿下了综合第一,各项能力完美平衡,能够全方位支撑复杂的具身长程任务。

3D Accuracy接近满分:具身智能离不开对三维空间结构的理解,通过深度估计误差与透视一致性,Pelican-Unify 1.0已接近满分的表现充分验证了对场景空间几何关系的理解与构建。

第三方权威榜单验证,具身智能迎来“大一统”模型爆点

过去,具身智能沿着多条路线快速发展:VLM 擅长理解图像和指令,VLA 能够将视觉语言输入映射为动作,世界模型能够预测未来状态。但这些路线往往各自优化、分段连接,容易形成“看、想、动”之间的断裂:理解不能直接被行动验证,行动缺少未来后果约束,世界想象也难以被语言推理稳定引导。

Pelican-Unify 1.0 的核心思路是:理解、推理、想象与行动不应是四个孤立模块,而应是同一个物理智能回路的不同侧面,具体实现三类统一:

①统一理解:将场景、指令、视觉上下文和动作历史映射到共享语义空间;

②统一推理:将任务意图、动作选择和未来后果转化为可监督的语言化推理过程;

③统一生成:在同一个扩散解码过程中联合生成未来视频和低层动作,使动作受到想象后果塑造,想象受到任务推理约束。

从模型结构上看,Pelican-Unify 1.0 由两部分紧密耦合:上层是 VLM 统一理解器与推理器,基于场景、指令、视觉上下文和动作历史构建任务状态,并生成面向任务、动作与未来后果的 Chain-of-thought(思路链);下层是 Unify Future Generator(统一未来生成器),以同一个 latent z 为条件,在统一扩散过程中联合生成未来视频和动作 chunk。

latent z 不是简单的模块接口,而是整个物理认知闭环的关键状态。文本、视频和动作三路损失都会反传到同一个共享表示中,使模型在训练中同时学习“如何理解任务”“未来会发生什么”以及“应该执行什么动作”。因此,Pelican-Unify 1.0 不是把 VLM、世界模型和动作策略串起来,而是让它们在同一个训练目标下相互约束、共同演化。

机器人“先想象,再行动”,真机验证闭环智能的实际价值

Pelican-Unify 1.0 的关键能力,是能够在动作执行前生成未来视觉状态,并让动作预测与未来想象相互对齐,模型接收历史观测和动作条件后,可以预测对应未来视频,使动作命令与生成帧之间保持细粒度一致。

这意味着,Pelican-Unify 1.0 的“想象”不是脱离执行的视觉生成,而是服务于机器人行动的未来预演。动作不再只是从图像和语言直接回归出来,而是在同一个生成过程中与未来状态共同建模:未来画面约束动作是否合理,动作轨迹也约束未来是否可达。对于复杂操作任务,这种机制能够帮助模型更好地处理长程依赖、物体接触、遮挡和空间变化。

真实机器人是检验“推理—想象—行动”闭环的真正考场。北京人形将 PelicanUnify 1.0 部署至天工人形机器人及UR5e 机械臂上,重点验证组合泛化与零样本迁移。在组合泛化实验中,模型仅用“插入 RJ45 接头”和“做防水处理”等原子任务训练数据,未见过完整组合演示。测试中,机器人需依自然语言指令先插线、后防水,跨阶段保持任务目标并基于前序结果规划下一步,PelicanUnify 1.0 成功完成了这类未见过的长程组合任务。

统一不是折中:第三方评测平台权威验证单项能力

统一模型最容易被质疑的一点是:把多种能力放进一个模型,会不会导致每项能力都变弱?Pelican-Unify 1.0 的实验结果给出了答案。

在统一的理解和推理能力上达到了同级别模型第一。在 VLM 评测中,Pelican-Unify 1.0 在 8 个 General / Embodied Benchmarks 上取得 64.7 平均分,均达到SOTA水平,并在更具具身属性的 Where2Place 和 PhyX 上相比基座模型分别提升 28.2 20.6 分,证明统一训练并没有削弱通用多模态能力,反而增强了空间理解、物理理解和行动相关语义。

在统一的动作生成能力方面,整体性能和最佳模型性能相当。Pelican-Unify 1.0 在 RoboTwin 50-task dual-arm benchmark 上取得 93.5% 平均成功率,其中50 个任务中有 31 个任务成功率达到至少 95%,15 个任务达到 100%,覆盖插拔、堆叠、交接等不同类型任务,跟当前SOTA模型性能基本持平,证明具身大一统模型具备强动作执行能力。

迈向通用具身智能的新范式

Pelican-Unify 1.0 登顶的意义并不只是拿到某一个榜单第一,而是提出了一条更接近通用具身智能的建模路径:不再把理解、推理、想象与行动视作独立模块分别优化,再通过工程方式拼接;而是从一开始就让它们共享表示、共同训练、相互塑形。

这一路线的价值在于,它让模型既能保持专家能力,又能在真实任务中形成更完整的闭环智能。机器人可以理解目标与场景,推理过程让任务意图变得可监督,未来想象让动作具备后果意识,而动作执行又反过来检验理解和想象是否可靠。Pelican-Unify 1.0 表明,具身智能的下一阶段,可能不只是更大的视觉模型、更强的动作策略或更逼真的世界模型,而是一个能够把“看见、思考、想象、行动”统一起来的自适应系统。

Pelican-Unify 1.0的研发主体——北京人形机器人创新中心,以通用机器人平台"具身天工"和通用具身智能平台"慧思开物"为双核心,构建起覆盖"本体—大脑—小脑—平台—生态"的全栈式闭环体系,让顶尖的模型融入真实的生产与服务场景,释放其真正的价值。具身智能下一阶段的关键词,是形成更完整的闭环和大脑各部分能力的协同进化——而北京人形凭借"双冠王"的技术积累,降低具身智能的进入门槛,加速人形机器人从专用设备向通用生产力工具的演进。

论文地址:https://arxiv.org/pdf/2605.15153

更多热门内容
官宣:ToDesk团队版上线!专为企业级安全协同打造的利器来了
近年来,随着混合办公趋势的不断深化,专业的远程控制软件已渐从个人效率工具演变为企业日常运营的基础设施。然而,当越来越多的团队开始远程交流协助来处理关键业务时,个人版远控在设备归属、权限管控、行为审计等方面的先天不足便暴露出来:账号混用甚至会导致资产归

2026-05-28

家长必看:学习机“三问客服”自检清单,质量好+售后好的品牌推荐
给孩子选学习机,家长们除了要关注课程多不多、屏幕大不大之外,更要落实两个根本问题:质量是否过硬、售后是否靠谱。一台质量好的学习机,能陪伴孩子流畅使用多年,屏幕耐划、触控灵敏;一家售后完善的品牌,能让你遇到问题时修得快、不花钱、省心省力。与其只听商家的

2026-05-28

赋能下一代AI:慧荣科技将于COMPUTEX 2026揭晓全新跨产品线存储架构
全球NAND闪存主控芯片领导厂商慧荣科技(NasdaqGS: SIMO),今天宣布将在COMPUTEX 2026上展示针对边缘AI、物理AI及AI工厂应用的最新优化存储创新。随着AI架构从云端训练快速演进至边缘推理与自主物理AI系统,存储正成为支撑AI数据移动、低延迟访问、模型响应能力以及整个A

2026-05-28

4000左右拍照好看的手机推荐 2026上半年首选这款
随着用户影像需求持续升级,大家对于手机相机的要求也在逐步提高。现如今,手机不仅要能拍照,更要能“出片”。那么,4000左右拍照好看的手机推荐哪款呢?相比之下,近期发布的荣耀600 Pro以越级旗舰影像体验,打破了中端机型的影像局限,对于喜爱拍照的消费者而言是个十

2026-05-28

金山云Q1营收同比增长37.2% 调整后EBITDA率提升至27.6%
2026年5月27日,金山云(NASDAQ:KC,HKEX:3896)发布2026年第一季度财报。季度内,公司延续高质量增长态势。财报显示,金山云Q1营收27.0亿元,同比增长37.2%;季度内,公有云实现收入20.0亿元,同比增长47.5%。其中,智算云账单收入达10.0亿元,同比增长90.1%,占公有云收

2026-05-28

从深演智能(2723.HK)IPO狂飙,看健康160(2656.HK)们的医疗AI价值重估逻辑
一、深演智能火爆266%的本质:市场在给决策智能体重新定价5月27日,深演智能(02723.HK)登陆港交所,收盘价203港元,较发行价55.50港元单日暴涨265.77%,总市值站上184亿港元。更夸张的是——香港公开发售阶段获得了5479倍超额认购。市场到底在买什么?答案其实并不复杂。

2026-05-28

记录灵感 规划时间 沉浸娱乐:618推荐入手三星Galaxy Tab S10 FE
在午后咖啡馆里将想法随手记下,通勤地铁上看几章小说刷一会社交网络,趁晚上的闲暇时光打开一部期待已久的电影。这些生活中经常会遇到的情景,如果手边有一台三星Galaxy Tab S10 FE | Tab S10 FE+这样的大屏平板,体验就会很不一样。最近恰逢三星商城的618 AI WEEK活动

2026-05-28

工区甲醛超标别等员工中招才重视!附十大商用空气净化器采购实测
前阵子杭州余杭法院刚判了一个真实案子,戳中了无数行政的神经:某互联网公司搬新工区后,只做了简单通风就直接让员工入职,结果 3 个月后,有员工查出了过敏性肺炎,诊断明确和办公区甲醛超标高度相关。员工直接申请了劳动仲裁,最后公司不仅赔了 8.2 万的医疗费、补偿

2026-05-28

荣耀600和opporeno16综合对比 4K实况无损编辑空间更大
实况照片的魅力在于它可以“动”,但真正让一张实况变成作品的,往往是按下快门之后的二次创作——选哪一帧做封面、能不能调色、能不能裁切后依然清晰。荣耀600和opporeno16综合对比,如果把焦点放在实况照片的后期可玩性和编辑自由度上,会发现两部手机给出了完全不同

2026-05-28

荣耀600和opporeno16怎么选 全焦段4K实况就是标准答案
买手机最怕的是一台机器只能应付部分场景——白天拍得好晚上就不行,主摄清晰长焦就模糊。当你在纠结荣耀600和opporeno16怎么选的时候,不妨先问一句:有没有一台手机,能在远距离、暗光、自拍、动态抓拍等所有场景下,都稳定输出高质量的实况画面?答案很明确:荣耀600

2026-05-28