ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

星海图G0.5架构创新引领潮流,七大评测基准全面领跑具身智能领域

时间:2026-06-02 19:25:43来源:快讯编辑:快讯

北京的具身智能领域迎来重要突破——星海图(Galaxea)正式发布新一代通用视觉-语言-动作模型G0.5,在横跨仿真、真机、零样本、长程任务的7项核心基准测试中全面超越同期竞争对手,尤其在零样本迁移和复杂操作任务中展现出显著优势。这一成果标志着中国团队在具身智能架构创新领域迈出关键一步。

在真实机器人操作数据集DROID的测试中,G0.5未经任何微调直接部署于10项桌面任务,平均成功率达82.5%,较前代模型提升25个百分点。面对需要多步骤顺序执行的"将积木放入抽屉并关闭"任务,G0.5在半数试验中成功完成,而对比模型MolmoAct2则完全失败。这种零样本能力直接反映模型在预训练阶段沉淀的可迁移操作先验,而非针对特定平台的过拟合优化。

在星海图自研平台进行的真实机器人微调测试中,G0.5与两个主流模型使用相同训练数据和计算资源,完成折叠毛巾、整理铅笔盒等6项复杂任务。结果显示其平均成功率达76.7%,较π0.5提升23个百分点,较GR00T-N1.7高出逾一倍。特别在折叠毛巾任务中,模型需协调双臂完成展开、铺平、折叠等精细操作,任何抓握力度偏差都会导致任务失败,G0.5在此类高精度任务中展现出显著优势。

仿真测试环节覆盖单臂指令跟随、双臂协调操作和跨数据集迁移三大场景。G0.5在LIBERO基准测试中以98.9%的成绩刷新纪录,在长程序列任务子集LIBERO-Long中更取得98.6%的突破性表现。双臂协调测试RoboTwin 2.0包含50余个复杂任务,G0.5以93.3%的平均成绩再次领跑。跨数据集迁移测试SimplerEnv-Bridge中,模型同样以87.3%的成绩超越所有对比模型。

最引人注目的是长程移动操作测试BEHAVIOR-1K。该测试包含50个完整家庭场景任务,单次演示平均时长6.6分钟,机器人需在房间尺度空间内完成导航、取物、使用电器等连续操作。G0.5仅用单个预训练模型经过1个训练周期,便取得0.2904的任务成功率,不仅超越前代模型训练4个周期的成绩,更胜过使用4个模型集成的赛事冠军方案。当训练周期增加至4个时,其成功率进一步提升至0.3136,在50个任务中有29个表现优于对比模型。

这些突破性成果源于星海图对现有架构的根本性革新。传统VLA模型采用"视觉-语言模型作为编码器"的架构,将预训练VLM的输出作为条件信号传递给独立训练的动作生成模块。这种设计虽具效率优势,但导致VLM的核心能力经过压缩瓶颈后间接影响动作生成。G0.5则彻底摒弃这种分离架构,让同一套模型权重在自回归序列中同步完成推理和动作生成,使推理真正成为动作的组成部分。

为实现这种统一架构,研发团队引入三项关键技术:跨本体动作编解码器将18种机器人本体数据统一映射到27维动作空间,通过稀疏预测机制仅生成当前需要移动部件的token;原生思维链机制要求模型在生成动作前先输出原子子任务、目标边界框等推理token,这些token与动作token受同一损失函数约束;视觉记忆模块通过分解的时空注意力机制,将多秒历史帧视觉信息轻量级融入当前决策,特别适用于需要反复穿越空间的长程任务。

这种架构创新带来前所未有的控制灵活性。通过改写自然语言提示,用户可直接调整机器人动作风格和执行细节,无需重新训练模型。在"面包放入空气炸锅"任务中,将简单指令改写为"轻轻地把门完全打开"等详细描述后,任务成功率在原有基础上再提升15个百分点。这种能力源于自回归架构中推理token与动作token共享上下文,使动作生成可直接回看完整推理过程。

G0.5的突破得益于星海图"整机+智能"的全栈研发体系。公司自研的R1 Pro和R1 Lite轮式双臂机器人平台已服务全球近百家顶尖机构,其采集的本体数据直接助力模型预训练。基于Qwen3.5 2B视觉-语言模型初始化的G0.5,在预训练阶段联合训练约1亿条视觉-语言问答数据,其中包含5000万条具身场景VQA数据。这种数据与算法的闭环优化,使模型泛化能力与本体适配成本形成良性互动。

值得关注的是,星海图团队此前发布的Fast-WAM论文提出类似架构判断:在动作建模中,训练阶段学到的世界表征比推理时生成的预测帧更重要。两篇工作共同指向一个趋势——中国团队正在具身智能底层架构领域形成原创性判断,这种创新或将重新定义技术发展路径。

更多热门内容
达实智能2天2板涨21%:液冷服务器+机器人+AI应用助力,后续潜力几何?
该股强势的概念有:液冷服务器+机器人+AI应用在AI应用相关领域,AIoT平台概念活跃!在AIoT平台相关领域,公司AIoT物联网平台深度融合AI与IoT技术,搭载多项判别式AI与生成式AI算法,提供海量丰…

2026-06-02

芯厨师AI炒菜机器人:以“三防”细节,为餐饮长期生意筑牢耐用根基
芯厨师用的是专为后厨油污环境定制的抗油屏幕——不是“防泼溅”,而是“沾满油污后,一擦即净,灵敏如初”。当设备厂商开始真正理解后厨的残酷环境,愿意在看不见的地方投入成本、死磕细节,餐饮老板才能真正从“设备焦虑”…

2026-06-02

宇树单款人形机器人累计下线约11000台,IPO拟募资42.02亿加速智能机器人布局
IT之家 6 月 2 日消息,2 日(今天)下午,Unitree 宇树官方公众号发文宣布:截至 2026 年 5月,宇树单款人形机器人累计生产下线约 11000 台。该数量为一款双足人形的数量,不含其他型号…

2026-06-02

京沈携手共谋智造新篇:机器人多领域应用合作开启新征程
座谈交流中,北京企业重点推介工业自动化、智能传感器等前沿技术产品,沈阳本地企业围绕人形机器人研发、智能制造升级、数字化转型等领域提出合作构想,双方就强强联合开展技术研发、产业链配套、成果落地转化、资源共享等方…

2026-06-02

金戈新材申购在即:一季度净利劲增68% 产能扩张布局新兴赛道蓄势待发
数据显示,2023年至2025年公司产能利用率分别高达到138.86%、105.57%和94.96%,主要产品产销率连续三年均保持在95%以上的高位。在产品性能上,公司核心产品具备高分散性、高填充效率和高稳…

2026-06-02

工厂大脑赋能智造:从领克工厂停线响应看工业智能化新未来
它不仅实现实时监控与异常处理,还能支撑管理层进行全局洞察与模拟推演,从根本上改变了人机协同的关系——不再是“人找数据”,而是“数据找人、问题找人”。 在停线管理上,广域铭岛的工厂大脑构建起端到端的智能闭环体系…

2026-06-02

工厂自动化改造:RS485与工业以太网如何抉择?共存方案还是全面替代?
新建项目或大规模产线改造,没有历史包袱,从一开始按工业以太网规划,长期维护成本更低;现有RS485网络节点数量多、轮询周期过长,已经成为生产效率的瓶颈;业务上有设备数据实时上云、远程运维、数字孪生等需求,需…

2026-06-02

2纳米芯片:摩尔定律下的技术突围与多芯片封装新路径
从历史上看,实现这一目标的最佳方法是缩小晶体管、导线和存储单元的尺寸。从钴到钌的过渡似乎还要过一段时间,但我们将在底层互连和布线等特定领域看到它的应用。这实际上取决于中介层的尺寸以及我们将要生产的封装类型,…

2026-06-02

融云斩获出海品牌与技术双奖 CEO董晗荣膺科创女性影响力殊荣
在扬帆出海主办的PAGC 2026大会上,融云一举拿下“出海热度品牌”与“优秀出海产品技术服务”两项金帆奖;同期,全球人工智能大会GAIC 2026将“开箱即用AI服务领军企业奖”授予融云的对话式AI分身;而…

2026-06-02

智绘数字安全蓝图 共筑网安创新生态 2026网络安全产业峰会在京圆满收官
本次峰会由中关村科技企业家协会网安创新企业分会(安创会)主办,中关村科技企业家协会、中关村软件应用技术创新联盟、中关村华安关键信息基础设施安全保护联盟共同指导,建恒信安、安盟信息、江民科技、上元信安、锐西科技…

2026-06-02