ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

蚂蚁灵波再发力!LingBot-VA让机器人“脑补”未来,通用机器人迎新突破

时间:2026-01-31 03:39:06来源:快讯编辑:快讯

机器人领域迎来重大突破——蚂蚁灵波团队近日开源了全球首个面向通用机器人控制的因果视频-动作世界模型LingBot-VA,这项技术让机器人首次具备"脑补未来"的能力。传统机器人依赖"观察-反应"模式,如同条件反射般执行动作,而LingBot-VA通过自回归视频预测技术,在执行动作前会先在脑海中推演未来数秒的画面,这种"想象力决策"机制为机器人控制开辟了全新路径。

该模型的核心创新在于解耦了传统VLA(视觉-语言-动作)架构中的表征缠绕问题。研究团队采用"先想象世界,再反推动作"的两步策略:首先通过视频世界模型预测未来视觉状态,再利用逆向动力学模型推导所需动作。这种设计使机器人能够完成三类高难度任务:在长时序任务中(如准备早餐),机器人可精准记忆操作步骤;高精度任务中(如擦拭试管),动作精度达到毫米级;面对可变形物体(如折叠衣物),能通过视频推演预判物体形变。真机测试显示,机器人完成拧螺丝任务时,动作流畅度与人类操作几乎无异。

技术实现层面,团队在三个维度取得突破。架构设计上,视频Token与动作Token构成自回归交错序列,配合因果注意力机制确保模型只能使用历史信息。通过KV-cache技术赋予模型长期记忆能力,使其能清晰追溯三步前的操作状态。在模型分工方面,Mixture-of-Transformers架构将视觉推演与动作控制分离:视频流负责复杂视觉分析,动作流专注精准运动控制,两者通过共享注意力机制实现信息互通。工程优化环节,部分去噪技术允许模型从含噪中间状态提取关键信息,异步推理机制使动作计算与执行并行进行,FDM接地技术则通过真实数据持续校正模型想象,防止出现脱离现实的幻觉。

在RoboTwin 2.0双臂协作基准测试中,LingBot-VA展现出显著优势:简单场景成功率达92.93%,复杂场景成功率91.55%,分别超出第二名4.2%和4.6%。随着任务难度增加,其领先幅度扩大至9%以上。在LIBERO基准测试中,该模型更以98.5%的平均成功率刷新纪录。实验数据显示,LingBot-VA具有三大核心能力:长期记忆能力使其在计数任务中精准记录操作次数;少样本适应能力仅需50条演示数据即可掌握新任务;泛化能力允许模型识别并操作不同颜色、形状或摆放位置的同类物体。

此次开源是蚂蚁灵波四天技术发布计划的收官之作。此前三天,团队已陆续开源LingBot-Depth(增强视觉感知)、LingBot-VLA(打通语言视觉动作接口)、LingBot-World(构建可预测世界模型)三个项目。四者构成完整技术链条:从清晰感知到理解世界,从构建想象到指导行动,推动通用机器人进入视频推理时代。这种技术范式已引发行业连锁反应,谷歌Project Genie项目、宇树科技UnifoLM-VLA-0等相继开源,海外媒体评价称:"蚂蚁集团通过完整开源工具包,在全球机器人领域主导权争夺中迈出战略性一步。"

更多热门内容
李飞飞新文解析:视频生成、机器人与NVIDIA的“世界模型”之争与分类新解
比如,最近已有少量但在增长中的工作来自不同的机器人实验室,它们展示了一种至少在概念上成立的可能性:一个预训练的视频渲染器可以作为联合世界预测和动作预测的骨干网络,让单一模型同时想象“会发生什么”和“该做什么…

2026-06-04

苹果新任CEO特纳斯调整战略:搁置Vision Pro,全力押注智能眼镜赛道
【环球网科技综合报道】6月4日消息,据Macrumors报道,苹果公司即将上任的首席执行官约翰·特纳斯已批准对VisionPro及智能眼镜业务进行重大战略调整,正式搁置Vision Pro后续产品计划,将…

2026-06-04

微信聊天记录误删别慌!4种官方恢复实测有效,关键时刻能“救急”
适用场景刚换了新手机,旧手机还在身边之前没有备份,但旧手机上的微信聊天记录还完整操作步骤在新手机上登录微信打开「我」→「设置」→「通用」→「聊天记录迁移与备份」选择「迁移到手机/电脑」(如果是旧手机迁到新手…

2026-06-04

Marvell美满电子迎新机遇:获谷歌TPU定制网络芯片设计订单
IT之家 6 月 4 日消息,科技媒体 Wccftech 昨日(6 月 3 日)发布博文,报道称 Marvell(美满电子)近期迎来多重利好消息,在被英伟达首席执行官黄仁勋预言成为下一个万亿美元公司后,最新消…

2026-06-04

齐向东谈AI时代网络安全:攻防失衡,构建“三位一体”防御体系破局
演讲中,齐向东提出AI时代网络安全的“三个攻防失衡”:攻击日益高效化、自动化、平民化;传统防护静态化、人工化、单点化,形同虚设;“AI+”赛道竞速中攻击方天然占优。 他强调,破局的关键在于实施“安全升级”,…

2026-06-04

一季度折叠屏手机市场:华为以60%份额强势领跑 荣耀紧跟其后表态学习
CNMO科技注意到,华为以60%的市场份额领跑行业;荣耀位居第二名,占比21%。 荣耀Magic V6的最大亮点之一在于,其顶配版内置7150mAh新一代青海湖刀片电池,硅含量达32%,能量密度为985Wh/…

2026-06-04

2026年安卓旗舰机推荐:这几款手机流畅不卡顿,上班族长期使用优选
小结:Find X9s Pro通过 “天玑9500旗舰芯片 + 潮汐引擎性能调度 + ColorOS 16极光引擎 + AI场景化优化” 的四重组合拳,构建了一个立体、动态的流畅保障体系,完美契合了“系统流…

2026-06-04

郭明錤透露苹果路线图调整:移除Vision Pro系列,转向AI眼镜布局
IT之家 6 月 4 日消息,北京时间周四凌晨,分析师郭明錤发帖称,苹果 XR 头显和智能眼镜路线图中仅剩两款智能眼镜产品可见。郭明錤还表示,这次重大调整由苹果下一任 CEO 约翰 · 特努斯(John T…

2026-06-04

Marvell美满电子获新机遇:将为谷歌设计TPU定制网络芯片 2027年量产
IT之家 6 月 4 日消息,科技媒体 Wccftech 昨日(6 月 3 日)发布博文,报道称 Marvell(美满电子)近期迎来多重利好消息,在被英伟达首席执行官黄仁勋预言成为下一个万亿美元公司后,最新消…

2026-06-04

苹果新任CEO或叫停Vision Pro后续计划 全力押注智能眼镜赛道
【环球网科技综合报道】6月4日消息,据Macrumors报道,苹果公司即将上任的首席执行官约翰·特纳斯已批准对VisionPro及智能眼镜业务进行重大战略调整,正式搁置Vision Pro后续产品计划,将…

2026-06-04