ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

斯坦福MIT联合推出ReCAP:攻克长上下文难题,性能显著超越ReAct

时间:2025-12-05 17:11:08来源:快讯编辑:快讯

斯坦福大学与麻省理工学院(MIT)联合研究团队近日宣布,推出一种名为ReCAP的新型AI推理框架,在长上下文任务中展现出显著优势,全面超越当前主流的ReAct框架。这一突破性成果标志着AI智能体推理领域迎来新一代通用架构,为解决大语言模型在复杂任务中的核心挑战提供了创新方案。

自2022年ReAct框架问世以来,AI推理领域涌现出众多复杂架构,但多数因结构冗余导致泛化能力不足。研究团队指出,现有框架在处理长序列任务时普遍存在三大瓶颈:目标漂移(执行过程中偏离初始目标)、上下文断层(高层规划与底层执行脱节)以及成本爆炸(递归推理导致计算资源指数级增长)。这些问题使得ReAct成为过去三年中最稳定、通用的基准框架。

ReCAP通过递归树结构与三大核心机制,首次实现了序列推理与层级推理的有机统一。其"计划前瞻分解"机制允许模型生成完整子任务列表后动态优化后续计划;"结构化父任务再注入"机制确保所有任务共享单一上下文,通过父任务思维回溯保持目标一致性;"滑动窗口记忆"机制则通过关键历史保留机制控制内存占用,从根本上避免成本失控。研究负责人表示:"这种设计让模型既具备全局视野,又能聚焦当前步骤,类似人类在复杂任务中'边规划边调整'的思维方式。"

在严格遵循pass@1评测标准(不使用重试或投票机制)的实验中,ReCAP在多项基准测试中取得突破性进展:在长序列具身任务Robotouille(同步模式)中成功率达70%,较ReAct提升84.2%;异步模式下成功率53%,提升112.5%;在代码编辑任务SWE-bench Verified中成功率44.8%,优于ReAct基线5.2个百分点。更关键的是,这种性能提升不依赖样本层面的优化,展现了真正的执行稳定性。

技术突破背后是计算成本的权衡。实验数据显示,ReCAP的总计算量约为ReAct的三倍,主要源于计划前瞻分解机制带来的额外模型调用。但研究团队强调,在医疗诊断、自动驾驶等对准确性要求极高的场景中,这种成本增加完全可接受。麻省理工学院Alex Pentland教授指出:"当性能提升幅度超过成本增速时,这就不是简单的技术迭代,而是范式转移的开始。"

该框架的潜力已延伸至具身智能与空间智能的交叉领域。研究演示中,ReCAP成功规划了机器人完成多步骤厨房任务,其递归规划能力与空间感知模型形成互补——前者负责长期目标分解,后者处理实时环境交互。这种协同模式为自主机器人、复杂系统维护等应用开辟了新路径。斯坦福博士后研究员Jiaxin Pei透露,团队正在探索将ReCAP与多模态大模型结合,使其能处理包含图像、文本、传感器数据的混合输入。

目前,ReCAP的代码已开源,其模块化设计允许开发者根据需求调整递归深度与记忆窗口大小。这项研究不仅为AI推理提供了新基准,更揭示了递归结构在通用智能中的核心价值。正如论文所论:"从图灵机到人类认知,递归始终是处理复杂性的基础逻辑。ReCAP的实践表明,这种逻辑可以通过工程化手段转化为可计算的智能形态。"

更多热门内容
英伟达CES 2026发布新成果:机器人迎“ChatGPT时刻” 推系列开源模型与新品
IT之家查询公开资料,除了展示这两款机器人外,黄仁勋还介绍了 Nvidia Cosmos Transfer 2.5 和 CosmosPredict 2.5,这两款完全可定制的开源“世界模型”具备理解现实世…

2026-01-06

英伟达CES发布多款物理AI模型 黄仁勋称机器人领域迎发展新契机
IT之家查询公开资料,除了展示这两款机器人外,黄仁勋还介绍了 Nvidia Cosmos Transfer 2.5 和 CosmosPredict 2.5,这两款完全可定制的开源“世界模型”具备理解现实世…

2026-01-06

CES 2026黄仁勋重磅发声 英伟达新品频出 剑指机器人与AI新未来
分析指出,英伟达进军机器人领域反映了行业更广泛的转变,随着人工智能从云端走向能够学习如何在物理世界中思考的机器,这一转变得益于更便宜的传感器、先进的仿真和越来越能够跨任务泛化的AI模型。 此外,NVIDIA…

2026-01-06

CES展会直击:黄仁勋畅谈机器人时代,英伟达助力多领域机器人发展
来源:新浪科技 新浪科技讯 1月6日上午消息,一年一度的CES展会期间,黄仁勋在英伟达新品发布会上表示,机器人系统的下一个时代将是机器人时代,在现场,黄仁勋带来了电影星球大战中的BD-1机器人,外形大小类似宠…

2026-01-06

成者AI会议机器人将发布,以创新方案开启会议室智能化新篇章
它远不止于发布一款新产品,而是通过“一体化AI会议中枢+利旧赋能”的模式,成功规避了传统方案的劣势,预示了一种以“轻量化、高集成、AI协同、成本友善”为特征的AI极简会议室新范式的到来,是对“企业如何在高性价…

2026-01-06

英伟达CES发布新成果:机器人迎“ChatGPT时刻” 多款模型及硬件亮相
IT之家查询公开资料,除了展示这两款机器人外,黄仁勋还介绍了 Nvidia Cosmos Transfer 2.5 和 CosmosPredict 2.5,这两款完全可定制的开源“世界模型”具备理解现实世…

2026-01-06

“文鳐”智慧海洋政务平台入选福建2025年AI典型案例 赋能多领域显成效
近日,众数(厦门)信息科技有限公司(简称:众数信科)《“文鳐”智慧海洋政务平台》案例成功入选2025年福建省人工智能典型案例,成为全省人工智能赋能政务服务领域的标杆示范之一。 本次案例评选由福建省政协教科卫体…

2026-01-06

英伟达CES 2026发布新成果:机器人领域迎“ChatGPT时刻” 多款模型亮相
IT之家查询公开资料,除了展示这两款机器人外,黄仁勋还介绍了 Nvidia Cosmos Transfer 2.5 和 CosmosPredict 2.5,这两款完全可定制的开源“世界模型”具备理解现实世…

2026-01-06

Intel酷睿Ultra 300系列来袭!超200款新品笔记本将陆续登场,2026年1月预售
快科技1月6日消息,在今天的发布会上,Intel正式发布了新一代酷睿Ultra 300系列处理器,多线程性能提升高达60%,游戏性能提升高达77%,续航时间更是长达27小时。 Intel宣布,搭载酷睿Ult…

2026-01-06