大模型智能体的发展正经历从“对话交互”到“任务执行”的关键转型,如何高效整合外部能力成为行业关注的焦点。香港中文大学研究团队近期提出一种名为“SLIM”的动态技能生命周期管理框架,通过创新性的技能管理机制,为智能体在复杂场景中的能力调用提供了系统性解决方案。该成果发表于学术期刊,标志着智能体技术从“技能堆砌”向“动态优化”迈出重要一步。
在网页搜索、自动化办公及具身机器人等长时序任务中,智能体常需依赖外部技能处理高风险或低频操作。传统方法存在明显缺陷:过度积累技能会导致检索效率下降,而完全依赖模型内部推理则可能丢失关键能力。SLIM框架突破这一困境,将外部技能视为具有生命周期的动态系统,使模型在强化学习过程中自主决定技能的保留、淘汰或扩展,形成“技能-策略”协同优化的闭环。
该框架的运行机制包含三个核心环节。训练阶段首先通过状态感知检索通用或任务专属技能,利用GRPO算法更新决策策略;随后采用“留一法”进行技能审计——通过临时禁用特定技能评估其边际贡献,贡献显著者保留,长期低效者淘汰;当遇到持续失败的新场景时,系统自动从失败案例中提取模式并生成新技能。这种动态调整机制确保技能库始终保持精简高效。
实验数据显示,SLIM框架在多项基准测试中表现优异。在ALFWorld家庭环境任务中,其任务完成率达87.5%,较SkillRL等强基线方法提升12.5个百分点;在SearchQA信息检索任务中,该框架验证了模型将部分搜索策略内化为内部能力的可行性,展现出跨场景的适应性优势。整体性能较现有最佳方法平均提升7.1个百分点,证明动态技能管理对复杂任务落地的关键作用。
业内专家指出,SLIM框架重新定义了外部技能的角色定位。传统方法将技能库视为静态工具集,而SLIM使其成为可训练的动态组件,与决策策略形成有机整体。这种设计不仅解决了“哪些能力应内置、哪些应外接”的技术难题,更赋予智能体在开放环境中自主判断何时调用外部支持的认知能力,为具身智能的产业化应用提供了重要理论支撑。



