AI智能体新纪元：AIR 2025研讨会探索技术前沿与未来趋势-人工智能-ITBear科技资讯

在人工智能领域，Manus智能体的出现引发了广泛的讨论与关注。Manus凭借其独特的定位，成功将智能体概念从抽象推向具体，尽管业界对其技术创新的质疑声不断，认为Manus更多是现有技术的融合而非底层创新。

在AI智能体推理与决策研讨会（AIR 2025）上，来自伦敦大学学院、新加坡南洋理工大学、Weco AI、Google DeepMind、meta、华为、阿里等多位学术界和工业界的研究人员围绕强化学习、推理决策、AI智能体展开了深入讨论。这些讨论不仅揭示了智能体技术的最新进展，也探讨了未来可能的发展方向。

新加坡南洋理工大学的安波教授在研讨会上分享了团队在智能体技术上的最新成果。他详细阐述了从基于强化学习的智能体到由大型语言模型驱动的智能体的演变过程，并介绍了Q*算法。该算法通过多步骤推理进行审慎规划，并在学习Q值模型的过程中，采用离线强化学习、最佳回滚轨迹奖励以及与更强大LLM共同完成的轨迹奖励三个关键步骤。

初创公司Weco AI的CTO Yuxiang则介绍了AIDE，一个由人工智能驱动的Agent，能够处理完整的机器和工程任务。Yuxiang将机器学习和工程视为代码优化问题，将整个过程形式化为在解空间中的树搜索。AIDE能够在任何大语言模型编写的代码空间中进行搜索，从而找到最优解。

伦敦大学学院的宋研讨论了强化学习在大型语言模型推理中的作用，并指出DeepSeek模型在强化学习阶段学会了自我纠正。这一现象表明，大型语言模型在基础模型已具备自我纠正能力的基础上，通过强化学习可以进一步提升其性能。

Google DeepMind的研究员冯熙栋则提出了一种新的理念，即将强化学习的组成部分用自然语言描述出来。他尝试将策略、值函数、贝尔曼方程等传统强化学习概念映射到自然语言表示空间中，从而重新定义强化学习。

在研讨会上，来自华为伦敦的邵坤介绍了面向通用型GUI Agent的模型和优化方法。他展示了GUI Agent在不同任务中的表现，并讨论了如何通过生成模型、Agent系统、微调和评估等方法来提升GUI Agent的性能和效率。

阿里通义千问的林俊旸则分享了Qwen大模型在数据量、模型规模和上下文长度扩展方面的最新进展。他透露，Qwen 2.5版本的数据量已扩展到18T，并计划使用更多token进行训练。同时，Qwen在模型规模和上下文长度扩展方面也取得了显著进展，能够处理更长的文本和更复杂的任务。

这些研究成果不仅展示了AI智能体技术的最新进展，也为未来智能体技术的发展提供了重要参考。随着技术的不断进步和应用场景的不断拓展，AI智能体将在更多领域发挥重要作用。