OpenAI近期宣布推出一款创新性的通用AI助手——ChatGPT代理,据称,这款助手能够代为用户执行多样化的计算机任务。
这款ChatGPT代理不仅具备自动浏览用户日历的功能,还能够生成可编辑的演示文档和幻灯片,并拥有运行代码的能力。OpenAI强调,这些功能的融合使得ChatGPT代理成为了一个多功能的数字助手。
ChatGPT代理整合了OpenAI之前多款代理工具的核心功能,例如Operator的网页点击能力,以及Deep Research将多个网站信息综合成简洁研究报告的能力。用户只需通过自然语言与ChatGPT代理交流,即可轻松享受这些服务。
OpenAI计划于周四向Pro、Plus和Team计划的订阅用户推出这款ChatGPT代理。用户只需在ChatGPT的工具下拉菜单中选择代理模式,即可激活这一功能。
此次ChatGPT代理的推出,标志着OpenAI在AI助手领域的一次大胆尝试。OpenAI希望将ChatGPT从单一的问答工具转变为能够主动执行任务、减轻用户负担的全方位助手。
近年来,硅谷的多家公司,包括OpenAI、谷歌和Perplexity,都推出了旨在实现类似目标的AI助手。然而,这些早期版本的AI助手在处理复杂任务时表现平平,且未能完全达到科技高管们所描绘的终极愿景。
尽管如此,OpenAI表示,ChatGPT代理在功能上远超其以往的产品。新代理能够接入ChatGPT连接器,使用户能够连接Gmail、GitHub等应用程序,以便代理能够检索与用户需求相关的信息。ChatGPT代理还能访问终端,并通过API与特定应用程序进行交互。
OpenAI鼓励用户利用ChatGPT代理进行更复杂的任务,如“规划并购买食材制作四人份日式早餐”,或“分析竞争对手并制作幻灯片”。这些功能要求ChatGPT代理能够解析网页、制定行动方案,并使用工具,这在OpenAI以往的代理产品中并不常见。
OpenAI指出,ChatGPT代理所基于的模型在多个基准测试中展现出了卓越的性能。在Humanity的Last Exam考试中,该模型获得了41.6%的分数,远超OpenAI的o3和o4-mini的得分。在FrontierMath这一难度极高的数学基准测试中,ChatGPT代理在能够使用工具的情况下得分高达27.4%,远超此前的最高得分6.3%。
在开发ChatGPT代理时,OpenAI将安全性视为首要考虑因素。鉴于这款新产品的一些新功能可能在不法分子手中变得危险,OpenAI采取了多项预防措施。例如,在生物和化学武器领域,该模型被评定为高能力,OpenAI因此启动了新的保障措施以降低潜在风险。
为了确保安全,OpenAI在ChatGPT代理中设置了一个实时运行的监视器。每当用户向ChatGPT代理发出请求时,该监视器都会运行一个分类器,以判断请求是否与生物学相关。如果是,那么ChatGPT代理的响应将经过第二个监视器的检查,以确保内容不会被用于制造生物威胁。
为了防止滥用,OpenAI还禁用了ChatGPT代理的记忆功能。在ChatGPT的其他版本中,记忆功能允许聊天机器人引用之前的聊天记录。然而,OpenAI担心不法分子可能会利用这一功能进行快速注入攻击,窃取敏感数据。不过,OpenAI表示未来可能会重新考虑启用这一功能。
尽管ChatGPT代理听起来非常强大,但它在现实世界中的表现仍有待验证。迄今为止,代理技术在与现实世界交互时一直面临着诸多挑战。然而,OpenAI表示,他们已经开发出了一款功能更为强大的模型,有望兑现AI助手的承诺。