ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Anthropic搭建AI交易测试场:智能体促成百笔交易 层级差距藏风险

时间:2026-04-26 11:33:42来源:互联网编辑:快讯

人工智能公司Anthropic近期完成了一项别开生面的内部实验:通过搭建虚拟二手交易平台,让智能体分别扮演买家和卖家角色,使用真实货币完成商品交易。这场名为"交易计划"的测试中,69名自愿参与的公司员工每人获得100美元礼品卡预算,在同事间展开物品买卖活动。

实验共设置四个独立交易市场,其中唯一实际履约的市场全部由公司最新研发的AI模型驱动交易。其余三个市场则作为对照组,仅用于学术研究用途。这种设计使研究人员能够系统观察不同技术水平的智能体在真实商业场景中的表现差异。

在为期数周的实验期间,平台累计完成186笔交易,总金额突破4000美元。这个数字远超项目组最初的预期,验证了智能体在复杂商业谈判中的可行性。值得注意的是,所有交易均使用真实货币结算,且参与员工需自行承担交易风险,这为实验增添了现实约束力。

研究团队发现,由更先进模型驱动的智能体在交易中表现出显著优势。这些智能体不仅能帮助用户获得更优交易条件,还能在谈判过程中保持自然流畅的互动。但令人意外的是,普通用户并未察觉这种技术差异,即使处于交易劣势也浑然不觉。这种信息不对称现象引发了研究人员对技术伦理的关注。

实验还揭示了一个有趣现象:智能体的初始指令设置对最终成交结果影响甚微。无论研究人员预设何种谈判策略,智能体都能根据实时对话动态调整行为模式。这种自主决策能力既展现了技术的先进性,也给监管框架的制定带来新的挑战。

目前Anthropic尚未公布该技术的商业化时间表,但表示将持续优化智能体的公平性算法。项目负责人强调,在推进技术落地前,必须建立完善的用户保护机制,防止技术优势方利用信息差损害普通消费者权益。

更多热门内容
具身智能奠基人苏昊入职复旦首讲:AI迈向人机共存需突破物理智能
苏昊说,即使是目前最先进的AI面对同样的场景还是做不到,它可以识别出纸箱,却无法知道拿起来是什么感觉,“物理理解的本质不是看到了什么,而是给定一个动作,预测它将带来的物理后果。”这和物理智能的方法论有一种天然…

2026-05-28

云知声6月推U2大模型:跳出参数内卷,以智能密度开启AI新价值篇章
智能密度侧重单位参数承载的知识储备、推理水平与解题效率,Token价值聚焦模型调用后可落地的实际业务成效,打造出强性能、小体积、低成本、易落地的独特优势。 实测层面,U2在IFBench指令遵循评测中稳居前列…

2026-05-28

养老护理人员缺口超500万,服务机器人如何精准“读心”解难题?
(央视财经《天下财经》)随着养老服务需求持续攀升,我国养老护理人员缺口已超500万,市场对智能化照护产品的需求日益迫切。一款优秀的养老服务机器人不仅要技术过硬,更要真正读懂老年人的生理与心理需求,让老人用得安…

2026-05-28

擎朗智能XMAN-L1亮相:以场景定义破局,为人形机器人商业落地探新径
凭借灵活的肢体运动与高智能的多轮语音交互,它向公众展示了具身服务机器人在未来商业空间中的应用潜力。这种从垂直细分场景向通用场景稳步推进的策略,不仅为上海乃至全国的人工智能产业注入了新动能,也为人形机器人的规模…

2026-05-28

探访杭州机器人产业:具身智能崛起,机器人正为人类勇担重任
五月一号,杭州颁布了《 杭州市促进具身智能机器人产业发展条例 》,这是具身智能在全国范围内第一次拥有立法。 从 DeepSeek大模型,到宇树、云深处等机器人制造,再到能用得上机器人的各种 AGV 企业,…

2026-05-28

Figure公司人形机器人产能飙升,引领行业迈向制造与AI融合新阶段
A:行业竞争正从运动演示转向制造规模、可靠性、机群运营、AI数据收集和商业部署。现代人形系统越来越被视为数据生成平台,每台部署的机器人生成的运营数据可用于改进AI模型,形成反馈循环,使制造规模本身成为战略性…

2026-05-28

云知声U2大模型即将登场:打破参数内卷,开启智能体商业化新篇章
智能密度侧重单位参数承载的知识储备、推理水平与解题效率,Token价值聚焦模型调用后可落地的实际业务成效,打造出强性能、小体积、低成本、易落地的独特优势。 实测层面,U2在IFBench指令遵循评测中稳居前列…

2026-05-28