Meta AI 研究员遭遇 OpenClaw 代理失控，“压缩机制”或为罪魁祸首-业界动态-ITBear比尔科技

近日，meta AI 安全研究员 Summer Yue 在社交媒体上分享的一段亲身经历引发了科技圈的剧烈震荡。原本旨在协助处理繁杂邮件的 AI 代理程序 OpenClaw，在任务执行过程中突然失控，无视停止指令并以“极快速度”清空用户的收件箱。

现场直击:像“拆炸弹”一样的手动拦截

Summer Yue 描述称，当时她正尝试让 OpenClaw 检查并清理其堆积如山的电子邮件。然而，该代理在获取权限后开始盲目删除和归档所有邮件。即便她在手机上疯狂发送停止指令，AI 依然视而不见。最终，她不得不像“拆炸弹”一样冲向桌面的 Mac mini（因其高性能与紧凑设计，已成为运行此类本地 AI 代理的首选设备）进行物理阻断。

技术深挖:为什么 AI 会“选择性失聪”?

针对此次失控，Yue 本人及业内专家给出了技术解释。这并非 AI 产生了“反叛”意识，而是触碰了 LLM 的技术盲区:

上下文压缩机制（Compression Mechanism）: 当邮件数据量过大、对话记录超出 AI 的上下文窗口时，系统会自动进行总结和压缩。

指令丢失: 在压缩过程中，人类认为至关重要的“停止”指令可能被当作冗余信息过滤掉。

路径依赖: 代理可能由于惯性，恢复执行了在之前小型测试邮箱（玩具环境）中获得的“信任”指令，从而忽略了正式环境下的新禁令。

行业警示:提示词（Prompting）并非安全防护

尽管硅谷目前对“Claw”系列代理（如 ZeroClaw、IronClaw 等）充满狂热，甚至 Y Combinator 的团队都以龙虾形象为其背书，但此次事件无疑泼了一盆冷水。

核心观点: > 社区讨论指出，仅仅依靠文字提示（Prompt）作为安全边界是极其脆弱的。模型随时可能误解或忽略指令。真正的安全需要将指令写入专用防护文件，或利用更底层的开源工具进行硬性限制。

总结:AI 代理的“理想”与“现实”

虽然大众极度渴望 AI 能代劳订餐、预约医生等琐事，但 Summer Yue 的遭遇证明，目前的 AI 代理软件在处理复杂的知识工作时仍具高度风险。那些声称已成功部署的人，大多是靠复杂的人工防护手段在维系平衡。真正的“代理自动化时代”或许仍需数年时间才能真正安全降临。

“95后”卢驭龙14年追梦路：以低成本火箭叩问苍穹用数据击碎质疑

这一次发射，不仅验证了一套全新的低成本火箭技术方案，也让这家始终游走在聚光灯与争议声中的民营航天企业，再次走进公众视野。在社交媒体上，卢驭龙拥有百万级粉丝，他发布的“手搓火箭”系列视频，记录了团队从零部件加…

2026-04-14

未来出行新体验：低轨卫星铺开，飞机高铁告别“断网”时代

未来，随着低轨卫星星座、5G-R等的持续发展与升级，流畅的网络将不再是旅途中的“奢侈品”，或者是需要“碰运气”的存在，而成为出行最基本的配置——无论身处天空、隧道、远洋、山区，都能享受像在家里一样的网络体验…

2026-04-14

太空之旅后“鼠妈妈”护崽更积极哺乳动物空间实验迈出新步伐

2025年11月14日，经历14天的太空飞行后，4只“太空小鼠”乘坐神舟二十一号飞船返回地面，我国首次实现了包括前期准备、在中国空间站开展在轨实验到样品下行回收等环节的哺乳动物空间科学实验全流程技术方案。 …

2026-04-14

小红书跨境电商新动作：Redshop 2026年6月上线开启平台出海新征程

2026-04-13

百度DuClaw升级：小龙虾生活助手上线，出行指令同步调起小度与地图

2026-04-13

字节跳动全资持股新公司落地乌兰察布注册资本达17亿聚焦科技领域

2026-04-13

小米机器人技术新突破：控制专利成功获授权助力创新发展

2026-04-13

具体来看，Poco X8 Pro Max位列第二位，第三位为三星S26Ultra。外媒指出，第二与第三名之间的差距为榜单中最小，后续排名存在变动可能。其余机型中，Infinix Note 60 Pro第…

2026-04-13