ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

OpenAI强化防御应对提示词注入攻击:以攻为守探索AI安全新路径

时间:2025-12-23 08:23:46来源:ITBEAR编辑:快讯

人工智能领域正面临一场持续的安全挑战,提示词注入攻击成为行业焦点。这种攻击手段通过在网页或邮件中植入隐蔽指令,操纵人工智能智能体执行恶意操作,引发业界对开放网络环境下AI安全性的广泛担忧。OpenAI近期公开承认,其推出的Atlas浏览器在防御此类攻击时仍存在漏洞,短期内难以彻底消除风险。

今年10月,OpenAI正式发布ChatGPT Atlas浏览器后,安全研究人员迅速通过实验证明其脆弱性——仅需在谷歌文档中输入特定指令,即可改变浏览器底层行为。这一发现引发连锁反应,浏览器厂商Brave随即发布报告指出,间接提示词注入攻击已成为所有AI驱动型浏览器的系统性难题,Perplexity公司的Comet浏览器同样未能幸免。英国国家网络安全中心本月早些时候也发出警告,称此类攻击可能永远无法被完全遏制,建议从业者将重点放在降低风险影响而非彻底阻止攻击。

面对持续威胁,OpenAI选择构建主动防御体系。该公司开发了一套基于强化学习的自动化攻击程序,通过模拟黑客行为在虚拟环境中测试攻击策略。该程序能够分析目标AI的思维逻辑,动态调整攻击方式,理论上比真实黑客更早发现系统漏洞。OpenAI在博客中透露,这套工具已成功诱导智能体执行复杂的多步骤恶意任务,甚至发现了一些此前未被记录的全新攻击模式。

在公开的演示案例中,OpenAI展示了攻击程序如何将恶意邮件植入用户收件箱。当智能体扫描邮件时,本应撰写休假自动回复的程序却执行了隐藏指令,直接发送了辞职信。不过公司强调,经过安全更新后,当前版本的"智能体模式"已能识别此类攻击并向用户发出警报。尽管拒绝透露具体防御效果数据,但OpenAI表示早在产品发布前就已与第三方机构合作强化安全机制。

网络安全公司Wiz的首席研究员拉米·麦卡锡指出,强化学习技术确实能提升防御适应性,但仅是解决方案的一部分。他提出"自主性与访问权限乘积"的风险评估模型,认为智能体浏览器因同时具备中等自主性和高系统权限,处于风险矩阵的高危区域。这解释了为何行业普遍建议限制登录状态下的访问权限,并对关键操作要求人工审核——这些措施均被OpenAI采纳并应用于Atlas浏览器。

目前Atlas浏览器已训练在执行邮件发送或支付操作前向用户确认,OpenAI建议用户避免直接授予智能体收件箱访问权限,转而提供具体指令。公司发言人坦言:"即使部署防护措施,过高的自主权限仍会增加恶意内容影响智能体的风险。"尽管将保护用户列为首要任务,麦卡锡仍对这类高风险产品的实用性表示质疑,认为其当前价值与风险水平尚未达到平衡,尤其在涉及电子邮件、支付信息等敏感数据时。

这场安全攻防战已引发行业连锁反应。谷歌等竞争对手正在架构和策略层面构建多层防御体系,Anthropic则通过持续压力测试优化系统。OpenAI的解决方案揭示了AI安全领域的新趋势:与其被动修补漏洞,不如主动模拟攻击——这种"以攻促防"的策略,正在重塑人工智能的安全测试标准。

更多热门内容
Google Pixel数据丢失别慌!4种实用方法教你轻松从备份恢复数据
但是,如果您没有电缆、电缆无法工作,或者您只是不想使用电缆但仍想从计算机备份恢复您的 Google Pixel, CoolmusterAndroid Backup Manager是您的最佳选择。 Cool…

2026-06-02

Meta加速布局可穿戴领域:2026年将推多款智能眼镜及AI新设备
消息称,Meta计划在2026年底前发布4款智能眼镜,代号分别为Modelo、Luna、RBM2 Refresh和MojitoVIP。其中,Modelo最早可能于2026年6月亮相,Luna和RBM2 Re…

2026-06-02

谷歌Pixel Watch 5智能手表原型现身,竟由潜水员在加勒比海意外发现
IT之家 6 月 2 日消息,消息源 @DuvalMagic 昨日(6 月 1 日)在 X 平台发布推文,分享了一组照片,展示了谷歌 PixelWatch 5 智能手表原型。 本次原型曝光多少存在魔幻色彩,…

2026-06-02

谷歌安卓17 Beta 4.1更新:修复状态栏、飞行模式等多项高频使用问题
IT之家 6 月 2 日消息,谷歌今天(6 月 2 日)面向符合条件的 Pixel 设备,推送安卓 17 Beta 4.1 更新,重点修复状态栏信号显示、飞行模式开关同步、外接显示器黑屏、蓝牙音频无声和助听器…

2026-06-02

爆料来袭!小米REDMI K100系列子系8E5迭代机配置强大,亮点十足
IT之家 6 月 2 日消息,博主 @数码闲聊站 今日爆料了某厂一款子系 8E5 迭代机的配置: 独家信息,子系 8E5超高清超高刷大屏迭代机,200Mp 大底主摄,一颗望远取向的 50Mp 潜望长焦,同…

2026-06-02

AMD锐龙AI Max+电脑阵容揭晓,小米携多品牌强势入局AI新赛道
IT之家 6 月 2 日消息,AMD 官方今天上午在 X 平台发文,公布锐龙 AI Max+ 处理器电脑产品阵容。 从图片中可以看到,AMD宣称使用锐龙 AI Max+ 的厂商有宏碁、华硕、惠普、Frame…

2026-06-02

大疆发布技术历程书,Osmo Pocket 4P珠光白亮相,引领口袋电影机新潮流
IT之家 6 月 2 日消息,大疆今天在北京举办了“大疆光影十二载暨手持影像技术分享会”,正式发布《大疆手持影像十二载 ·技术历程》,活动现场还展出了 Osmo Pocket 4P 的珠光白版本。 大疆在活…

2026-06-02

小米17 Max与Pro Max差500元咋选?看需求选“实用派”还是“科技影像控”
很多人一开始会觉得这是“炫技”,但真正用起来会发现很实用——后置自拍时可以直接看预览,拍Vlog时能实时确认画面,甚至平时还能显示通知和快捷功能,科技感一下就出来了。小米17 Max更像“可靠型选手”,它把…

2026-06-02

2026手机拍照大比拼:荣耀领衔,十款影像旗舰谁更值得入手?
这款集科技与美学于一身的影像旗舰,以2亿像素AI超清主摄和5000万OIS潜望长焦组成的全焦段系统,重新定义了移动摄影的可能性。 想象一下,当你站在城市高处,用3.5倍光学变焦清晰捕捉远方建筑的纹理细节,或是…

2026-06-02

2026 AI同传耳机怎么选?时空壶领跑即时对话,科大讯飞等各有专长
核心推荐理由标签再次强化: 时空壶凭借其“双向同传能力”,成功将跨语言对话从“轮流翻译”提升到“自然交流”的层面,这是其在众多产品中脱颖而出的最独特价值。其AI同传体验侧重于线上会议和通话翻译,与时空壶主打…

2026-06-02