OpenAI近期推出了一项名为“封锁模式”(Lockdown Mode)的新安全功能,旨在降低ChatGPT在处理外部数据时面临的提示注入攻击风险。该功能通过限制模型的联网能力、深度研究及智能体模式等高风险操作,减少敏感信息泄露的可能性。目前,所有登录用户均可启用此模式,个人用户可在“设置-安全”选项中开启,企业用户则需通过工作区管理员配置角色权限。
提示注入攻击的核心手段是攻击者将恶意指令嵌入网页、文档等外部内容中。当ChatGPT读取这些内容时,可能被诱导绕过原有规则,执行未经授权的操作,例如将用户输入的隐私数据通过联网功能传输至外部服务器。OpenAI指出,封锁模式的设计并非试图识别所有恶意指令,而是通过切断最关键的攻击路径——向外部发起网络请求,来提升安全性。
启用封锁模式后,ChatGPT的实时网页浏览功能将受到严格限制,仅能访问缓存内容。这意味着搜索结果可能存在不完整、过期或无法使用的情况。同时,模型在回复中不会主动检索并展示网络图片,但用户仍可上传本地图片文件,图片生成功能不受影响。深度研究模式和智能体模式将被完全禁用,模型无法下载网络文件进行分析,仅能处理用户手动上传的数据。通过Canvas生成的代码也将失去联网权限。
OpenAI强调,封锁模式不会影响对话记忆、文件上传、对话分享等基础功能,也不会改变模型训练数据的收集方式。相关隐私设置仍需通过数据控制或企业管理权限单独管理。不过,该公司也明确表示,该模式无法彻底消除提示注入攻击的威胁。恶意指令可能通过缓存内容或用户上传的文件继续影响模型行为,导致回答偏差或信息泄露。
这一举措反映了AI产品安全领域的现实挑战:随着模型联网能力、工具调用及任务执行能力的增强,其面临的攻击面也在同步扩大。智能体模式允许AI自主访问网页、操作外部服务并完成多步骤任务,而这些功能恰好为攻击者提供了可利用的入口。封锁模式通过划定能力边界,将“功能扩展”与“安全风险”的权衡交还给用户和管理者,而非追求绝对安全。