OpenAI近日针对其Atlas AI浏览器的安全风险发布警示,承认提示词注入攻击(Prompt Injection)短期内难以彻底消除。这一安全漏洞自今年10月Atlas浏览器推出以来持续引发行业关注,研究人员已证实攻击者可通过Google Docs等平台植入特定词汇,篡改浏览器底层行为。
提示词注入攻击通过网页或电子邮件隐藏恶意指令,诱导AI智能体执行非预期操作。OpenAI在官方博客中将此类风险类比为网络诈骗和社交工程学攻击,强调其技术层面的根除难度。包括Brave在内的同行企业指出,这是所有AI驱动浏览器面临的系统性挑战,Perplexity公司的Comet浏览器同样存在类似漏洞。
英国国家网络安全中心(NCSC)近期警告称,针对生成式AI的提示词注入攻击可能永远无法完全缓解,建议行业聚焦风险管控而非彻底防御。为应对挑战,OpenAI已建立多层防御体系,包括开发基于大语言模型的自动化攻击模拟系统。该系统通过强化学习模拟黑客行为,在受控环境中预演复杂攻击链,以提前发现潜在漏洞。
目前OpenAI正加速安全补丁发布周期,并引入实时监控模式,要求用户在敏感操作时验证AI代理行为。公司首席信息安全官Dane Stuckey坦言这是”前沿问题”,需持续投入防御机制优化。行业专家指出,AI代理缺乏人类的安全直觉,在访问开放网络时更易受精心设计的指令误导,而攻击载体可能隐藏在图片、表单甚至视觉不可见的文本中。
随着Atlas等AI浏览器逐步普及,提示词注入攻击可能成为影响用户数据安全的主要威胁之一。OpenAI表示将持续与Anthropic、谷歌等企业协作,通过架构级约束和策略管控提升系统安全性。
© 版权声明
文章版权归作者所有,未经允许请勿转载。