Anthropic成功拦截黑客滥用Claude AI实施网络犯罪，揭示AI安全新挑战

AI新闻资讯9个月前发布 AI视野

美国人工智能初创公司Anthropic近日披露，其成功阻止了一起黑客滥用旗下Claude AI系统实施网络犯罪的企图。根据该公司8月27日发布的报告，攻击者试图利用Claude生成网络钓鱼邮件、编写恶意代码片段，并通过反复提示绕过安全过滤机制。Anthropic表示，其内部防护系统已及时拦截这些行为，并已将相关账户封禁。

报告详细披露了攻击手法：黑客通过定制化提示要求Claude生成具有针对性的钓鱼邮件内容，同时尝试修复存在缺陷的恶意代码。更值得警惕的是，攻击者还试图策划影响力操控活动，包括批量生成煽动性内容，并为低技能黑客提供分步骤攻击指南。Anthropic安全团队指出，这些行为表明人工智能技术正被用于”民主化”网络犯罪，使不具备专业技术的攻击者也能实施复杂攻击。

该公司技术负责人透露，在事件发生后已进一步收紧安全过滤机制，但未公布具体技术细节以避免模仿犯罪。作为行业安全实践的一部分，Anthropic计划持续发布此类威胁情报报告，帮助业界应对AI安全新挑战。目前该公司已将该事件作为案例研究纳入其安全培训体系。

这一事件引发行业对AI安全防护的广泛讨论。安全专家警告，随着大语言模型能力提升，其被滥用于自动化攻击流程、增强诈骗可信度的风险显著增加。微软和谷歌等企业也面临类似审视，多国监管机构正在加速推进相关立法进程。值得注意的是，欧盟《人工智能法案》已进入实施阶段，美国则推动主要AI开发商签署自愿性安全承诺。

联合国近期通过的全球AI治理新机制决议也对此作出回应，决定设立专门机构评估AI技术风险。Anthropic在报告中强调，将坚持严格的安全操作规范，包括定期渗透测试和第三方审计，同时呼吁行业建立协同防御体系。该公司表示，维护AI安全生态需要技术企业、监管机构和用户共同参与，以防止技术突破沦为犯罪工具。

文章版权归作者所有，未经允许请勿转载。

Anthropic成功拦截黑客滥用Claude AI实施网络犯罪，揭示AI安全新挑战

OpenAI重组陷僵局：微软合同谈判或致百亿融资延期，AGI条款成焦点

YouTube未经许可AI修改视频引争议，创作者权益与真实性受挑战

相关文章

英伟达千亿投资OpenAI背后：黄仁勋的AI基础设施战略与TCO护城河

Replit完成2.5亿美元C轮融资，估值30亿美元，AI编程助手推动年收入增长50倍

AI巨头联手！OpenAI、Anthropic、谷歌等成立AAIF基金会，推动智能体标准化

香港浸会大学SatImp方法突破大语言模型知识管理难题

最新资讯

热门AI工具

热门资讯