xAI Grok图像编辑功能引爆安全危机:深度伪造泛滥引发全球监管风暴 本文深度解析xAI公司Grok图像编辑功能的安全危机:功能上线后遭滥用生成未成年人及政要不当内容,暴露AI伦理与审核缺失。事件已触发多国调查,探讨生成式AI监管趋势与技术风险防范。 AI产品动态# AI伦理# AI安全# Grok 4周前
OpenAI发布’忏悔’框架:AI首次实现主动认错能力,重塑AI伦理与透明度 OpenAI于2025年12月发布革命性'忏悔'(Confession)训练框架,首次实现大型语言模型主动承认错误的能力。该技术采用'诚实即奖励'原则与双层回应设计,提升AI透明度40%,适用于金融... AI新闻资讯# AI伦理# AI安全# AI监管 2个月前
全球首个《AI智能体运行安全测试标准》发布,推动AI治理进入标准化新阶段 世界数字科学院(WDTA)发布全球首个《AI智能体运行安全测试标准》,覆盖五大核心链路风险分析,降低企业合规成本30%以上,助力构建可信AI生态。 AI新闻资讯# AI安全# AI标准# AI治理 7个月前
国内首次AI大模型实网众测结果发布:281个漏洞揭示新型安全风险 国家网信办首次AI大模型实网测试发现281个安全漏洞,177个为AI特有风险。涵盖百度、腾讯、阿里等15款产品,详解提示注入攻击、数据泄露等新型威胁及防护方案。 AI新闻资讯# AI安全# 人工智能治理# 大模型漏洞 5个月前
OpenAI与Anthropic首次合作:交叉安全评估揭示AI模型风险与行业协作新范式 OpenAI与Anthropic首次合作进行AI模型交叉安全评估,揭示GPT系列与Claude系列在安全性、谄媚行为及风险策略上的差异。本文深度解析评估结果、行业影响及AI安全治理新趋势,为从业者提供... AI新闻资讯# AI安全# AI治理# Anthropic 5个月前
OpenAI重大突破:发现AI模型隐藏特征与异常行为的直接关联 OpenAI在AI安全领域取得重大进展,首次发现模型内部隐藏特征与有害行为的直接关联。研究团队开发出通过特征调控量化控制模型毒性的方法,为构建更安全可靠的AI系统提供科学基础。 AI新闻资讯# AI安全# OpenAI# 人工智能 8个月前
滴滴顺风车推出AI+人工双轨安全员功能,响应速度提升50% 滴滴顺风车创新推出AI+人工双轨安全员功能,AI实时监测结合专家介入,高风险订单30秒快速处置,响应速度提升50%。覆盖夜间、远途等场景,强化全链路安全防护。 AI新闻资讯# AI安全# 夜间出行# 实时监测 8个月前
中国金融科技新突破:蚂蚁数科动态深度学习模型显著降低深度伪造攻击率 蚂蚁集团在联合国峰会分享金融级AI安全方案:通过动态深度学习模型实现深度伪造攻击率下降60%,身份认证准确率达99.9%,为全球数字身份安全提供中国技术范本。 AI新闻资讯# AI安全# 深度伪造# 蚂蚁集团 7个月前
警惕!DeepSeek AI钓鱼攻击事件曝光,黑客利用虚假官网传播恶意程序 本文揭露近期针对DeepSeek AI用户的钓鱼攻击事件细节,分析黑客通过伪造官网传播BrowserVenom木马的技术手段,并提供专业防护建议,帮助用户识别和防范类似网络安全威胁。 AI新闻资讯# AI安全# BrowserVenom木马# DeepSeekAI 8个月前
WormGPT升级回归:恶意AI工具劫持主流模型,网络安全面临新挑战 深度解析新版WormGPT如何通过劫持Grok/Mixtral等主流AI模型生成恶意内容,揭示其技术突破点与危害性,并提供企业及个人用户应对策略。了解AI时代网络安全最新威胁态势。 AI新闻资讯# AI安全# WormGPT# 恶意AI 8个月前