Anthropic推出Claude Opus 4突破性功能:极端有害互动时主动终止对话 Anthropic为Claude Opus 4推出行业首创功能:在检测到极端有害互动时主动终止对话。了解这一AI安全突破如何设定新标准,以及其技术实现细节与行业影响。 AI新闻资讯# AI伦理# AI安全# Anthropic 9个月前
Anthropic成功拦截黑客滥用Claude AI实施网络犯罪,揭示AI安全新挑战 Anthropic披露成功拦截黑客滥用Claude AI实施网络犯罪的案例,详细分析攻击手法与安全风险,探讨AI技术被滥用的趋势及行业应对策略,包括技术防护、监管立法与全球协同防御机制。 AI新闻资讯# AI安全# Anthropic# ClaudeAI 9个月前
火山引擎发布国内首个智能体全生命周期安全管理平台,填补行业空白 火山引擎发布国内首个覆盖智能体全生命周期的安全管理平台,集成大模型安全测评与动态防护功能,帮助企业解决数据泄露、模型滥用等风险,支持金融、政务等高危场景合规运营。 AI产品动态# AI安全# 合规备案# 大模型测评 7个月前
Character.AI全面禁止未成年人开放式对话,AI陪伴应用面临监管拐点 Character.AI宣布全面禁止18岁以下用户与AI虚拟角色进行开放式对话,包括浪漫互动和心理疏导。本文深度解析这一监管举措的背景、影响及行业趋势,探讨AI陪伴应用的未成年人保护标准与未来发展。 AI产品动态# AI安全# AI监管# AI陪伴机器人 7个月前
Character.AI宣布2025年起全面禁止未成年人使用开放聊天功能,推出年龄验证系统 Character.AI宣布2025年起全面禁止18岁以下用户使用开放聊天功能,部署年龄验证系统应对监管压力。平台将推出替代创意工具并成立AI安全实验室,响应加州SB 243法案要求。 AI产品动态# AI安全# AI监管# Character.AI 7个月前
全球首款AI驱动勒索软件PromptLock曝光,OpenAI开源模型遭恶意滥用 全球首例AI驱动勒索软件PromptLock利用OpenAI开源模型实施跨平台攻击,技术细节与行业影响分析,探讨AI安全防御新挑战。 AI新闻资讯# AI安全# gpt-oss:20b# OpenAI 9个月前
OpenAI发布青少年AI安全蓝图:五项核心措施保护未成年人使用安全 OpenAI于2025年11月发布青少年AI安全蓝图,提出差异化年龄处理、内容安全限制、默认保护等五项核心措施,强化未成年人心理保护机制,应对AI交互安全争议。 AI新闻资讯# AI安全# AI监管# ChatGPT 6个月前
OpenAI放宽ChatGPT成人内容限制:12月将推年龄分级系统 OpenAI宣布重大政策调整:ChatGPT将放宽成人内容限制,12月推出年龄验证系统。了解AI内容管理新规对成年用户和未成年保护的影响。 AI新闻资讯# AI安全# ChatGPT# OpenAI 7个月前
阿里云发布Qwen3Guard安全审查模型系列,支持119种语言实时风险检测 阿里云正式推出Qwen3Guard安全审查模型系列,支持119种语言安全检测,提供0.6B/4B/8B三种参数规模,实现毫秒级实时流式检测,适用于跨境电商、社交平台等跨文化内容审核场景。 AI产品动态# AI安全# Qwen3Guard# 人工智能 8个月前
OpenAI秘密测试安全路由系统:ChatGPT可自动切换模型处理敏感对话 深度解析OpenAI秘密测试的安全路由系统:了解ChatGPT如何通过实时语义分析自动切换GPT模型处理敏感对话,包含o3-mini特殊训练模型、隐私保护机制及提示注入防护等关键技术细节。 AI产品动态# AI安全# ChatGPT# GPT-4.5 8个月前