全球首款AI驱动勒索软件PromptLock曝光,OpenAI开源模型遭恶意滥用 全球首例AI驱动勒索软件PromptLock利用OpenAI开源模型实施跨平台攻击,技术细节与行业影响分析,探讨AI安全防御新挑战。 AI新闻资讯# AI安全# gpt-oss:20b# OpenAI 5个月前
Character.AI全面禁止未成年人开放式对话,AI陪伴应用面临监管拐点 Character.AI宣布全面禁止18岁以下用户与AI虚拟角色进行开放式对话,包括浪漫互动和心理疏导。本文深度解析这一监管举措的背景、影响及行业趋势,探讨AI陪伴应用的未成年人保护标准与未来发展。 AI产品动态# AI安全# AI监管# AI陪伴机器人 3个月前
800名全球精英联名呼吁暂停超级智能研发,AI安全争议达历史转折点 全球800多位科技精英联名签署超级智能暂停声明,要求在全球达成安全共识前禁止AGI研发。了解苹果创始人沃兹尼亚克、AI教父本吉奥等权威人士对人工智能风险的警告,以及这场争议对Meta、OpenAI等科... AI新闻资讯# AGI# AI安全# AI风险 3个月前
阿里云发布Qwen3Guard安全审查模型系列,支持119种语言实时风险检测 阿里云正式推出Qwen3Guard安全审查模型系列,支持119种语言安全检测,提供0.6B/4B/8B三种参数规模,实现毫秒级实时流式检测,适用于跨境电商、社交平台等跨文化内容审核场景。 AI产品动态# AI安全# Qwen3Guard# 人工智能 4个月前
Anthropic突破性AI技术:人格向量精准调控大模型性格特征 深度解析Anthropic人格向量技术原理:通过高维向量空间定位谄媚/激进等特征神经元集群,采用动态抑制算法实现AI行为精准调控,Claude模型有害请求拒绝率提升40%。 AI新闻资讯# AI安全# Anthropic# 人工智能 6个月前
OpenAI发布青少年AI安全蓝图:五项核心措施保护未成年人使用安全 OpenAI于2025年11月发布青少年AI安全蓝图,提出差异化年龄处理、内容安全限制、默认保护等五项核心措施,强化未成年人心理保护机制,应对AI交互安全争议。 AI新闻资讯# AI安全# AI监管# ChatGPT 3个月前
AI教父辛顿提出颠覆性安全框架:用“母亲照顾婴儿”模式构建超级智能保护机制 图灵奖得主杰弗里·辛顿在2025年T-EDGE大会上提出“母亲照顾婴儿”AI安全模型,主张以生物学情感纽带设计超级智能系统,实现对人类的本能保护。本文解读该颠覆性框架的核心理念、现实挑战及对AI伦理与... AI新闻资讯# AI安全# AI治理# T-EDGE创新大会 2个月前
Anthropic推出Claude Opus 4突破性功能:极端有害互动时主动终止对话 Anthropic为Claude Opus 4推出行业首创功能:在检测到极端有害互动时主动终止对话。了解这一AI安全突破如何设定新标准,以及其技术实现细节与行业影响。 AI新闻资讯# AI伦理# AI安全# Anthropic 6个月前
火山引擎发布国内首个智能体全生命周期安全管理平台,填补行业空白 火山引擎发布国内首个覆盖智能体全生命周期的安全管理平台,集成大模型安全测评与动态防护功能,帮助企业解决数据泄露、模型滥用等风险,支持金融、政务等高危场景合规运营。 AI产品动态# AI安全# 合规备案# 大模型测评 3个月前
OpenAI无限期推迟开源AI模型发布,安全测试成首要任务 OpenAI宣布无限期推迟首个开源权重AI模型的发布,以进行更深入的安全测试和风险审查。首席执行官山姆·奥尔特曼强调安全性和可靠性是首要任务,尽管模型性能已达标。了解OpenAI的最新动态及其对AI安... AI新闻资讯# AI安全# AI风险审查# OpenAI 7个月前