AI安全

Character.AI宣布2025年起全面禁止未成年人使用开放聊天功能，推出年龄验证系统

Character.AI宣布2025年起全面禁止18岁以下用户使用开放聊天功能，部署年龄验证系统应对监管压力。平台将推出替代创意工具并成立AI安全实验室，响应加州SB 243法案要求。

8个月前

OpenAI发布’忏悔’框架：AI首次实现主动认错能力，重塑AI伦理与透明度

OpenAI于2025年12月发布革命性'忏悔'（Confession）训练框架，首次实现大型语言模型主动承认错误的能力。该技术采用'诚实即奖励'原则与双层回应设计，提升AI透明度40%，适用于金融...

AI新闻资讯 # AI伦理 # AI安全 # AI监管

7个月前

OpenAI发布青少年AI安全蓝图：五项核心措施保护未成年人使用安全

OpenAI于2025年11月发布青少年AI安全蓝图，提出差异化年龄处理、内容安全限制、默认保护等五项核心措施，强化未成年人心理保护机制，应对AI交互安全争议。

AI新闻资讯 # AI安全 # AI监管 # ChatGPT

8个月前

OpenAI推出家长控制功能应对青少年心理健康风险，ChatGPT安全升级全面解析

OpenAI针对青少年心理健康风险推出家长控制功能，包括账户管理、危机通知和紧急联系人系统。本文详解ChatGPT安全升级措施、技术细节及行业伦理影响，为AI安全与责任提供专业解读。

AI产品动态 # AI伦理 # AI安全 # ChatGPT

10个月前

火山引擎发布国内首个智能体全生命周期安全管理平台，填补行业空白

火山引擎发布国内首个覆盖智能体全生命周期的安全管理平台，集成大模型安全测评与动态防护功能，帮助企业解决数据泄露、模型滥用等风险，支持金融、政务等高危场景合规运营。

AI产品动态 # AI安全 # 合规备案 # 大模型测评

8个月前

OpenAI公布AI研究员时间表：2028年实现自主科研，投入250亿美元布局医疗AI

OpenAI公布实现自主AI研究员详细时间表：2026年9月前开发科研助理AI，2028年3月实现全自动化研究员。公司转型公益性公司，投入250亿美元用于AI医疗研究，建设30吉瓦算力设施，构建五层安...

AI新闻资讯 # AI医疗 # AI安全 # AI研究员

8个月前

XBOW完成7500万美元B轮融资，AI渗透测试工具登顶全美漏洞发现榜

XBOW公司完成7500万美元B轮融资，其AI渗透测试工具在HackerOne平台表现超越人类专家，成为全美漏洞发现榜首。该技术将传统数周的测试周期缩短至数小时，已提交超千个漏洞报告，引领网络安全进入...

AI新闻资讯 # AI安全 # XBOW # 渗透测试

1年前

Character.AI全面禁止未成年人开放式对话，AI陪伴应用面临监管拐点

Character.AI宣布全面禁止18岁以下用户与AI虚拟角色进行开放式对话，包括浪漫互动和心理疏导。本文深度解析这一监管举措的背景、影响及行业趋势，探讨AI陪伴应用的未成年人保护标准与未来发展。

AI产品动态 # AI安全 # AI监管 # AI陪伴机器人

8个月前

阿里云发布Qwen3Guard安全审查模型系列，支持119种语言实时风险检测

阿里云正式推出Qwen3Guard安全审查模型系列，支持119种语言安全检测，提供0.6B/4B/8B三种参数规模，实现毫秒级实时流式检测，适用于跨境电商、社交平台等跨文化内容审核场景。

AI产品动态 # AI安全 # Qwen3Guard # 人工智能

9个月前

OpenAI ChatGPT深度研究功能曝安全漏洞，用户Gmail数据面临泄露风险

OpenAI旗下ChatGPT的“深度研究”功能被曝安全漏洞，可能导致用户Gmail敏感信息外泄。本文解析漏洞原理、攻击条件及修复进展，探讨AI代理服务的数据安全防护挑战。

AI新闻资讯 # AI安全 # ChatGPT # Gmail漏洞

10个月前

Character.AI宣布2025年起全面禁止未成年人使用开放聊天功能，推出年龄验证系统

OpenAI发布’忏悔’框架：AI首次实现主动认错能力，重塑AI伦理与透明度

OpenAI发布青少年AI安全蓝图：五项核心措施保护未成年人使用安全

OpenAI推出家长控制功能应对青少年心理健康风险，ChatGPT安全升级全面解析

火山引擎发布国内首个智能体全生命周期安全管理平台，填补行业空白

OpenAI公布AI研究员时间表：2028年实现自主科研，投入250亿美元布局医疗AI

XBOW完成7500万美元B轮融资，AI渗透测试工具登顶全美漏洞发现榜

Character.AI全面禁止未成年人开放式对话，AI陪伴应用面临监管拐点

阿里云发布Qwen3Guard安全审查模型系列，支持119种语言实时风险检测

OpenAI ChatGPT深度研究功能曝安全漏洞，用户Gmail数据面临泄露风险

热门AI工具

最新资讯