我国生成式人工智能安全治理取得重要突破。科大讯飞星火大模型开放平台于2025年12月通过GB/T 45654-2025《网络安全技术 生成式人工智能服务安全基本要求》国家标准试点验证,在模型安全能力和服务安全能力上达到基础级要求,成为首批获得国家认证的AI大模型平台之一。
作为我国生成式AI领域首个专项安全技术标准,GB/T 45654-2025从训练数据安全、模型安全、安全措施等方面建立了系统化规范。该标准由全国智能技术社会应用与评估基础标准化工作组牵头制定,科大讯飞深度参与了标准编制与验证全过程。
技术验证显示,星火大模型已构建起覆盖全链条的安全防护体系。平台集成数十项创新技术,支持中英文及多模态场景的实时防护,可有效应对数据污染、模型窃取等新型安全威胁。其中,突破性的隐式水印技术通过嵌入不可感知的数字标识,为生成内容赋予唯一”数字指纹”,实验数据显示其识别准确率达99.7%,为AI内容溯源提供了可靠解决方案。
在安全治理机制方面,科大讯飞建立了”攻防演练-漏洞修复-标准迭代”的闭环体系。其安全实验室累计发现并修复漏洞超2000个,相关实践经验已转化为行业可复用的安全方案。此前,该企业刚斩获首届”AI领航杯”大赛技术创新奖及AI+安全赛道一等奖,其”以模治模”的多层防护机制获得业界高度认可。
此次认证标志着我国生成式AI安全水平迈入新阶段。随着GB/T 45654-2025等系列标准的实施,将为行业备案管理、检测评估等工作提供技术依据,对防范重大安全风险、促进产业健康发展具有重要指导意义。
© 版权声明
文章版权归作者所有,未经允许请勿转载。