OpenAI开源Circuit-Sparsity模型:400M参数轻量级方案,突破AI黑箱可解释性难题

AI新闻资讯19小时前发布 AI视野

OpenAI于2025年12月10日开源了参数量为0.4亿(400M)的Circuit-Sparsity模型,该模型通过结构化稀疏技术显著提升了神经网络的可解释性,成为首个公开解决黑箱问题的轻量级工业级解决方案。这一技术突破源自OpenAI对模型内部表征机制的长期研究,其核心创新在于动态识别并保留对推理结果起关键作用的神经元连接,同时稀疏化冗余路径,使决策逻辑可通过可视化电路追踪。

技术原理上,Circuit-Sparsity采用三阶段训练框架:首先通过标准预训练获得基础能力,随后引入可微分门控机制量化各连接的重要性,最终采用知识蒸馏锁定关键电路。实验显示,在保持原模型90%性能的前提下,该技术可将BERT-base的注意力头稀疏度提升至65%,同时生成人类可读的决策路径图。在医疗诊断和金融风控等高风险场景的测试中,工程师能准确定位模型依赖的特征维度,误判案例的分析效率提升300%。

该模型部署门槛极低,支持PyTorch和TensorFlow框架,仅需8GB显存即可运行。开源包内置可视化工具CircuitExplainer,支持实时交互式探查神经元的激活模式。OpenAI特别强调,此次开源包含完整的训练代码、预训练权重及领域适配教程,采用MIT许可证允许商用。业界认为这是继2025年8月GPT-OSS系列开源后,OpenAI在AI透明度领域的又一重要贡献,将加速可解释AI在自动驾驶、药物研发等领域的合规落地。

目前,阿里云和AWS已宣布将Circuit-Sparsity集成至其AI开发平台,预计2026年第一季度提供企业级支持。斯坦福大学AI实验室主任指出,该技术首次在参数量(<1B)与可解释性之间取得实用平衡,但提醒稀疏化可能放大数据偏见,建议配合公平性检测工具使用。

© 版权声明

相关文章