OpenAI发布’忏悔’框架:AI首次实现主动认错能力,重塑AI伦理与透明度 OpenAI于2025年12月发布革命性'忏悔'(Confession)训练框架,首次实现大型语言模型主动承认错误的能力。该技术采用'诚实即奖励'原则与双层回应设计,提升AI透明度40%,适用于金融... AI新闻资讯# AI伦理# AI安全# AI监管 2周前