OpenAI于10月10日发布最新研究报告,宣布其新一代人工智能模型GPT-5在政治中立性方面取得显著突破。测试数据显示,GPT-5 Instant和GPT-5 Thinking两个版本的可测量政治偏见程度较前代GPT-4o降低30%,成为该公司迄今“偏见最少”的AI模型。
该研究由OpenAI“模型行为”部门主导,团队负责人Joanne Jang表示,其核心突破在于建立了一套科学评估框架,将主观的“偏见”概念转化为可量化指标。研究人员设计了500个涵盖不同政治立场强度的测试提示词,模拟真实用户提问场景。结果显示,即使在刻意诱导偏见的压力测试中,模型仅出现“罕见且轻微”的倾向性。
值得注意的是,模型在应对争议性话题时表现出更强的平衡性。研究员Natalie Staudacher指出,GPT-5在情感激烈场景下的中立性提升尤为明显,但仍存在使用讽刺语气等细微偏差。团队通过优化模型对齐技术,使系统在推理过程和语言表达上达到更高水平的客观性。
此次技术升级正值全球对AI伦理关注度攀升之际。今年7月美国政府曾发布行政命令,要求政府系统避免使用存在意识形态偏见的AI产品。OpenAI此次主动披露研究成果,被视为对监管要求的积极回应。公司表示将持续公开模型行为规范,接受社会监督。
目前,GPT-5的中立性测试主要聚焦英语语境下的政治议题。业界专家认为,这一进展为AI伦理研究提供了可量化的技术路径,但跨语言、跨文化的偏见评估仍需进一步探索。
© 版权声明
文章版权归作者所有,未经允许请勿转载。