BBC起诉Perplexity侵犯版权:AI训练数据争议升级

英国广播公司(BBC)近日对人工智能初创企业Perplexity采取法律行动,指控其未经授权抓取BBC内容用于AI模型训练。这一事件标志着传统媒体与科技企业在内容版权领域的矛盾进一步激化。

根据《金融时报》获取的法律信函,BBC表示已掌握确凿证据,证明Perplexity的“默认AI模型”使用了BBC的受版权保护内容进行训练。BBC要求该公司立即停止所有内容抓取行为,删除已存储的数据副本,并就侵权行为提出赔偿方案,否则将寻求法院禁令。BBC特别指出,Perplexity不仅复制其内容,还在搜索结果中显示BBC网站链接,这些行为与其自有服务形成直接竞争。

Perplexity对此作出强硬回应,称BBC的指控“带有操纵性和机会主义色彩”,并批评BBC“缺乏对技术、互联网及知识产权法的基本理解”。该公司强调其业务模式是提供多模型选择界面,而非自主开发基础大模型。知情人士透露,Perplexity的内部系统基于Meta的Llama架构,经过专门优化以减少信息失真问题。

BBC援引2024年12月的测试数据显示,Perplexity在引用BBC内容时存在17%的严重错误率,包括事实偏差、来源缺失和背景信息不足等问题。BBC认为这些缺陷严重损害了其作为公共媒体的公信力,尤其威胁到其坚持的新闻准确性与中立性原则。

此次纠纷反映出生成式AI技术快速发展带来的版权挑战。自ChatGPT问世以来,网络爬虫抓取行为激增,促使全球内容创作者呼吁加强版权保护。英国媒体行业正积极推动政府完善相关立法,以应对AI企业未经许可使用受版权保护材料的问题。

行业观察人士指出,此案可能成为界定AI时代内容使用规则的重要判例。双方争议焦点不仅涉及技术层面的合规性,更触及传统媒体与新兴科技企业在数字内容生态中的利益分配机制。随着法律程序的推进,该事件或将对全球AI开发的数据获取方式产生深远影响。

© 版权声明

相关文章