Anthropic版权诉讼案裁决:AI训练数据合法使用边界引争议

美国人工智能公司Anthropic近期陷入一场由作家群体发起的版权诉讼风波。加州北区联邦法院最新裁决显示,该公司使用合法购买的书籍训练AI模型Claude的行为构成版权法下的“合理使用”,但涉及盗版书籍的部分将面临单独审判。

2024年8月,作家安德烈娅·巴茨(Andrea Bartz)、查尔斯·格雷伯(Charles Graeber)和柯克·华莱士·约翰逊(Kirk Wallace Johnson)发起集体诉讼,指控Anthropic通过盗版网站非法获取约700万册书籍构建“中央图书馆”,用于训练其AI模型。法庭文件披露,该公司自2021年起从“影子图书馆”批量下载盗版内容,部分员工曾对行为合法性提出内部质疑。

2025年6月25日,法官威廉·阿尔苏普(William Alsup)作出具有里程碑意义的裁决,认定AI公司对合法购买书籍进行数字化处理并用于模型训练属于“转化性使用”,符合版权法第107条规定的合理使用原则。裁决书特别强调,该行为“如同人类作者通过阅读学习创作”,且未直接复制作品核心表达。阿尔苏普法官曾审理过甲骨文诉谷歌Java API侵权案,其判决常被视为科技领域版权争议的风向标。

然而,裁决同时明确,Anthropic使用盗版书籍的行为需承担法律责任。根据美国版权法,每部侵权作品最低赔偿标准为750美元,按700万册盗版书计算,公司可能面临超过50亿美元的罚金。这部分诉讼将于2025年12月开庭审理。

值得注意的是,Anthropic在诉讼过程中已调整数据获取策略,聘请前Google Books负责人汤姆·特维(Tom Turvey)协助建立合规流程,包括批量购买实体书、拆解扫描后数字化处理。但法官指出,这种补救措施不能免除其早期盗版行为的责任。

该案引发全球对AI训练数据合法边界的广泛讨论。Meta等科技公司近期也面临类似诉讼,部分法官支持其合理使用主张,但均强调裁决限于特定案情。行业分析指出,此判决可能促使AI企业更严格审查数据来源,同时推动创作者与科技公司建立新型版权合作机制。目前Anthropic估值达615亿美元,本案结果或将直接影响其商业模式及整个AI行业的数据治理框架。

© 版权声明

相关文章