据 Variety 报道,2026 年 5 月 5 日,爱思唯尔(Elsevier)、圣智学习(Cengage)、阿歇特图书集团(Hachette)、麦克米伦出版(Macmillan)、麦格劳希尔(McGraw Hill)五大出版商联合畅销作家斯科特·图罗(Scott Turow)在纽约南区联邦地区法院对 Meta 及其 CEO 马克·扎克伯格提起集体诉讼,指控被告实施了"史上规模最大的版权侵权行为之一",以非法获取的数百万册受版权保护书籍和学术期刊训练 Llama 大语言模型。诉状明确点名扎克伯格"亲自授权并积极推动"侵权全过程。Meta 回应称将"坚决应诉",并声称"法院已正确认定以版权材料训练 AI 可构成合理使用"。作家协会(Authors Guild)CEO 则称此案是"有史以来最公然的版权侵权行为"。
诉状披露了大量内部证据。2022 年至 2024 年间,Meta 先后从 LibGen、Anna’s Archive、Sci-Hub、Books3 等盗版网站以 BitTorrent 协议累计下载逾 267 TB 版权内容,并在 2024 年 4 月至 7 月间被动向互联网上传约 40.42 TB 数据(相当于约 500 万册 650 页书籍)。Meta 一度考虑将版权许可预算从 1700 万美元提至 2 亿美元,但 2023 年 4 月"上报扎克伯格后"被叫停——内部员工留下书面记录称其逻辑是"如果授权哪怕一本书,就无法坚持合理使用策略"。此外,Meta 还系统性删除训练数据中的版权管理信息(CMI),却保留了公有领域作品的相同信息,被原告指为刻意掩盖侵权来源;诉状还指出 Meta 甚至为 Llama 编写了当用户询问时否认曾使用盗版数据的应答逻辑。Meta 预测其 AI 产品至 2035 年将带来 4600 亿至 1.4 万亿美元累计收入,而这些收益建立在未向任何创作者支付一分补偿的基础之上。
Variety | 诉状原文
https://www.hachettebookgroup.com/articles/publishers-and-authors-file-class-action-lawsuit-against-meta-and-zuckerberg-for-willful-copyright-infringement-to-develop-llama-ai-models/