标签为“llama”的主题

据 Variety 报道，2026 年 5 月 5 日，爱思唯尔（Elsevier）、圣智学习（Cengage）、阿歇特图书集团（Hachette）、麦克米伦出版（Macmillan）、麦格劳希尔（McGraw Hill）五大出版商联合畅销作家斯科特·图罗（Scott Turow）在纽约南区联邦地区法院对 Meta 及其 CEO 马克·扎克伯格提起集体诉讼，指控被告实施了"史上规模最大的版权侵权行为之一"，以非法获取的数百万册受版权保护书籍和学术期刊训练 Llama 大语言模型。诉状明确点名扎克伯格"亲自授权并积极推动"侵权全过程。Meta 回应称将"坚决应诉"，并声称"法院已正确认定以版权材料训练 AI 可构成合理使用"。作家协会（Authors Guild）CEO 则称此案是"有史以来最公然的版权侵权行为"。诉状披露了大量内部证据。2022 年至 2024 年间，Meta 先后从 LibGen、Anna’s Archive、Sci-Hub、Books3 等盗版网站以 BitTorrent 协议累计下载逾 267 TB 版权内容，并在 2024 年 4 月至 7 月间被动向互联网上传约 40.42 TB 数据（相当于约 500 万册 650 页书籍）。Meta 一度考虑将版权许可预算从 1700 万美元提至 2 亿美元，但 2023 年 4 月"上报扎克伯格后"被叫停——内部员工留下书面记录称其逻辑是"如果授权哪怕一本书，就无法坚持合理使用策略"。此外，Meta 还系统性删除训练数据中的版权管理信息（CMI），却保留了公有领域作品的相同信息，被原告指为刻意掩盖侵权来源；诉状还指出 Meta 甚至为 Llama 编写了当用户询问时否认曾使用盗版数据的应答逻辑。Meta 预测其 AI 产品至 2035 年将带来 4600 亿至 1.4 万亿美元累计收入，而这些收益建立在未向任何创作者支付一分补偿的基础之上。 Variety | 诉状原文 https://www.hachettebookgroup.com/articles/publishers-and-authors-file-class-action-lawsuit-against-meta-and-zuckerberg-for-willful-copyright-infringement-to-develop-llama-ai-models/

WeLinux

五大出版商联合起诉 Meta 及扎克伯格，指控以盗版书刊训练 Llama 侵权史上最大