爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型
爱思唯尔联手多家出版商及作家,起诉Meta未经授权使用包括Sci-Hub在内的盗版学术论文训练Llama大模型,首次有学术出版商就AI版权侵权提起诉讼。
文章情报
要点
- 爱思唯尔等原告指控Meta通过Common Crawl和盗版平台LibGen、Sci-Hub获取受版权保护的论文训练Llama。
- Meta援引“合理使用”原则抗辩,称AI训练属于转化性使用。
- 此前已有类似案例,如Anthropic被允许使用合法购买的书籍训练AI。
为什么重要
这条新闻值得关注,因为爱思唯尔等原告指控Meta通过Common Crawl和盗版平台LibGen、Sci-Hub获取受版权保护的论文训练Llama。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型 – 量子位
爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型
西风 2026-05-13 11:10:53
来源:量子位
多方原告组团上阵
西风 发自 凹非寺
量子位 | 公众号 QbitAI
AI版权大战,再度升级了。
手握《柳叶刀》《细胞》等顶刊,掌控全球海量核心科研成果的学术出版巨头爱思唯尔(Elsevier)正式入局,加入集体诉讼团硬刚Meta——
控诉Meta非法爬取、复制受版权保护的科研论文,用于训练自家大模型Llama。
在此之前,站出来起诉AI侵权的多是作家、媒体机构。
此番是头一回,顶级学术出版商下场打响版权维权之战。美国出版商协会也在声明中给定调:
这是主流出版集团首次发起针对AI企业的诉讼,Meta明目张胆侵犯版权,出版商们将还原全部事实。
有意思的是,这场官司明面上矛头对准Meta,可证据一摊开,与爱思唯尔纠缠十多年的两大盗版学术库——LibGen、Sci-Hub,再度被摆上台面。
只能说Meta树大钱多,比追责盗版平台靠谱多了(手动狗头)。
多方原告组团上阵,指控Meta侵权
这场诉讼于5月5日在纽约南区法院正式提交,被告直指Meta及其CEO扎克伯格。
而原告,不止爱思唯尔一家,还包括法国第一大出版集团阿歇特、源自英国的百年全球综合性出版集团麦克米伦,以及美国小说家、执业律师Scott Turow等。
出版商方核心指控非常明确:Meta为训练Llama大语言模型,未经任何授权,大量获取、复制、盗用受版权保护的学术论文与出版物内容。
具体来看,诉状里指出Meta训练Llama主要靠两大“不清白”的数据来源:
第一,Common Crawl通用爬虫数据集。
这份数据集通过全网抓取生成,囊括数十亿网页内容。原告方称,里面大概率混进了未经授权的版权内容,比如付费期刊的摘要和全文。
第二,两大知名盗版学术平台LibGen、Sci-Hub。
这两个网站常年免费传播海量付费论文、教材与学术著作,长期深陷全球版权诉讼。出版商指控,Meta通过磁力下载、文件共享等方式,从这些网站盗用学术资源。
值得一提的是,本案很多证据,还是从去年那桩“作家告Meta”(Kadrey v. Meta)案里流出来的内部员工邮件。
面对诉讼,Meta发言人表示:将全力积极应诉。
Meta这边抗辩逻辑也十分清晰,打出了一张王牌:合理使用(Fair Use)。
据了解,根据美国版权法,“合理使用”属于版权豁免情形,允许在特定条件下无需授权使用版权内容。
Meta发言人称:“AI正为个人与企业带来颠覆性创新、提升生产效率与创作活力,已有法院判例认定,使用版权内容训练AI可构成合理使用。”
不得不说,这几年AI圈的版权官司确实不少。像《纽约时报》、一堆知名作家都起诉过AI公司,有些案子已经和解了。
但整体而言,利用版权作品训练大语言模型是否合法,目前仍未形成明确司法判例。
至于这次后续怎么发展……咱们先搬好小板凳,再蹲一波。
One More Thing
“合理使用”这张牌之前确实被成功使用过。
去年,美国法院裁决:允许Claude背后公司Anthropic在未经作者许可的情况下,使用合法购买的已出版书籍训练AI。
法院参考了美国版权法中的“合理使用”(Fair Use)原则,认为AI训练属于“转化性使用”(Transformative Use),即对原作品的新用途未取代原作市场,且有利于技术创新和公共利益。
这也是美国法院首次认可AI公司对书籍的使用权。
就在最近,有网友称Anthropic正在大批量购入古籍,扫描收录内容后就直接销毁原书。这一说法也引发了不少网友关注。
参考链接:
[1]https://www.nature.com/articles/d41586-026-01481-0
[2]https://x.com/sivori/status/2052567312088047754
版权所有,未经授权不得以任何形式转载及使用,违者必究。
AI版权 Meta
西风
浙大校友用AI突破32年拉姆齐数下界2026-05-10
原生Agent杀入画布!一站式搞定专业创作,全程可控、不抽卡2026-05-07
Meshy用户破千万后杀向新战场:ARR年翻14倍,头部厂商集体买单2026-04-27
打工人五一自救指南:把活全甩给AI,准备免打扰出门2026-04-27
相关阅读
Meta超级智能实验室新论文陷争议!被指忽略大量前人研究
在Meta,论文也成了问题?
henry2025-09-14
Meta
奥特曼反击挖走4人!Meta华人科学家在列,马斯克也躺枪
四人将加入Scaling团队
克雷西2025-07-09
Meta OpenAI
太疯狂了!Meta裁员裁到田渊栋头上,连组员一锅端
亚历山大王这招太狠了
梦晨2025-10-23
Meta
小扎All in 开源AGI:正训练Llama 3,年底将有35万块H100
总算力将相当于60万块H100。
白交2024-01-19
AGI Meta
小扎亲自官宣Meta视觉大模型!自监督学习无需微调,多任务效果超OpenCLIP丨开源
在线Demo可玩
萧箫2023-04-18
Meta 视觉模型
更像人脑的新注意力机制,让大模型屏蔽无关信息,准确率提高27%
给AI加一层“护目镜”
克雷西2023-11-27
Meta 大模型
热门文章
刚刚,ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁
2026-05-06
香蕉和GPT Image之外的第3条路:华人15人团队造出AI生图黑马
2026-05-06
AI“翻译”养殖经验智慧养猪提质增效 ——讯飞和光科技用大模型为传统产业升级注入新动能
2026-05-06
首日10w+!跨维智能赋能合作伙伴,商业服务小站“五一”多城齐开
2026-05-06
00后下场整顿Agent:啥都不学就能用好AI,这才是正确打开方式
2026-05-07
扫码关注量子位
量子位 QbitAI 版权所有©北京极客伙伴科技有限公司 京ICP备17005886号-1