AI News HubLIVE
站内改写

愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型

愛思唯爾聯手多家出版商及作家,起訴Meta未經授權使用包括Sci-Hub在內的盜版學術論文訓練Llama大模型,首次有學術出版商就AI版權侵權提起訴訟。

文章情報

工程師進階

要點

  • 愛思唯爾等原告指控Meta通過Common Crawl和盜版平台LibGen、Sci-Hub獲取受版權保護的論文訓練Llama。
  • Meta援引“合理使用”原則抗辯,稱AI訓練屬於轉化性使用。
  • 此前已有類似案例,如Anthropic被允許使用合法購買的書籍訓練AI。

為甚麼重要

這條新聞值得關注,因為愛思唯爾等原告指控Meta通過Common Crawl和盜版平台LibGen、Sci-Hub獲取受版權保護的論文訓練Llama。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型 – 量子位

愛思唯爾把Meta告了:拿Sci-Hub盜版論文訓練大模型

西風 2026-05-13 11:10:53

來源:量子位

多方原告組團上陣

西風 發自 凹非寺

量子位 | 公眾號 QbitAI

AI版權大戰,再度升級了。

手握《柳葉刀》《細胞》等頂刊,掌控全球海量核心科研成果的學術出版巨頭愛思唯爾(Elsevier)正式入局,加入集體訴訟團硬剛Meta——

控訴Meta非法爬取、複製受版權保護的科研論文,用於訓練自家大模型Llama。

在此之前,站出來起訴AI侵權的多是作家、媒體機構。

此番是頭一回,頂級學術出版商下場打響版權維權之戰。美國出版商協會也在聲明中給定調:

這是主流出版集團首次發起針對AI企業的訴訟,Meta明目張膽侵犯版權,出版商們將還原全部事實。

有意思的是,這場官司明面上矛頭對準Meta,可證據一攤開,與愛思唯爾糾纏十多年的兩大盜版學術庫——LibGen、Sci-Hub,再度被擺上枱面。

只能説Meta樹大錢多,比追責盜版平台靠譜多了(手動狗頭)。

多方原告組團上陣,指控Meta侵權

這場訴訟於5月5日在紐約南區法院正式提交,被告直指Meta及其CEO扎克伯格。

而原告,不止愛思唯爾一家,還包括法國第一大出版集團阿歇特、源自英國的百年全球綜合性出版集團麥克米倫,以及美國小説家、執業律師Scott Turow等。

出版商方核心指控非常明確:Meta為訓練Llama大語言模型,未經任何授權,大量獲取、複製、盜用受版權保護的學術論文與出版物內容。

具體來看,訴狀裏指出Meta訓練Llama主要靠兩大“不清白”的數據來源:

第一,Common Crawl通用爬蟲數據集。

這份數據集通過全網抓取生成,囊括數十億網頁內容。原告方稱,裏面大概率混進了未經授權的版權內容,比如付費期刊的摘要和全文。

第二,兩大知名盜版學術平台LibGen、Sci-Hub。

這兩個網站常年免費傳播海量付費論文、教材與學術著作,長期深陷全球版權訴訟。出版商指控,Meta通過磁力下載、文件共享等方式,從這些網站盜用學術資源。

值得一提的是,本案很多證據,還是從去年那樁“作家告Meta”(Kadrey v. Meta)案裏流出來的內部員工郵件。

面對訴訟,Meta發言人表示:將全力積極應訴。

Meta這邊抗辯邏輯也十分清晰,打出了一張王牌:合理使用(Fair Use)。

據瞭解,根據美國版權法,“合理使用”屬於版權豁免情形,允許在特定條件下無需授權使用版權內容。

Meta發言人稱:“AI正為個人與企業帶來顛覆性創新、提升生產效率與創作活力,已有法院判例認定,使用版權內容訓練AI可構成合理使用。”

不得不説,這幾年AI圈的版權官司確實不少。像《紐約時報》、一堆知名作家都起訴過AI公司,有些案子已經和解了。

但整體而言,利用版權作品訓練大語言模型是否合法,目前仍未形成明確司法判例。

至於這次後續怎麼發展……咱們先搬好小板凳,再蹲一波。

One More Thing

“合理使用”這張牌之前確實被成功使用過。

去年,美國法院裁決:允許Claude背後公司Anthropic在未經作者許可的情況下,使用合法購買的已出版書籍訓練AI。

法院參考了美國版權法中的“合理使用”(Fair Use)原則,認為AI訓練屬於“轉化性使用”(Transformative Use),即對原作品的新用途未取代原作市場,且有利於技術創新和公共利益。

這也是美國法院首次認可AI公司對書籍的使用權。

就在最近,有網友稱Anthropic正在大批量購入古籍,掃描收錄內容後就直接銷燬原書。這一説法也引發了不少網友關注。

參考鏈接:

[1]https://www.nature.com/articles/d41586-026-01481-0

[2]https://x.com/sivori/status/2052567312088047754

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

AI版權 Meta

西風

浙大校友用AI突破32年拉姆齊數下界2026-05-10

原生Agent殺入畫布!一站式搞定專業創作,全程可控、不抽卡2026-05-07

Meshy用户破千萬後殺向新戰場:ARR年翻14倍,頭部廠商集體買單2026-04-27

打工人五一自救指南:把活全甩給AI,準備免打擾出門2026-04-27

相關閲讀

Meta超級智能實驗室新論文陷爭議!被指忽略大量前人研究

在Meta,論文也成了問題?

henry2025-09-14

Meta

奧特曼反擊挖走4人!Meta華人科學家在列,馬斯克也躺槍

四人將加入Scaling團隊

克雷西2025-07-09

Meta OpenAI

太瘋狂了!Meta裁員裁到田淵棟頭上,連組員一鍋端

亞歷山大王這招太狠了

夢晨2025-10-23

Meta

小扎All in 開源AGI:正訓練Llama 3,年底將有35萬塊H100

總算力將相當於60萬塊H100。

白交2024-01-19

AGI Meta

小扎親自官宣Meta視覺大模型!自監督學習無需微調,多任務效果超OpenCLIP丨開源

在線Demo可玩

蕭簫2023-04-18

Meta 視覺模型

更像人腦的新注意力機制,讓大模型屏蔽無關信息,準確率提高27%

給AI加一層“護目鏡”

克雷西2023-11-27

Meta 大模型

熱門文章

剛剛,ChatGPT免費模型升級了:幻覺砍半/記憶更強/回答更簡潔

2026-05-06

香蕉和GPT Image之外的第3條路:華人15人團隊造出AI生圖黑馬

2026-05-06

AI“翻譯”養殖經驗智慧養豬提質增效 ——訊飛和光科技用大模型為傳統產業升級注入新動能

2026-05-06

首日10w+!跨維智能賦能合作伙伴,商業服務小站“五一”多城齊開

2026-05-06

00後下場整頓Agent:啥都不學就能用好AI,這才是正確打開方式

2026-05-07

掃碼關注量子位

量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1