AI News HubLIVE
站内改写4 分鐘閱讀

Claude Mythos 5之爭內幕

Anthropic在週末與特朗普政府就Mythos 5和Fable 5模型發佈展開鬥爭,收到出口管制指令,要求禁止外國人訪問。公司被迫禁用產品並前往華盛頓遊説。爭議涉及安全漏洞、中國擔憂以及行業影響。

來源The Verge AI作者: Hayden Field

當全美慶祝美國隊首次贏得世界盃和紐約尼克斯隊奪冠時,Anthropic卻在上週末與特朗普政府就最新模型發佈展開了激烈鬥爭。週五下午5點21分,該公司收到美國出口管制指令,要求暫停“任何外國國民”(包括外國籍Anthropic員工)在美國境內或境外訪問其Mythos 5和Fable 5 AI模型。Anthropic認為,唯一可行的方式是徹底禁用其過去一週大力宣傳的產品,並前往華盛頓特區希望改變總統唐納德·特朗普的想法。未來幾天,美國政府可能大幅改變整個行業的軌跡,對美國AI公司造成重大打擊。

Claude Mythos 5和Fable 5基於與Anthropic此前宣稱過於危險而未能公開發布的Mythos Preview相同的基礎。Mythos 5被提供給特定的政府機構和公司,而帶有額外安全措施的Fable 5則被視為“可安全用於一般用途”。但一份報告指出這些防護措施可能失效,使得Anthropic關於Mythos落入壞人手中的嚴厲警告反過來困擾了公司。

一位參與談判的消息人士稱,政府週五下午1點左右致電Anthropic,給出90分鐘最後通牒要求關閉Mythos 5和Fable 5的訪問,否則將依據美國商務部權限實施出口管制。消息人士表示,Anthropic高管在接到第一通電話後15分鐘內開始與白宮溝通,CEO Dario Amodei在約1小時15分鐘後加入討論。Amodei直接與財政部長斯科特·貝森特、商務部長霍華德·盧特尼克和國家網絡總監肖恩·凱恩克羅斯通話,有時不止一次。

Anthropic在週五的一份聲明中表示,公司認為政府“相信自己發現了一種繞過或‘越獄’Fable 5的方法”。但Anthropic稱,相關越獄是“潛在的、窄範圍的、非普遍性的”,由一家不願具名的實體“分享給政府”。此外,Anthropic表示該行為並非Fable 5獨有:“我們審查了一份我們認為構成政府指令基礎的報告,並確認所展示的能力水平在其他模型(包括OpenAI的GPT-5.5)中廣泛可用。”

據Semafor報道,爭議源於美國政府擔心中國關聯團體可能接觸了該技術。但消息人士稱中國謠言已持續數週,涉及一家最初被批准訪問Mythos Preview的大型全球電信公司,當美國政府表達擔憂時,Anthropic立即撤銷了訪問權限。

前AI與加密貨幣沙皇大衞·薩克斯在X平台上發帖也未提及中國,但提到了向政府揭露問題的匿名實體,稱其為“Anthropic和美國政府都高度信任的合作伙伴,正在測試Fable,發現了這些防護措施的越獄方法。”

有報道指出亞馬遜CEO安迪·賈西在亞馬遜研究人員對Fable 5進行紅隊測試後向政府提出擔憂。這一結論與一些獨立紅隊成員的評價相左,後者表示對防護水平印象深刻。消息人士稱,政府談判中明確提到了亞馬遜的研究,Anthropic在出口管制指令發出後幾天內就獲得了該論文,並一直與亞馬遜研究人員討論。消息人士稱,論文中的所有內容都可以通過OpenAI的GPT-5.5實現。

Anthropic整個週末忙於與特朗普政府緩和關係,從虛擬會議開始,隨後派員工前往華盛頓,包括安全負責人Dave Orr、前沿紅隊負責人Logan Graham以及前沿開發者和網絡安全研究員Nicholas Carlini。Axios報道稱,特朗普政府認為該公司在與政府的溝通中多次失誤,“沒有很好地嘗試與政府對話並理解意識形態差異。”對Anthropic而言,時機再糟不過:公司曾寄望Mythos幫助其擺脱與國防部數月來的高調衝突。

消息人士稱,Anthropic事先向政府簡要介紹了Fable 5,商務部在部署前進行了測試,當時未提出任何擔憂。Mythos Preview發佈後,Anthropic一直與政府機構密切合作。

特朗普政府最初對AI安全採取不干涉態度,但Mythos事件後,其態度變得矛盾,同時擔憂輸掉對華AI競賽。知名網絡安全領袖警告,擱置Mythos 5和Fable 5可能使中國獲得顯著AI優勢。特朗普的舉措激發了國際社會對美國AI系統替代方案的呼聲,同時實際上凍結了一家美國主要AI公司的新旗艦模型。

一份由科技和網絡安全高管簽署的公開信呼籲週日撤銷對Fable 5的限制。信中表示,並非所有人都認同AI監管是正確方向,但若監管不可避免,則應基於“科學評估,並吸納行業和學術界意見”。

Corridor首席產品官Alex Stamos告訴The Verge,他組織這封公開信是因為過去十多年無數不同編程語言編寫的漏洞需要AI在惡意行為者發現之前進行修補。“我們正處於競賽中,我認為政策制定者不理解這一點。有一種奇怪的傲慢,認為美國實驗室大大領先對手,而且這種領先將永遠持續,因此限制訪問至關重要。我認為這很愚蠢。如果實驗室領先,也只領先幾個月。你可以從公開評估中看到,前沿模型僅比中國模型領先約六個月——而且那還是我們已知的模型。”

公開信還指出,儘管Anthropic的Mythos類模型擅長髮現網絡安全漏洞和利用漏洞,但它們並非“獨特擅長”,且Fable 5的防護措施“過於激進,以至於在發佈日成為網絡社區的笑柄”。Stamos認為“Mythos的能力被過分誇大,Anthropic自身也對此負有責任……Mythos很好,但真正的轉折點實際上是在去年。”

Stamos表示,過去週末的事件使政治風險前所未有地成為公司商業計劃的一部分,行業充斥着與非美國公司簽訂備份合同以及在替代硬件上部署開放權重模型的情況。“北京那邊現在正在嘲笑我們。美國的一位冠軍正被美國政府削弱,而我們正與中國競賽。這極其愚蠢。這就是我寫這封信的原因,也是很多人簽署的原因。”

Legion Intelligence聯合創始人兼CEO Ben Van Roo告訴The Verge,“‘任何外國國民不得使用此模型’的指令是最不可能執行的。當我最初讀到它時,整個AI社區圈子都炸了。”

更緊迫的是,OpenAI、谷歌和微軟都推出了與Anthropic的Mythos類似的產品,並做出同樣的有效性及風險聲明。如果特朗普政府禁止Anthropic的先進網絡安全模型,它也可以為禁止競爭對手的模型提供理由。這可能促使AI行業領袖團結起來幫助Anthropic,或者像與五角大樓就自主武器的鬥爭一樣,將自己定位為更安全合規的替代方案。

即使特朗普政府試圖為科技公司減輕監管負擔,Anthropic指令可能相當於對強大AI模型的嚴格限制——取決於未來幾天的進展。Van Roo稱這是“監管領域的未知領域”,並認為此類事件不會只發生一次。

我們也進入了AI民粹主義時代,越來越多的人通過數據中心抗議、承諾停止使用AI聊天機器人、因不當致死提起訴訟甚至試圖攻擊AI公司CEO來抵制AI行業的過度影響和權力集中。Van Roo表示,特朗普政府最近的行動可能“引發更大的恐懼和擔憂,且可能出於錯誤的原因。”

消息人士稱週末的談判富有建設性,部分政府成員承認對模型提供商實施出口管制並不理想,因為競爭對手可能面臨同樣限制,且美國政府目前正在探索鼓勵美國AI系統出口的計劃。

隨着Anthropic繼續與政府談判,該公司與五角大樓的其他眾多問題——即圍繞美軍使用Anthropic技術可接受政策的持續鬥爭——很可能被提起。

“這是新的情況,我們以前從未有過如此劇烈的事件,它在如何強制執行模型訪問方面確實具有實際影響,”Van Roo説。“誰有權使用這種繼續超越我們監管能力的新技術?”