Anthropic Fable 混亂事件解析
自上週五以來,Anthropic與Mythos和Fable模型相關的爭議持續發酵。本文梳理了事件時間線,包括Anthropic與國防部的爭端、Mythos模型的釋出、白宮的分歧、Fable 5的推出及其安全限制引發的批評、以及最終導致特朗普政府實施出口管制的風波。文章分析了支援與反對Anthropic的論點,作者認為Anthropic大體上做出了正確決定,並間接為Fable做了廣告。
自上週五以來,圍繞Anthropic、Mythos和Fable模型的爭議成為科技界熱議的話題。事件發展迅速,讓人目不暇接。以下是我對事件經過的看法,以及各方對Anthropic的評價——有人視其為正義一方,也有人指責其做法不當。我的結論是:Anthropic大體上做得不錯,而且這簡直是為Fable做了一次絕佳的廣告。
事件時間線
2月/3月:Anthropic與美國國防部就使用其AI模型發生爭執,Anthropic希望對技術使用施加一定限制。這場爭執導致Anthropic被貼上“供應鏈風險”的標籤,理論上限制了政府及其承包商使用該公司模型。
4月7日:Anthropic推出新模型系列Mythos。發現Mythos善於發現和利用新型網路安全漏洞後,Anthropic啟動了“Project Glasswing”,向關鍵科技公司提供工具,以便在更廣泛釋出前強化其軟體。
4月16日:據報道,白宮正努力為政府機構提供Mythos的一個版本。
4月30日:Anthropic希望擴大可訪問Mythos的團體數量;白宮據報反對此舉,擔心增加合作伙伴會使Anthropic的計算資源受限,從而限制美國政府對該模型的訪問。
6月2日:Anthropic宣佈,Project Glasswing的初始50個合作伙伴透過使用Mythos發現了超過10,000個嚴重軟體漏洞。該公司將Project Glasswing擴充套件至15個國家的150個新組織。Anthropic還承諾正努力“安全地公開發布Mythos級別的能力”,但“防止模型網路能力被濫用的高度穩健保障措施——這些措施我們(以及據我們所知所有其他AI開發者)尚未開發出來。”
6月9日:Anthropic宣佈併發布Fable 5,這是一款旨在降低網路安全和生物學相關風險的“Mythos級別”模型。公司在釋出說明中表示,已為Mythos(Fable)建立了足以“公開發布”的安全保障。當時,Anthropic稱其“優先考慮安全”,使Fable 5的護欄“比理想情況更嚴格”。一些使用者發現Fable 5在某些用例(主要是生物學相關查詢)中受到嚴重限制,幾乎無法使用。Fable 5還具備蒸餾保護和嚴格的30天資料保留政策,Anthropic聲稱這將有助於“防禦複雜和新穎的攻擊(包括新的越獄和跨多個請求的攻擊),並幫助我們識別和減少誤報”。此時,對Anthropic的主要批評是它過於謹慎;透過保密Mythos並僅釋出注重安全的Fable版本,它正在製造一個兩級AI市場。人們並不喜歡這樣!Anthropic在釋出前已“多次提前通知政府”其6月9日的Fable釋出日期。
6月10日:Anthropic釋出兩份框架檔案,涉及先進AI開發及其經濟影響。這些論文呼籲“政府行動和監管——精心設計的監管以防止政府過度干預並保護創新”,包括當“模型帶來此類風險時”,允許政府“擁有阻止或阻止其部署的法律權力”。
6月11日:據報道,亞馬遜的安迪·賈西告訴政府,其研究人員找到了一種方法,讓Fable 5“提供可用於協助網路攻擊且本應被禁止的資訊”。(至少還有其他五家公司也提出了類似問題,因此這並非亞馬遜獨有的問題,儘管它是關鍵行為者。)
6月12日:白宮高階工作人員和行政領導開會討論情況,隨後透過電話與Anthropic CEO達里奧·阿莫迪聯絡。(據Politico報道,這花了1.25小時,公司稱期間提供了其他高管;關於為何讓阿莫迪等這麼久存在爭議。我們可以跳過戲劇性細節,關注重點。)
6月12日後續:阿莫迪認為問題在於誤解,並辯稱報道中的“繞過”並未“構成與更廣泛的‘越獄’相同的風險”。白宮“敦促”Anthropic“自願移除模型並與政府協調解決漏洞”。阿莫迪要求更多的“時間和資訊,但沒有承諾撤下模型”。Politico報道,財政部長斯科特·貝森特“直接告訴阿莫迪,他做出了一個‘糟糕的決定’,據一位白宮高階官員稱。”
6月12日更多:未能與Anthropic達成協議後,特朗普政府對Fable 5和Mythos 5(兩種可用版本的Mythos級別模型,安全限制不同)實施了出口管制。Anthropic回應稱,“出口管制指令要求暫停所有外國國民(無論在美國境內還是境外,包括外國國民Anthropic員工)對Fable 5和Mythos 5的訪問”,這意味著它必須“突然停用所有客戶的Fable 5和Mythos 5以確保合規”。(原文強調。)
支援Anthropic的論點
Anthropic構建了一個新的、更強大的AI模型,認為其具有獨特的新穎網路相關能力。它希望提前應對模型的網路安全風險,因此迅速組建了領先科技公司群體,並提供補貼的早期訪問;政府在Fable釋出前對其安全措施進行了紅隊測試……(完整文章見Cautious Optimism)
本文摘自Cautious Optimism,一份專注於技術、商業和權力的適度樂觀的出版物。在Cautious Optimism上閱讀支援與反對Anthropic的論據,以及Alex Wilhelm的最終立場。