AI News HubLIVE
站内改写1 分鐘閱讀

“他們坑了我們”:性格衝突導致Anthropic的模型下線

據Axios報道,Anthropic與美國政府之間的性格衝突導致其AI模型Mythos和Fable因出口管制而下線。消息人士稱,解決之道可能是讓模型無法被越獄,或者改善雙方態度。

根據Axios的一篇獨家報道,Anthropic與美國政府之間的個性衝突是導致其AI模型Mythos和Fable因出口管制而下線的關鍵原因。這篇報道引用了大量“熟悉政府想法”和“接近Anthropic”的消息來源,揭示了雙方在溝通和態度上的嚴重分歧。這被認為是迄今為止關於美國政府出口管制Mythos/Fable事件最詳盡的幕後報道。

據悉,Anthropic的研究員Logan Graham、Dave Orr以及知名學者Nicholas Carlini今天將在華盛頓與商務部官員會面,試圖解決這一僵局。儘管會面在即,但報道中的結尾註腳並未給人帶來樂觀預期。報道指出,一種選擇是確保Anthropic的模型無法被越獄——儘管完美的越獄抵抗可能是不可能的。如果無法做到這一點,政府方面希望Anthropic能調整態度,讓“每個人都感到安全、有保障和快樂”。

此外,作者Simon Willison質疑Anthropic是否成功解決了2023年論文《對對齊語言模型的通用且可轉移的對抗性攻擊》中描述的一類攻擊。這篇論文展示了針對語言模型的對抗性攻擊方法,而Anthropic的模型可能仍然脆弱。這一事件不僅影響了Anthropic的模型可用性,也引發了關於AI安全和政府監管的廣泛討論。

這篇報道發佈於2026年6月15日,是Simon Willison對Axios文章的分析和評論。文章中提到,Anthropic的模型下線事件凸顯了技術公司與政府機構之間合作與溝通的重要性。未來,如何平衡創新與安全、如何避免類似的衝突,將是整個行業需要面對的問題。