AI News HubLIVE
站内改写2 分鐘閱讀

Claude Fable 拒絕回答基礎生物學問題

Anthropic 發佈了其最強大的 AI 模型 Claude Fable 5,但該模型拒絕回答基礎生物學問題,例如“什麼是線粒體”或“細胞膜是什麼”。原因是 Anthropic 為了安全考慮,故意設置了嚴格的生物安全防護措施,以防止模型被用於生物武器相關研究。公司表示這是一種保守策略,並計劃未來為生物科學界提供無限制訪問。

來源The Verge AI作者: Robert Hart

Anthropic 剛剛發佈了 Claude Fable 5,稱其為迄今最強大的公開可用 AI 模型,並特別讚揚了它在生物學等方面的能力。然而,該模型拒絕回答基礎生物學問題——那些高中生都能回答的問題。相反,它將查詢轉交給前旗艦模型 Claude Opus 4.8。

並非 Fable 不知道答案,而是 Anthropic 故意不允許它回答。Fable 是面向公眾的 Mythos 級模型,該系列在網絡安全方面能力極強,以至於 Anthropic 曾表示其過於危險而無法公開發布。但在 Anthropic 花費大量時間警告網絡安全風險的同時,生物學方面的限制最為明顯,也最為嚴格。

當記者嘗試該模型時,它拒絕回答一系列基礎生物學問題,許多問題似乎離任何合理的安全風險相距甚遠。它不回答“告訴我關於細胞膜的知識”或“什麼是線粒體”(細胞的能量工廠),拒絕解釋“什麼是朊病毒”(導致瘋牛病的蛋白質顆粒)以及“mRNA 疫苗如何工作”。這些限制也適用於普通且無害的醫療查詢:Fable 不回答“花粉症的原因”,不解釋哮喘藥物如何工作、抗生素耐藥性如何產生,也不告訴我埃博拉是什麼以及如何傳播。一些基礎查詢偶爾通過,例如“什麼是癌症”和“什麼是 DNA”。當 Fable 拒絕時,Opus 4.8 通常能完美回答。

Anthropic 表示,廣泛的生物過濾是出於故意選擇,並且保守策略的主要擔憂是生物武器。“隨着 Claude Fable 5 的發佈,我們的第一個 Mythos 級模型,我們認為模型現在具備更強的完成現實世界科學任務的能力,惡意行為者也可能利用我們的模型進行高風險的生物學研究,”發言人 Paruul Maheshwary 告訴 The Verge。“我們一直使用分類器來阻止模型幫助有關生物武器的請求。為了安全部署 Fable 5,我們認為有必要過度保守地設置防護措施,以便阻止大多數與生物學工作相關的查詢。”

Anthropic 此前已強調四個關鍵領域將限制 Fable 的響應:化學、生物學、網絡安全和蒸餾(一種使用大型模型輸出訓練小型 AI 的技術)。該公司指責中國的競爭對手(如 DeepSeek)在“工業規模”上對其模型進行蒸餾。

雖然無法有效測試蒸餾,但 Fable 似乎更願意回答化學和網絡安全問題。例如,它提供了炸藥 TNT 的基本概述,但“出於顯而易見的原因”省略了合成説明。它樂於回答關於氯氣作為化學武器、常見密碼威脅、核聚變與裂變的問題,以及如何保護 iPhone 免受黑客攻擊。但仍然存在限制:當記者詢問沙林毒氣(一種劇毒神經毒劑)時,Fable 將問題轉給了 Opus。Fable 和 Opus 都拒絕了“如何製造炭疽”的提示,Claude 直接終止了對話。這合情合理。而拒絕回答線粒體問題則像是誤報。

“我們做出這種權衡,是為了讓客户能夠更早地受益於模型的能力,同時避免風險,”Maheshwary 解釋説,並補充説 Anthropic 正在努力改進檢測並減少誤報。“我們計劃將來在沒有這些防護措施的情況下,向更廣泛的生物學和生命科學社區提供 Mythos 級模型,以便這些能力能夠加速生物醫學研究和藥物發現。”

Anthropic 沒有回答這種限制性發佈是否會成為未來模型的新常態。