AI News HubLIVE
站内改写2 分鐘閱讀

我們有了自家的“玻璃翼”:誰還需要Mythos 5或Fable 5?

作者受Anthropic的Glasswing啓發,在本地硬件上構建了自主安全研究員Lucent。Lucent是一個分階段源代碼漏洞獵人,在單張RTX 3090上運行本地27B Qwen模型,通過Lucebox解碼速度提升約3.4倍。首次針對hermes-agent的測試中,靜態分析產生1342個候選,本地篩選至126個,前沿模型對抗審計將15個線索最終縮減至2個真實漏洞。本地讀取成本約1.62美元。最精彩的時刻是審查者代理發現作者之前針對供應商已悄悄重寫的威脅模型評分了三個早期漏洞。

來源Hacker News AI作者: Seventeen18

Anthropic推出了Glasswing——一個自主安全研究員,能夠自行閲讀代碼庫並返回真實漏洞。作者也希望擁有這樣一個工具,但不是按API調用付費,而是在自己的機器上運行,使用可控的模型,可以整夜運行,僅需電費。於是,Lucent誕生了。

Lucent是一個分階段流水線,每個階段可運行不同模型,目標源代碼以只讀方式掛載在鎖定的Docker沙箱中。流水線包括四個階段:排名(Rank)、搜索(Hunt)、驗證(Verify)和利用(Exploit)。排名階段根據隱藏漏洞的可能性對每個源文件評分,確保昂貴的階段將預算花在關鍵位置。搜索階段由一個分層的文件並行代理池組成,讀取排名後的文件並記錄線索。驗證階段以對抗方式重新讀取每個線索,嘗試證偽。成功通過驗證的線索進入利用階段,進行漏洞利用並嘗試生成工作概念驗證。

硬件方面,高容量讀取在單張RTX 3090上運行。排名器和搜索器驅動本地開源的Qwen3.6-27B模型,由Lucebox提供服務。Lucebox使用投機解碼,可以同時批處理多個後續token,在代碼類文本上實現約3.4倍的速度提升(約130 token/s,而普通自迴歸解碼為38 token/s)。這使得27B模型能夠快速處理大型代碼樹。

在首次針對hermes-agent的測試中,靜態分析標記了1342個候選位置,本地搜索將其縮減至126個,前沿模型(Opus 4.7)的對抗審計進一步削減至15個線索,最終發現兩個真實漏洞:一個是在聊天中任何人都可以回答的批准提示,另一個是範圍內的問題,但修復尚未發佈,因此細節暫不公佈。最令人印象深刻的是,審查者代理在過程中發現,作者之前已經“演示”的三種其他利用方式,實際上是針對供應商六週前已替換的安全策略評分的,這意味着大部分成果無效。

構建過程並非一帆風順。最初手動驅動大型雲模型的結果充滿假陽性。作者轉而構建流水線,經歷了數週的失敗:排名器埋沒了有趣的文件,搜索器生成不存在的文件行引用,驗證器放過了應該殺死的線索,Lucebox網關在負載下停滯需要重啓。作者逐一修復了這些問題,教會驗證器不信任自身輸入,包括磁盤上的文件,並添加了檢查點以從中斷處恢復。

最終,Lucent在真實世界中證明了其價值,以極低的成本找到了複雜代碼庫中的真實漏洞。這證明了在合理設計下,開源模型和消費級硬件也能實現令人印象深刻的安全研究能力。