我們有了自家的“玻璃翼”:誰還需要Mythos 5或Fable 5?
作者受Anthropic的Glasswing啟發,在本地硬體上構建了自主安全研究員Lucent。Lucent是一個分階段原始碼漏洞獵人,在單張RTX 3090上執行本地27B Qwen模型,透過Lucebox解碼速度提升約3.4倍。首次針對hermes-agent的測試中,靜態分析產生1342個候選,本地篩選至126個,前沿模型對抗審計將15個線索最終縮減至2個真實漏洞。本地讀取成本約1.62美元。最精彩的時刻是審查者代理發現作者之前針對供應商已悄悄重寫的威脅模型評分了三個早期漏洞。
Anthropic推出了Glasswing——一個自主安全研究員,能夠自行閱讀程式碼庫並返回真實漏洞。作者也希望擁有這樣一個工具,但不是按API呼叫付費,而是在自己的機器上執行,使用可控的模型,可以整夜執行,僅需電費。於是,Lucent誕生了。
Lucent是一個分階段流水線,每個階段可執行不同模型,目標原始碼以只讀方式掛載在鎖定的Docker沙箱中。流水線包括四個階段:排名(Rank)、搜尋(Hunt)、驗證(Verify)和利用(Exploit)。排名階段根據隱藏漏洞的可能性對每個原始檔評分,確保昂貴的階段將預算花在關鍵位置。搜尋階段由一個分層的檔案並行代理池組成,讀取排名後的檔案並記錄線索。驗證階段以對抗方式重新讀取每個線索,嘗試證偽。成功透過驗證的線索進入利用階段,進行漏洞利用並嘗試生成工作概念驗證。
硬體方面,高容量讀取在單張RTX 3090上執行。排名器和搜尋器驅動本地開源的Qwen3.6-27B模型,由Lucebox提供服務。Lucebox使用投機解碼,可以同時批處理多個後續token,在程式碼類文本上實現約3.4倍的速度提升(約130 token/s,而普通自迴歸解碼為38 token/s)。這使得27B模型能夠快速處理大型程式碼樹。
在首次針對hermes-agent的測試中,靜態分析標記了1342個候選位置,本地搜尋將其縮減至126個,前沿模型(Opus 4.7)的對抗審計進一步削減至15個線索,最終發現兩個真實漏洞:一個是在聊天中任何人都可以回答的批准提示,另一個是範圍內的問題,但修復尚未釋出,因此細節暫不公佈。最令人印象深刻的是,審查者代理在過程中發現,作者之前已經“演示”的三種其他利用方式,實際上是針對供應商六週前已替換的安全策略評分的,這意味著大部分成果無效。
構建過程並非一帆風順。最初手動驅動大型雲模型的結果充滿假陽性。作者轉而構建流水線,經歷了數週的失敗:排名器埋沒了有趣的檔案,搜尋器生成不存在的檔案行引用,驗證器放過了應該殺死的線索,Lucebox閘道器在負載下停滯需要重啟。作者逐一修復了這些問題,教會驗證器不信任自身輸入,包括磁碟上的檔案,並新增了檢查點以從中斷處恢復。
最終,Lucent在真實世界中證明了其價值,以極低的成本找到了複雜程式碼庫中的真實漏洞。這證明了在合理設計下,開源模型和消費級硬體也能實現令人印象深刻的安全研究能力。