AI News HubLIVE
站内改写2 分钟阅读

我们有了自家的“玻璃翼”:谁还需要Mythos 5或Fable 5?

作者受Anthropic的Glasswing启发,在本地硬件上构建了自主安全研究员Lucent。Lucent是一个分阶段源代码漏洞猎人,在单张RTX 3090上运行本地27B Qwen模型,通过Lucebox解码速度提升约3.4倍。首次针对hermes-agent的测试中,静态分析产生1342个候选,本地筛选至126个,前沿模型对抗审计将15个线索最终缩减至2个真实漏洞。本地读取成本约1.62美元。最精彩的时刻是审查者代理发现作者之前针对供应商已悄悄重写的威胁模型评分了三个早期漏洞。

来源Hacker News AI作者: Seventeen18

Anthropic推出了Glasswing——一个自主安全研究员,能够自行阅读代码库并返回真实漏洞。作者也希望拥有这样一个工具,但不是按API调用付费,而是在自己的机器上运行,使用可控的模型,可以整夜运行,仅需电费。于是,Lucent诞生了。

Lucent是一个分阶段流水线,每个阶段可运行不同模型,目标源代码以只读方式挂载在锁定的Docker沙箱中。流水线包括四个阶段:排名(Rank)、搜索(Hunt)、验证(Verify)和利用(Exploit)。排名阶段根据隐藏漏洞的可能性对每个源文件评分,确保昂贵的阶段将预算花在关键位置。搜索阶段由一个分层的文件并行代理池组成,读取排名后的文件并记录线索。验证阶段以对抗方式重新读取每个线索,尝试证伪。成功通过验证的线索进入利用阶段,进行漏洞利用并尝试生成工作概念验证。

硬件方面,高容量读取在单张RTX 3090上运行。排名器和搜索器驱动本地开源的Qwen3.6-27B模型,由Lucebox提供服务。Lucebox使用投机解码,可以同时批处理多个后续token,在代码类文本上实现约3.4倍的速度提升(约130 token/s,而普通自回归解码为38 token/s)。这使得27B模型能够快速处理大型代码树。

在首次针对hermes-agent的测试中,静态分析标记了1342个候选位置,本地搜索将其缩减至126个,前沿模型(Opus 4.7)的对抗审计进一步削减至15个线索,最终发现两个真实漏洞:一个是在聊天中任何人都可以回答的批准提示,另一个是范围内的问题,但修复尚未发布,因此细节暂不公布。最令人印象深刻的是,审查者代理在过程中发现,作者之前已经“演示”的三种其他利用方式,实际上是针对供应商六周前已替换的安全策略评分的,这意味着大部分成果无效。

构建过程并非一帆风顺。最初手动驱动大型云模型的结果充满假阳性。作者转而构建流水线,经历了数周的失败:排名器埋没了有趣的文件,搜索器生成不存在的文件行引用,验证器放过了应该杀死的线索,Lucebox网关在负载下停滞需要重启。作者逐一修复了这些问题,教会验证器不信任自身输入,包括磁盘上的文件,并添加了检查点以从中断处恢复。

最终,Lucent在真实世界中证明了其价值,以极低的成本找到了复杂代码库中的真实漏洞。这证明了在合理设计下,开源模型和消费级硬件也能实现令人印象深刻的安全研究能力。