Heron:AI代理的Wireshark——被動eBPF可觀測性
Heron是一款被動式網路分析工具,無需SDK或代理,利用eBPF技術捕獲並解密TLS加密的LLM呼叫,重構AI代理的實際行為。它開源、基於Rust構建,已支援OpenTelemetry標準,並新增eBPF捕獲發現、自動過濾隱藏側車等功能,可幫助開發者除錯代理迴圈和生產問題。
Heron 是一款針對 AI 代理的被動式網路分析器,被其創造者 Netis 團隊稱作“AI 代理的 Wireshark”。它的核心能力是透過 eBPF 鉤子,在不引入任何 SDK 或代理的情況下,從網路流量中重構 AI 代理的真實行為。這意味著開發者可以觀察 TLS 加密的 LLM 呼叫,並精確識別出是哪個代理程序發起的呼叫,而完全無需修改程式碼或代理請求路徑。
Heron 在 2024 年正式釋出,並在近期推出了 v0.7.0 重大更新。此次更新全面對齊 OpenTelemetry 標準:代理輪次被建模為追蹤(trace),LLM 呼叫被建模為跨度(span),從而無縫整合到現有的可觀測性生態中。此外,新增的 eBPF 捕獲發現機制透過掛鉤 SSL_read/SSL_write,能夠將 TLS 加密的代理流量以明文形式捕獲,同時附帶程序歸屬資訊(即哪個代理程序發起的哪個呼叫),也無需 TLS 終結器或代理。
團隊在開發過程中發現了一個有趣的現象:在捕獲的 Claude Code 生產流量中,約 73% 的 Opus 輪次實際上是隱藏的安全監控側車(sidecar)程序產生的。Heron 現在可以自動過濾這些“家務型”噪音,讓開發者只看到真正的代理工作負載。
另一個亮點是“一鍵 SFT 軌跡匯出”功能:使用者可以將生產環境中的代理呼叫軌跡直接匯出為監督式微調(SFT)格式的訓練資料,無需重新執行任何工作流即可快速生成微調資料集。
Heron 完全基於 Rust 構建,釋出為一個單二進位制檔案,並內嵌了 React 控制台介面。它採用 Apache-2.0 許可證開源。團隊強調其設計原則是:即使 Heron 自身變慢或失敗,也不應阻塞代理的正常流量;它可能會在資源壓力下丟失可觀測性資料,但不會干擾代理本身。
對於效能影響,團隊建議在生產環境中先以被動/影子模式部署,調整保留策略和請求體大小限制,並監控 CPU、記憶體和磁碟 I/O,再逐步擴大覆蓋範圍。對於程序識別,Heron 在 eBPF 層透過 PID 追蹤並結合程序樹關聯來區分同一主機上多個代理程序對同一 LLM 端點的呼叫。