AI News HubLIVE
站内改写1 分鐘閱讀

透過AI伴侶意外實現代理記憶的SOTA

graphCTX是一個專為AI編碼代理設計的本地記憶層,提供快速、私有且可靠的上下文管理。它透過捕獲編碼事實、繫結Git狀態、提升耐久知識、排序相關性並附加來源追溯,實現了約1ms的召回速度和100%的壓縮後解決率。本文介紹了其架構、基準測試結果和安裝方法,展示了其相比傳統方案在速度和成本上的顯著優勢。

來源Hacker News AI作者: vignesh_146

graphCTX 是一個為 AI 編碼代理量身打造的本地記憶層,它能將倉庫中的命令、慣例、決策和修復記錄等知識緊密關聯到開發流程中,從而大幅減少開發者反覆解釋上下文的時間。其設計理念是“快速、私有、可靠”,所有資料均儲存在本地,無需聯網。

系統由五個核心步驟構成:首先,捕獲(Capture)階段從包指令碼、鎖檔案、CI 配置、編輯器配置和 AGENTS.md 等來源提取可靠的編碼事實,確保記憶基礎源自倉庫證據而非模型猜測。其次,錨定(Anchor)階段將這些事實繫結到 Git 狀態,使記憶隨程式碼變更在 DAG 中移動,避免基於時間戳的漂移。第三,提升(Promote)階段透過證據門控,只將會話中的持久知識升級為工作區或使用者記憶,排除機密和低信任內容。第四,排序(Rank)階段利用相關性門控對主題漂移、實體和檔案範圍進行評分,確保代理獲得最緊湊有用的上下文。最後,交付(Deliver)階段為每條記憶附加來源追溯,幫助開發者信任和審計代理使用的資訊。

在基準測試中,graphCTX 與 Supermemory 進行了直接對比。使用相同的編碼事實集和查詢,graphCTX 本地執行的 p50 檢索延遲僅為 1.2ms,而 Supermemory 的往返延遲高達 494ms,速度提升約 410 倍。p95 延遲方面,graphCTX 為 3.9ms,Supermemory 為 720ms,提升約 180 倍。更為關鍵的是,在壓縮後的 14 個編碼任務中,graphCTX 實現了 100% 的解決率,而無記憶的代理為 0/14,使用召回 API 的代理僅為 3/14。此外,隨著工作空間增長,graphCTX 的延遲保持穩定:10 個事即時 p50 為 1.04ms,510 個事即時為 1.15ms,5010 個事即時也僅為 1.33ms,證明其索引查詢和有限語義重排序可保持熱路徑在約 1ms。

graphCTX 完全免費,無需計量或 API 金鑰,所有資料保留在本地機器上。安裝過程極其簡單:首先執行 curl -fsSL https://graph.coder.company/install | sh 安裝 CLI,然後執行 graphctx install claude 連線代理(支援 Claude、Cursor、OpenCode 等),最後執行 graphctx doctor 驗證連線。整個過程無需賬戶或雲設定,30 秒內即可為代理配置倉庫記憶。