通过AI伴侣意外实现代理记忆的SOTA
graphCTX是一个专为AI编码代理设计的本地记忆层,提供快速、私有且可靠的上下文管理。它通过捕获编码事实、绑定Git状态、提升耐久知识、排序相关性并附加来源追溯,实现了约1ms的召回速度和100%的压缩后解决率。本文介绍了其架构、基准测试结果和安装方法,展示了其相比传统方案在速度和成本上的显著优势。
graphCTX 是一个为 AI 编码代理量身打造的本地记忆层,它能将仓库中的命令、惯例、决策和修复记录等知识紧密关联到开发流程中,从而大幅减少开发者反复解释上下文的时间。其设计理念是“快速、私有、可靠”,所有数据均存储在本地,无需联网。
系统由五个核心步骤构成:首先,捕获(Capture)阶段从包脚本、锁文件、CI 配置、编辑器配置和 AGENTS.md 等来源提取可靠的编码事实,确保记忆基础源自仓库证据而非模型猜测。其次,锚定(Anchor)阶段将这些事实绑定到 Git 状态,使记忆随代码变更在 DAG 中移动,避免基于时间戳的漂移。第三,提升(Promote)阶段通过证据门控,只将会话中的持久知识升级为工作区或用户记忆,排除机密和低信任内容。第四,排序(Rank)阶段利用相关性门控对主题漂移、实体和文件范围进行评分,确保代理获得最紧凑有用的上下文。最后,交付(Deliver)阶段为每条记忆附加来源追溯,帮助开发者信任和审计代理使用的信息。
在基准测试中,graphCTX 与 Supermemory 进行了直接对比。使用相同的编码事实集和查询,graphCTX 本地运行的 p50 检索延迟仅为 1.2ms,而 Supermemory 的往返延迟高达 494ms,速度提升约 410 倍。p95 延迟方面,graphCTX 为 3.9ms,Supermemory 为 720ms,提升约 180 倍。更为关键的是,在压缩后的 14 个编码任务中,graphCTX 实现了 100% 的解决率,而无记忆的代理为 0/14,使用召回 API 的代理仅为 3/14。此外,随着工作空间增长,graphCTX 的延迟保持稳定:10 个事实时 p50 为 1.04ms,510 个事实时为 1.15ms,5010 个事实时也仅为 1.33ms,证明其索引查找和有限语义重排序可保持热路径在约 1ms。
graphCTX 完全免费,无需计量或 API 密钥,所有数据保留在本地机器上。安装过程极其简单:首先运行 curl -fsSL https://graph.coder.company/install | sh 安装 CLI,然后执行 graphctx install claude 连接代理(支持 Claude、Cursor、OpenCode 等),最后运行 graphctx doctor 验证连接。整个过程无需账户或云设置,30 秒内即可为代理配置仓库记忆。