AI News HubLIVE
站内改写2 分钟阅读

专为本地LLM和DeepSeek v4优化的原生编码代理,具备向量记忆功能

cwcode是一个基于Go语言的终端编码代理,利用DeepSeek V4 Pro等模型,提供文件编辑、子代理、语义记忆和自动恢复等功能。它强调低成本(每小时约0.40美元)、高效缓存(85%以上命中率),并支持本地模型和多种API。

来源Hacker News AI作者: coolwulf

cwcode 是一款终端编码代理,专为 DeepSeek V4 Pro、Qwen3.6-27B、Kimi、Azure 以及任何兼容 OpenAI 聊天 API 的服务而设计。它使用 Go 语言编写,运行在终端中,能够直接编辑真实代码,并具备自动恢复能力。运行一小时的成本约为 0.40 美元,令牌成本仅为 Claude 的 5%,且第三轮后前缀缓存命中率超过 85%。

cwcode 基于 Bubbletea TUI 构建,支持多种模型配置,包括 DeepSeek(Pro 和 Flash)、Azure OpenAI、Kimi for Coding,以及通过 vLLM/llama.cpp 本地运行的 Qwen3.6-27B。用户可以通过一条斜杠命令在会话中切换配置。它内置了丰富的工具:bash 命令执行、文件编辑、glob 匹配、grep 搜索、网页抓取、通过 CDP 驱动真实 Chrome 浏览器的无头抓取、子代理、持久化语义记忆存储、基于内容寻址的检查点与回滚、计划/代码模式切换,以及自主目标循环。工具注册表仅 600 行代码,添加新工具只需实现两个 Go 接口方法。

该代理并非 SaaS 服务,无需账户,无遥测,无远程控制。API 密钥保存在 ~/.cwcode/config.json 中,会话历史存储在 ~/.cwcode/sessions/ 下。即使网络断开,只要模型端点是本地的,代理就能继续工作。

其独特之处在于多项创新技术:哈希锚定编辑——read_file 工具为每行代码添加 3 字符内容哈希,edit_lines 工具根据哈希验证修改,避免模型逐字复制,使 V4 Pro 上每次会话的输出令牌减少 30-40%;粘性前缀缓存——系统提示跨轮保持字节稳定,工具定义确定顺序,默认从所有提供商的出站请求中剥离推理内容,DeepSeek 的提示缓存命中路径比未命中便宜约 120 倍,第三轮后命中率常超 85%。

计划与代码模式通过 Shift+Tab 切换,前者仅允许只读工具,后者开启全部执行。模型无法察觉切换,人类始终掌握最终控制权,除非启用 YOLO 模式。检查点与回滚功能在执行文件修改前自动快照受影响的文件,基于 SHA-256 去重存储,/rewind N 可恢复文件并回退对话历史。风暴破坏者机制在相同工具连续失败三次时,会生成自然语言解释并追加到历史中,而非静默终止。自主目标循环通过 /goal 添加任务,/goal on 启动自动循环,最多连续执行 20 轮,适用于四小时的通宵运行。

配置和会话均为 JSON 格式,检查点为内容寻址块,记忆存储使用 SQLite 文件,所有数据位于 ~/.cwcode/ 目录下,项目停止维护会话仍可读取。安装简单:从 Google Drive 下载预编译二进制文件,配置 ~/.cwcode/config.json 中的 API 端点,即可运行。

cwcode 提供丰富的内置工具,包括 bash(需批准)、bash_background(需批准)、read_file(无需批准)、write_file(需批准)、edit_file(需批准)、edit_files(需批准)、edit_lines(需批准)、glob(无需)、grep(无需)、ls(无需)、web_fetch(无需)、chrome_fetch(需批准)、task(需批准)、remember(无需)、recall(无需)、todo_write(无需)等。

FAQ 部分解释了选择 Go 的原因(单一静态二进制、启动快、易交叉编译)、为何是终端应用而非 VS Code 扩展(让代理成为主要界面)、与 Claude 的兼容性(不支持直接,需翻译代理)、日常使用模型(DeepSeek V4 Pro 为主,本地 Qwen3.6-27B 用于低延迟),以及源代码目前私有但计划开源。该项目由一个小团队开发,用于剂量预测模型训练、金融研究代理和编写 cwcode 本身。