2026-06-16站内改写2 分钟阅读更新: 2026-06-16

专为本地LLM和DeepSeek v4优化的原生编码代理，具备向量记忆功能

cwcode是一个基于Go语言的终端编码代理，利用DeepSeek V4 Pro等模型，提供文件编辑、子代理、语义记忆和自动恢复等功能。它强调低成本（每小时约0.40美元）、高效缓存（85%以上命中率），并支持本地模型和多种API。

来源Hacker News AI作者: coolwulf

cwcode 是一款终端编码代理，专为 DeepSeek V4 Pro、Qwen3.6-27B、Kimi、Azure 以及任何兼容 OpenAI 聊天 API 的服务而设计。它使用 Go 语言编写，运行在终端中，能够直接编辑真实代码，并具备自动恢复能力。运行一小时的成本约为 0.40 美元，令牌成本仅为 Claude 的 5%，且第三轮后前缀缓存命中率超过 85%。

cwcode 基于 Bubbletea TUI 构建，支持多种模型配置，包括 DeepSeek（Pro 和 Flash）、Azure OpenAI、Kimi for Coding，以及通过 vLLM/llama.cpp 本地运行的 Qwen3.6-27B。用户可以通过一条斜杠命令在会话中切换配置。它内置了丰富的工具：bash 命令执行、文件编辑、glob 匹配、grep 搜索、网页抓取、通过 CDP 驱动真实 Chrome 浏览器的无头抓取、子代理、持久化语义记忆存储、基于内容寻址的检查点与回滚、计划/代码模式切换，以及自主目标循环。工具注册表仅 600 行代码，添加新工具只需实现两个 Go 接口方法。

该代理并非 SaaS 服务，无需账户，无遥测，无远程控制。API 密钥保存在 ~/.cwcode/config.json 中，会话历史存储在 ~/.cwcode/sessions/ 下。即使网络断开，只要模型端点是本地的，代理就能继续工作。

其独特之处在于多项创新技术：哈希锚定编辑——read_file 工具为每行代码添加 3 字符内容哈希，edit_lines 工具根据哈希验证修改，避免模型逐字复制，使 V4 Pro 上每次会话的输出令牌减少 30-40%；粘性前缀缓存——系统提示跨轮保持字节稳定，工具定义确定顺序，默认从所有提供商的出站请求中剥离推理内容，DeepSeek 的提示缓存命中路径比未命中便宜约 120 倍，第三轮后命中率常超 85%。

计划与代码模式通过 Shift+Tab 切换，前者仅允许只读工具，后者开启全部执行。模型无法察觉切换，人类始终掌握最终控制权，除非启用 YOLO 模式。检查点与回滚功能在执行文件修改前自动快照受影响的文件，基于 SHA-256 去重存储，/rewind N 可恢复文件并回退对话历史。风暴破坏者机制在相同工具连续失败三次时，会生成自然语言解释并追加到历史中，而非静默终止。自主目标循环通过 /goal 添加任务，/goal on 启动自动循环，最多连续执行 20 轮，适用于四小时的通宵运行。

配置和会话均为 JSON 格式，检查点为内容寻址块，记忆存储使用 SQLite 文件，所有数据位于 ~/.cwcode/ 目录下，项目停止维护会话仍可读取。安装简单：从 Google Drive 下载预编译二进制文件，配置 ~/.cwcode/config.json 中的 API 端点，即可运行。

cwcode 提供丰富的内置工具，包括 bash（需批准）、bash_background（需批准）、read_file（无需批准）、write_file（需批准）、edit_file（需批准）、edit_files（需批准）、edit_lines（需批准）、glob（无需）、grep（无需）、ls（无需）、web_fetch（无需）、chrome_fetch（需批准）、task（需批准）、remember（无需）、recall（无需）、todo_write（无需）等。

FAQ 部分解释了选择 Go 的原因（单一静态二进制、启动快、易交叉编译）、为何是终端应用而非 VS Code 扩展（让代理成为主要界面）、与 Claude 的兼容性（不支持直接，需翻译代理）、日常使用模型（DeepSeek V4 Pro 为主，本地 Qwen3.6-27B 用于低延迟），以及源代码目前私有但计划开源。该项目由一个小团队开发，用于剂量预测模型训练、金融研究代理和编写 cwcode 本身。