AI News HubLIVE
站内改写2 分鐘閱讀

專為本地LLM和DeepSeek v4優化的原生編碼代理,具備向量記憶功能

cwcode是一個基於Go語言的終端編碼代理,利用DeepSeek V4 Pro等模型,提供文件編輯、子代理、語義記憶和自動恢復等功能。它強調低成本(每小時約0.40美元)、高效緩存(85%以上命中率),並支持本地模型和多種API。

來源Hacker News AI作者: coolwulf

cwcode 是一款終端編碼代理,專為 DeepSeek V4 Pro、Qwen3.6-27B、Kimi、Azure 以及任何兼容 OpenAI 聊天 API 的服務而設計。它使用 Go 語言編寫,運行在終端中,能夠直接編輯真實代碼,並具備自動恢復能力。運行一小時的成本約為 0.40 美元,令牌成本僅為 Claude 的 5%,且第三輪後前綴緩存命中率超過 85%。

cwcode 基於 Bubbletea TUI 構建,支持多種模型配置,包括 DeepSeek(Pro 和 Flash)、Azure OpenAI、Kimi for Coding,以及通過 vLLM/llama.cpp 本地運行的 Qwen3.6-27B。用户可以通過一條斜槓命令在會話中切換配置。它內置了豐富的工具:bash 命令執行、文件編輯、glob 匹配、grep 搜索、網頁抓取、通過 CDP 驅動真實 Chrome 瀏覽器的無頭抓取、子代理、持久化語義記憶存儲、基於內容尋址的檢查點與回滾、計劃/代碼模式切換,以及自主目標循環。工具註冊表僅 600 行代碼,添加新工具只需實現兩個 Go 接口方法。

該代理並非 SaaS 服務,無需賬户,無遙測,無遠程控制。API 密鑰保存在 ~/.cwcode/config.json 中,會話歷史存儲在 ~/.cwcode/sessions/ 下。即使網絡斷開,只要模型端點是本地的,代理就能繼續工作。

其獨特之處在於多項創新技術:哈希錨定編輯——read_file 工具為每行代碼添加 3 字符內容哈希,edit_lines 工具根據哈希驗證修改,避免模型逐字複製,使 V4 Pro 上每次會話的輸出令牌減少 30-40%;粘性前綴緩存——系統提示跨輪保持字節穩定,工具定義確定順序,默認從所有提供商的出站請求中剝離推理內容,DeepSeek 的提示緩存命中路徑比未命中便宜約 120 倍,第三輪後命中率常超 85%。

計劃與代碼模式通過 Shift+Tab 切換,前者僅允許只讀工具,後者開啓全部執行。模型無法察覺切換,人類始終掌握最終控制權,除非啓用 YOLO 模式。檢查點與回滾功能在執行文件修改前自動快照受影響的文件,基於 SHA-256 去重存儲,/rewind N 可恢復文件並回退對話歷史。風暴破壞者機制在相同工具連續失敗三次時,會生成自然語言解釋並追加到歷史中,而非靜默終止。自主目標循環通過 /goal 添加任務,/goal on 啓動自動循環,最多連續執行 20 輪,適用於四小時的通宵運行。

配置和會話均為 JSON 格式,檢查點為內容尋址塊,記憶存儲使用 SQLite 文件,所有數據位於 ~/.cwcode/ 目錄下,項目停止維護會話仍可讀取。安裝簡單:從 Google Drive 下載預編譯二進制文件,配置 ~/.cwcode/config.json 中的 API 端點,即可運行。

cwcode 提供豐富的內置工具,包括 bash(需批准)、bash_background(需批准)、read_file(無需批准)、write_file(需批准)、edit_file(需批准)、edit_files(需批准)、edit_lines(需批准)、glob(無需)、grep(無需)、ls(無需)、web_fetch(無需)、chrome_fetch(需批准)、task(需批准)、remember(無需)、recall(無需)、todo_write(無需)等。

FAQ 部分解釋了選擇 Go 的原因(單一靜態二進制、啓動快、易交叉編譯)、為何是終端應用而非 VS Code 擴展(讓代理成為主要界面)、與 Claude 的兼容性(不支持直接,需翻譯代理)、日常使用模型(DeepSeek V4 Pro 為主,本地 Qwen3.6-27B 用於低延遲),以及源代碼目前私有但計劃開源。該項目由一個小團隊開發,用於劑量預測模型訓練、金融研究代理和編寫 cwcode 本身。