AI News HubLIVE
站内改写2 分鐘閱讀

專為本地LLM和DeepSeek v4最佳化的原生編碼代理,具備向量記憶功能

cwcode是一個基於Go語言的終端編碼代理,利用DeepSeek V4 Pro等模型,提供檔案編輯、子代理、語義記憶和自動恢復等功能。它強調低成本(每小時約0.40美元)、高效快取(85%以上命中率),並支援本地模型和多種API。

來源Hacker News AI作者: coolwulf

cwcode 是一款終端編碼代理,專為 DeepSeek V4 Pro、Qwen3.6-27B、Kimi、Azure 以及任何相容 OpenAI 聊天 API 的服務而設計。它使用 Go 語言編寫,執行在終端中,能夠直接編輯真實程式碼,並具備自動恢復能力。執行一小時的成本約為 0.40 美元,令牌成本僅為 Claude 的 5%,且第三輪後字首快取命中率超過 85%。

cwcode 基於 Bubbletea TUI 構建,支援多種模型配置,包括 DeepSeek(Pro 和 Flash)、Azure OpenAI、Kimi for Coding,以及透過 vLLM/llama.cpp 本地執行的 Qwen3.6-27B。使用者可以透過一條斜槓命令在會話中切換配置。它內建了豐富的工具:bash 命令執行、檔案編輯、glob 匹配、grep 搜尋、網頁抓取、透過 CDP 驅動真實 Chrome 瀏覽器的無頭抓取、子代理、持久化語義記憶儲存、基於內容定址的檢查點與回滾、計劃/程式碼模式切換,以及自主目標迴圈。工具登錄檔僅 600 行程式碼,新增新工具只需實現兩個 Go 介面方法。

該代理並非 SaaS 服務,無需賬戶,無遙測,無遠端控制。API 金鑰儲存在 ~/.cwcode/config.json 中,會話歷史儲存在 ~/.cwcode/sessions/ 下。即使網路斷開,只要模型端點是本地的,代理就能繼續工作。

其獨特之處在於多項創新技術:雜湊錨定編輯——read_file 工具為每行程式碼新增 3 字元內容雜湊,edit_lines 工具根據雜湊驗證修改,避免模型逐字複製,使 V4 Pro 上每次會話的輸出令牌減少 30-40%;粘性字首快取——系統提示跨輪保持位元組穩定,工具定義確定順序,預設從所有提供商的出站請求中剝離推理內容,DeepSeek 的提示快取命中路徑比未命中便宜約 120 倍,第三輪後命中率常超 85%。

計劃與程式碼模式透過 Shift+Tab 切換,前者僅允許只讀工具,後者開啟全部執行。模型無法察覺切換,人類始終掌握最終控制權,除非啟用 YOLO 模式。檢查點與回滾功能在執行檔案修改前自動快照受影響的檔案,基於 SHA-256 去重儲存,/rewind N 可恢復檔案並回退對話歷史。風暴破壞者機制在相同工具連續失敗三次時,會生成自然語言解釋並追加到歷史中,而非靜默終止。自主目標迴圈透過 /goal 新增任務,/goal on 啟動自動迴圈,最多連續執行 20 輪,適用於四小時的通宵執行。

配置和會話均為 JSON 格式,檢查點為內容定址塊,記憶儲存使用 SQLite 檔案,所有資料位於 ~/.cwcode/ 目錄下,專案停止維護會話仍可讀取。安裝簡單:從 Google Drive 下載預編譯二進位制檔案,配置 ~/.cwcode/config.json 中的 API 端點,即可執行。

cwcode 提供豐富的內建工具,包括 bash(需批准)、bash_background(需批准)、read_file(無需批准)、write_file(需批准)、edit_file(需批准)、edit_files(需批准)、edit_lines(需批准)、glob(無需)、grep(無需)、ls(無需)、web_fetch(無需)、chrome_fetch(需批准)、task(需批准)、remember(無需)、recall(無需)、todo_write(無需)等。

FAQ 部分解釋了選擇 Go 的原因(單一靜態二進位制、啟動快、易交叉編譯)、為何是終端應用而非 VS Code 擴充套件(讓代理成為主要介面)、與 Claude 的相容性(不支援直接,需翻譯代理)、日常使用模型(DeepSeek V4 Pro 為主,本地 Qwen3.6-27B 用於低延遲),以及原始碼目前私有但計劃開源。該專案由一個小團隊開發,用於劑量預測模型訓練、金融研究代理和編寫 cwcode 本身。