智慧模型路由:直接整合於Claude、Codex和Cursor的模型路由工具
Weave Router是一個開源的智慧模型路由工具,可自動為每次請求選擇最佳AI模型,支援多種API格式,能降低40-70%的成本。
Weave Router是一款開源的智慧模型路由工具,專為AI代理系統設計。它能夠自動為每次請求選擇最合適的AI模型,從而在保證效能的同時大幅降低成本。其核心基於Avengers-Pro 2叢集評分器,能夠根據請求內容即時路由到最佳模型,路由決策時間小於50毫秒。
該工具在API相容性方面表現出色,支援Anthropic Messages、OpenAI Chat Completions和Gemini原生API,同時相容DeepSeek、Kimi、GLM、Qwen、Llama、Mistral等開源模型。使用者只需修改端點即可無縫切換到Weave Router,無需更改現有程式碼。
Weave Router的安裝極為簡便。推薦的方式是透過npx一鍵安裝:執行npx @workweave/router即可引導使用者選擇工具(Claude Code、Codex或opencode),並自動配置路由金鑰。使用者也可以選擇自託管部署,只需設定環境變數、啟動Postgres和路由器即可。
該工具直接整合於主流AI程式設計工具中。對於Claude Code,可透過make install-cc或npx命令配置;對於Codex CLI,npx @workweave/router --codex會自動修改配置檔案;對於opencode,透過類似命令即可啟用。此外,Cursor也支援手動配置。Weave Router還提供開關切換功能,方便使用者快速切換路由狀態。
安全方面,Weave Router採用BYOK(自帶金鑰)模式,提供商金鑰加密儲存在使用者本地,確保資料安全。同時,它內建OTLP追蹤支援,使用者可透過Weave儀表盤或Honeycomb、Datadog等工具觀察路由決策和效能指標。
根據官方資料,使用Weave Router可節省40%到70%的API呼叫成本。專案未來計劃包括令牌感知速率限制、子安裝層級、投機排程和尾部延遲最佳化等功能。Weave Router已在GitHub上開源,並歡迎社群貢獻。