AI News HubLIVE
站內改寫1 分鐘閱讀

智能模型路由:直接集成於Claude、Codex和Cursor的模型路由工具

Weave Router是一個開源的智能模型路由工具,可自動為每次請求選擇最佳AI模型,支持多種API格式,能降低40-70%的成本。

來源Hacker News AI作者: adchurch

Weave Router是一款開源的智能模型路由工具,專為AI代理系統設計。它能夠自動為每次請求選擇最合適的AI模型,從而在保證性能的同時大幅降低成本。其核心基於Avengers-Pro 2集羣評分器,能夠根據請求內容實時路由到最佳模型,路由決策時間小於50毫秒。

該工具在API兼容性方面表現出色,支持Anthropic Messages、OpenAI Chat Completions和Gemini原生API,同時兼容DeepSeek、Kimi、GLM、Qwen、Llama、Mistral等開源模型。用户只需修改端點即可無縫切換到Weave Router,無需更改現有代碼。

Weave Router的安裝極為簡便。推薦的方式是通過npx一鍵安裝:運行npx @workweave/router即可引導用户選擇工具(Claude Code、Codex或opencode),並自動配置路由密鑰。用户也可以選擇自託管部署,只需設置環境變量、啓動Postgres和路由器即可。

該工具直接集成於主流AI編程工具中。對於Claude Code,可通過make install-cc或npx命令配置;對於Codex CLI,npx @workweave/router --codex會自動修改配置文件;對於opencode,通過類似命令即可啓用。此外,Cursor也支持手動配置。Weave Router還提供開關切換功能,方便用户快速切換路由狀態。

安全方面,Weave Router採用BYOK(自帶密鑰)模式,提供商密鑰加密存儲在用户本地,確保數據安全。同時,它內置OTLP追蹤支持,用户可通過Weave儀表盤或Honeycomb、Datadog等工具觀察路由決策和性能指標。

根據官方數據,使用Weave Router可節省40%到70%的API調用成本。項目未來計劃包括令牌感知速率限制、子安裝層級、投機調度和尾部延遲優化等功能。Weave Router已在GitHub上開源,並歡迎社區貢獻。