AI News HubLIVE
站内改写1 分钟阅读

智能模型路由:直接集成于Claude、Codex和Cursor的模型路由工具

Weave Router是一个开源的智能模型路由工具,可自动为每次请求选择最佳AI模型,支持多种API格式,能降低40-70%的成本。

来源Hacker News AI作者: adchurch

Weave Router是一款开源的智能模型路由工具,专为AI代理系统设计。它能够自动为每次请求选择最合适的AI模型,从而在保证性能的同时大幅降低成本。其核心基于Avengers-Pro 2集群评分器,能够根据请求内容实时路由到最佳模型,路由决策时间小于50毫秒。

该工具在API兼容性方面表现出色,支持Anthropic Messages、OpenAI Chat Completions和Gemini原生API,同时兼容DeepSeek、Kimi、GLM、Qwen、Llama、Mistral等开源模型。用户只需修改端点即可无缝切换到Weave Router,无需更改现有代码。

Weave Router的安装极为简便。推荐的方式是通过npx一键安装:运行npx @workweave/router即可引导用户选择工具(Claude Code、Codex或opencode),并自动配置路由密钥。用户也可以选择自托管部署,只需设置环境变量、启动Postgres和路由器即可。

该工具直接集成于主流AI编程工具中。对于Claude Code,可通过make install-cc或npx命令配置;对于Codex CLI,npx @workweave/router --codex会自动修改配置文件;对于opencode,通过类似命令即可启用。此外,Cursor也支持手动配置。Weave Router还提供开关切换功能,方便用户快速切换路由状态。

安全方面,Weave Router采用BYOK(自带密钥)模式,提供商密钥加密存储在用户本地,确保数据安全。同时,它内置OTLP追踪支持,用户可通过Weave仪表盘或Honeycomb、Datadog等工具观察路由决策和性能指标。

根据官方数据,使用Weave Router可节省40%到70%的API调用成本。项目未来计划包括令牌感知速率限制、子安装层级、投机调度和尾部延迟优化等功能。Weave Router已在GitHub上开源,并欢迎社区贡献。