你用 Claude Code 写代码,每一步都在用 Opus——让最贵的模型帮你搜索文件路径、读 README、处理简单的变量重命名。
这就像出门买包烟,叫了个专机。
Weave Router 在解决这个问题。
它是什么
Weave Router 是一个代理层,插在你的 coding agent(Claude Code、Codex、opencode)和模型之间。
每一条请求进来,它在 50ms 内判断:这个任务,应该用哪个模型?
以下是典型路由示例(实际分配由路由器动态决策,非固定规则):
- 规划复杂修改 → 通常路由到 Opus 4.8(最强,最贵)
- 探索代码库、搜集上下文 → 一般路由到如 DeepSeek V4 Flash 等快速模型
- 执行具体实现 → 通常交给如 GLM 5.2 等较快的模型
- 高质量需求 → GPT 5.5 或 Fable(按需)
你的 coding agent 以为自己在用 Claude Code,实际上背后在动态切换七八个模型。
数字有多吓人
Weave 团队内部跑了一个月,省了 40% 的 token 成本,质量和速度没有明显差异。
官方说法更激进:宣称可以省 40-70%。
这个数字合理吗?基本合理。
Coding agent 的工作流里,大量请求是"读文件"、“搜路径”、“理解上下文”——这些任务根本不需要 Opus 级别的推理能力,用便宜模型完全能搞定。把这部分切掉,省 30-50% 不算夸张。
怎么用
一行命令:
| |
安装程序会问你用哪个 agent(Claude Code、Codex 还是 opencode),然后自动修改对应的配置文件,接管 API 端点。
你原来的工作流完全不变,只是背后的模型调用变聪明了。
想自己托管?也支持:
| |
本地起一个路由服务,数据不出门。
有一件事要说清楚
Weave Router 不是完全开源。
它用的是 Elastic License 2.0(EL2)——源代码可以查看、可以自托管,但不能用来提供竞争性的商业服务。
这是最近几年很流行的"源可见但非开源"协议,HashiCorp(Terraform)、Elastic 都用过这套。
如果你只是自己用,没有任何限制。如果你想基于它做商业产品,要先问清楚。
为什么这是个大事
Coding agent 的成本问题正在从"可以接受"变成"需要认真管理"。
一个中等规模的开发团队,一个月的 Claude Code 账单可能是几千到几万美金。随着 agent 在工作流里用得越来越深,这个数字还会涨。
Weave Router 的思路是:不是让模型变便宜,是让调用变聪明。
这是一个不依赖 OpenAI/Anthropic 降价的独立解法——而且开发者自己可以接入、自己可以控制。
HN 上今天 136 分、86 条评论,反应说明这个痛点确实真实。
一句话
你的 coding agent 不需要每一步都用最贵的模型。现在有工具帮你自动切了。
GitHub:github.com/workweave/router 官网:weaverouter.com 协议:Elastic License 2.0