你用 Claude Code 写代码,每一步都在用 Opus——让最贵的模型帮你搜索文件路径、读 README、处理简单的变量重命名。

这就像出门买包烟,叫了个专机。

Weave Router 在解决这个问题。


它是什么

Weave Router 是一个代理层,插在你的 coding agent(Claude Code、Codex、opencode)和模型之间。

每一条请求进来,它在 50ms 内判断:这个任务,应该用哪个模型?

以下是典型路由示例(实际分配由路由器动态决策,非固定规则):

  • 规划复杂修改 → 通常路由到 Opus 4.8(最强,最贵)
  • 探索代码库、搜集上下文 → 一般路由到如 DeepSeek V4 Flash 等快速模型
  • 执行具体实现 → 通常交给如 GLM 5.2 等较快的模型
  • 高质量需求 → GPT 5.5 或 Fable(按需)

你的 coding agent 以为自己在用 Claude Code,实际上背后在动态切换七八个模型。


数字有多吓人

Weave 团队内部跑了一个月,省了 40% 的 token 成本,质量和速度没有明显差异。

官方说法更激进:宣称可以省 40-70%。

这个数字合理吗?基本合理。

Coding agent 的工作流里,大量请求是"读文件"、“搜路径”、“理解上下文”——这些任务根本不需要 Opus 级别的推理能力,用便宜模型完全能搞定。把这部分切掉,省 30-50% 不算夸张。


怎么用

一行命令:

1
npx @workweave/router

安装程序会问你用哪个 agent(Claude Code、Codex 还是 opencode),然后自动修改对应的配置文件,接管 API 端点。

你原来的工作流完全不变,只是背后的模型调用变聪明了。

想自己托管?也支持:

1
2
echo "OPENROUTER_API_KEY=sk-or-v1-..." >> .env.local
make full-setup

本地起一个路由服务,数据不出门。


有一件事要说清楚

Weave Router 不是完全开源

它用的是 Elastic License 2.0(EL2)——源代码可以查看、可以自托管,但不能用来提供竞争性的商业服务。

这是最近几年很流行的"源可见但非开源"协议,HashiCorp(Terraform)、Elastic 都用过这套。

如果你只是自己用,没有任何限制。如果你想基于它做商业产品,要先问清楚。


为什么这是个大事

Coding agent 的成本问题正在从"可以接受"变成"需要认真管理"。

一个中等规模的开发团队,一个月的 Claude Code 账单可能是几千到几万美金。随着 agent 在工作流里用得越来越深,这个数字还会涨。

Weave Router 的思路是:不是让模型变便宜,是让调用变聪明。

这是一个不依赖 OpenAI/Anthropic 降价的独立解法——而且开发者自己可以接入、自己可以控制。

HN 上今天 136 分、86 条评论,反应说明这个痛点确实真实。


一句话

你的 coding agent 不需要每一步都用最贵的模型。现在有工具帮你自动切了。


GitHub:github.com/workweave/router 官网:weaverouter.com 协议:Elastic License 2.0