
关于
Claude Code 的测量驱动模型路由器。按任务类别路由 Haiku/Sonnet/Opus,记录每次路由任务,优化 Token 使用成本。
name: tokenwise description: "Claude Code的测量驱动模型路由器。按任务类别路由Haiku/Sonnet/Opus,记录每个路由任务的实际费用,并在信任节省前进行A/B测试。" category: developer-tools risk: critical source: community source_repo: CodeShuX/tokenwise date_added: "2026-05-12" author: CodeShuX tags: [model-routing, token-optimization, cost-reduction, anthropic, haiku, sonnet, opus, claude-code, ab-testing, measurement] tools: [claude] license: "MIT"
TokenWise — 测量驱动模型路由器
概述
一个Claude Code技能,自动将子任务路由到能处理它们的最便宜模型(Haiku处理机械工作,Sonnet处理范围推理,Opus仅用于综合),然后将每个路由任务记录到本地NDJSON文件中,包含真实token和费用数据。包含A/B测试子命令,在多个层级运行相同任务并评分质量,使路由决策基于用户真实工作负载验证。
Anthropic的bug追踪器(Issue #27665)报告93.8%的Max订阅者Claude Code token流向Opus。现有路由器要么静态固定模型,要么基于无测量的启发式路由。TokenWise填补了测量空白。
何时使用
- 在不牺牲输出质量的情况下削减Claude Code token支出
- 验证Haiku/Sonnet对特定任务类别是否"足够好"
- 审计Opus token实际消耗在哪里
- 记录每会话费用数据用于财务或计费
子命令
/tokenwise:install— 引导式安装器,含diff预览、自动备份和--dry-run模式/tokenwise:report— 每会话token+费用摘要 vs 全Opus基线/tokenwise:summary [--week|--month|--all]— 历史聚合含趋势/tokenwise:ab "<task>"— 在多个层级A/B测试同一任务,生成markdown对比/tokenwise:undo— 从备份恢复CLAUDE.md/settings.json
路由分类
| 层级 | 模型 | 任务类别 | |------|------|----------| | 机械 | Haiku 4.5 | 文件读取、grep、格式化、重命名、简单编辑、文档查找 | | 范围推理 | Sonnet 4.6 | 单文件重构、范围研究、测试编写 | | 综合 | Opus 4.7 | 架构决策、多文件重构、安全审查 |
安全上限:
- Haiku永不生成子代理
- 最大生成深度 = 2
- 需要更智能模型的子代理返回父级——不自行升级
- 100字符以下无文件上下文的任务内联运行
- 子代理上下文>30k token时升一层
隐私
零遥测。所有日志在项目本地的 .tokenwise/log.ndjson 中。任务描述截断到80字符并在记录前剥离文件内容。源代码中不存在分析端点。
安装
在任何Claude Code会话中:
/plugin marketplace add CodeShuX/tokenwise
/plugin install tokenwise@tokenwise
然后运行 /tokenwise:install 并按引导操作。
限制
- Token计数与Anthropic计费相比约±2%
- A/B测试模式消耗额外token(一个任务×N层级)——有意的一次性验证
- 仅限Anthropic设计(跨供应商使用LiteLLM或OpenRouter)
- 子代理
model:参数在某些Claude Code版本上有已知静默失败bug
兼容工具
Claude CodeCursor
标签
AI与机器学习