Claude模型路由

低风险

作者 @sickn33已验证来源

4.1546 次安装v1.0.0更新于 2026年5月25日

使用方式

在 Claude Code 中运行以下命令

第一步：添加 Marketplace

/plugin marketplace add sickn33/antigravity-awesome-skills

第二步：安装插件

/plugin install antigravity-awesome-skills@antigravity-awesome-skills

关于

Claude Code 的测量驱动模型路由器。按任务类别路由 Haiku/Sonnet/Opus，记录每次路由任务，优化 Token 使用成本。

name: tokenwise description: "Claude Code的测量驱动模型路由器。按任务类别路由Haiku/Sonnet/Opus，记录每个路由任务的实际费用，并在信任节省前进行A/B测试。" category: developer-tools risk: critical source: community source_repo: CodeShuX/tokenwise date_added: "2026-05-12" author: CodeShuX tags: [model-routing, token-optimization, cost-reduction, anthropic, haiku, sonnet, opus, claude-code, ab-testing, measurement] tools: [claude] license: "MIT"

TokenWise — 测量驱动模型路由器

概述

一个Claude Code技能，自动将子任务路由到能处理它们的最便宜模型（Haiku处理机械工作，Sonnet处理范围推理，Opus仅用于综合），然后将每个路由任务记录到本地NDJSON文件中，包含真实token和费用数据。包含A/B测试子命令，在多个层级运行相同任务并评分质量，使路由决策基于用户真实工作负载验证。

Anthropic的bug追踪器（Issue #27665）报告93.8%的Max订阅者Claude Code token流向Opus。现有路由器要么静态固定模型，要么基于无测量的启发式路由。TokenWise填补了测量空白。

何时使用

在不牺牲输出质量的情况下削减Claude Code token支出
验证Haiku/Sonnet对特定任务类别是否"足够好"
审计Opus token实际消耗在哪里
记录每会话费用数据用于财务或计费

子命令

/tokenwise:install — 引导式安装器，含diff预览、自动备份和 --dry-run 模式
/tokenwise:report — 每会话token+费用摘要 vs 全Opus基线
/tokenwise:summary [--week|--month|--all] — 历史聚合含趋势
/tokenwise:ab "<task>" — 在多个层级A/B测试同一任务，生成markdown对比
/tokenwise:undo — 从备份恢复CLAUDE.md/settings.json

路由分类

| 层级 | 模型 | 任务类别 | |------|------|----------| | 机械 | Haiku 4.5 | 文件读取、grep、格式化、重命名、简单编辑、文档查找 | | 范围推理 | Sonnet 4.6 | 单文件重构、范围研究、测试编写 | | 综合 | Opus 4.7 | 架构决策、多文件重构、安全审查 |

安全上限：

Haiku永不生成子代理
最大生成深度 = 2
需要更智能模型的子代理返回父级——不自行升级
100字符以下无文件上下文的任务内联运行
子代理上下文>30k token时升一层

隐私

零遥测。所有日志在项目本地的 .tokenwise/log.ndjson 中。任务描述截断到80字符并在记录前剥离文件内容。源代码中不存在分析端点。

安装

在任何Claude Code会话中：

/plugin marketplace add CodeShuX/tokenwise
/plugin install tokenwise@tokenwise

然后运行 /tokenwise:install 并按引导操作。

限制

Token计数与Anthropic计费相比约±2%
A/B测试模式消耗额外token（一个任务×N层级）——有意的一次性验证
仅限Anthropic设计（跨供应商使用LiteLLM或OpenRouter）
子代理 model: 参数在某些Claude Code版本上有已知静默失败bug

兼容工具

Claude CodeCursor

Claude模型路由

关于

TokenWise — 测量驱动模型路由器

概述

何时使用

子命令

路由分类

隐私

安装

限制

兼容工具

标签

相关推荐

RAG系统工程师

批量重构编排

Docx 文档处理

Azure AI Agents Java SDK

Azure Search 文档搜索

Azure AI Agent框架