
关于
可视化技能、规则和代理定义是否被实际遵循——自动生成 3 个提示严格度级别的场景,运行代理,分类行为序列,并报告合规率和完整工具调用时间线。
name: skill-comply description: 可视化技能、规则和代理定义是否被实际遵循——自动生成 3 个提示严格级别的场景,运行代理,分类行为序列,并报告合规率及完整工具调用时间线 origin: ECC tools: Read, Bash
skill-comply:自动化合规测量
通过以下方式测量编码代理是否实际遵循技能、规则或代理定义:
- 从任何 .md 文件自动生成预期行为序列(规范)
- 自动生成递减提示严格度的场景(支持性 → 中性 → 竞争性)
- 运行
claude -p并通过 stream-json 捕获工具调用跟踪 - 使用 LLM(非正则表达式)将工具调用与规范步骤进行分类
- 确定性地检查时间顺序
- 生成包含规范、提示和时间线的自包含报告
支持的目标
- 技能(
skills/*/SKILL.md):工作流技能,如搜索优先、TDD 指南 - 规则(
rules/common/*.md):强制规则,如 testing.md、security.md、git-workflow.md - 代理定义(
agents/*.md):代理是否在预期时被调用(内部工作流验证尚不支持)
激活时机
- 用户运行
/skill-comply <path> - 用户询问"这个规则是否真的被遵循?"
- 添加新规则/技能后,验证代理合规性
- 作为质量维护的定期检查
用法
# 完整运行
uv run python -m scripts.run ~/.claude/rules/common/testing.md
# 试运行(无成本,仅规范 + 场景)
uv run python -m scripts.run --dry-run ~/.claude/skills/search-first/SKILL.md
# 自定义模型
uv run python -m scripts.run --gen-model haiku --model sonnet <path>
核心概念:提示独立性
测量技能/规则是否在提示没有明确支持的情况下仍被遵循。
报告内容
报告是自包含的,包括:
- 预期行为序列(自动生成的规范)
- 场景提示(每个严格级别下的请求内容)
- 每个场景的合规分数
- 带有 LLM 分类标签的工具调用时间线
高级(可选)
对于熟悉钩子的用户,报告还包括对低合规步骤的钩子提升建议。这是信息性的——主要价值在于合规可见性本身。
兼容工具
Claude CodeCursor
标签
AI与机器学习
