
关于
将人工编写的 CLAUDE.md 转换为 AI 原生结构化标签格式。经过 4 个模型实战验证。相同规则,更少 Token,更高合规率。
name: ai-md description: "将人类编写的 CLAUDE.md 转换为 AI 原生结构化标签格式。经过 4 个模型的实战验证。相同规则,更少 token,更高合规性。" risk: safe source: community date_added: "2026-03-11"
AI.MD v4 — 完整的 AI 原生转换系统
适用场景
- 当你的 CLAUDE.md 很长但 AI 仍然忽略你的规则时使用
- 当 token 使用量因冗长的系统指令而过高时使用
- 当你想优化任何 LLM 系统提示以提高合规性时使用
- 当在 AI 工具之间迁移规则时使用(Claude、Codex、Gemini、Grok)
什么是 AI.MD?
AI.MD 是一种方法论,用于将人类编写的 CLAUDE.md(或任何 LLM 系统指令)转换为结构化标签格式,使 AI 模型更可靠地遵循,同时使用更少的 token。
我们证明的悖论: 用自然语言添加更多规则会降低合规性。将相同规则转换为结构化格式会恢复并超越合规性。
Human prose (6 rules, 1 line) → AI follows 4 of them
Structured labels (6 rules, 6 lines) → AI follows all 6
Same content. Different format. Different results.
为什么有效:LLM 实际如何处理指令
LLM 不是"阅读" — 它们是注意。理解这一点会改变一切。
机制 1:注意力分散
当多条规则共享一行时,模型的注意力均匀分布在所有 token 上。每条规则只获得注意力权重的一小部分。某些规则会丢失。
当每条规则有自己的行时,模型将其作为独立单元处理。每条规则获得完整的注意力权重。
# ONE LINE = attention splits 5 ways (some rules drop to near-zero weight)
EVIDENCE: no-fabricate no-guess | 禁用詞:應該是/可能是 → 先拿數據 | Read/Grep→行號 curl→數據 | "好像"/"覺得"→自己先跑test | guess=shame-wall
# FIVE LINES = each rule gets full attention
EVIDENCE:
core: no-fabricate | no-guess | unsure=say-so
banned: 應該是/可能是/感覺是/推測 → 先拿數據
proof: all-claims-need(data/line#/source) | Read/Grep→行號 | curl→數據
hear-doubt: "好像"/"覺得" → self-test(curl/benchmark) → 禁反問user
violation: guess → shame-wall
机制 2:零推理标签
自然语言迫使模型从上下文中推断含义。标签明确声明含义。无需推理 = 无误解。
# AI must infer: what does (防搞混) modify? what does 例外 apply to?
GATE-1: 收到任務→先用一句話複述(防搞混)(長對話中每個新任務都重新觸發) | 例外: signals命中「處理一下」=直接執行
# AI reads labels directly: trigger→action→exception. Zero ambiguity.
GATE-1 複述:
trigger: new-task
action: first-sentence="你要我做的是___"
persist: 長對話中每個新任務都重新觸發
exception: signal=處理一下 → skip
yields-to: GATE-3
关键洞察:像 trigger: action: exception: 这样的标签跨所有语言通用。模型不需要解析中文/日文/英文语法来理解结构。标签是人类和 AI 之间的通用语言。
机制 3:语义锚定
带标签的子项创建可匹配的标记。当用户输入包含关键词时,模型直接将其匹配到对应标签 — 像哈希表查找而非全文搜索。
# BURIED: AI scans the whole sentence, might miss the connection
加新功能→第一句問schema | 新增API/endpoint=必確認health-check.py覆蓋
# ANCHORED: label "new-api:" directly matches user saying "加個 API"
MOAT:
new-feature: 第一句問schema/契約/關聯
new-api: 必確認health-check.py覆蓋(GATE-5)
真实证据: 这个特定技术修复了一个在所有模型上连续失败 5 次的测试用例。标签 new-api: 使 Codex T5 在第一次尝试时从 ❌ 变为 ✅。
转换过程:当你给我一个 CLAUDE.md 时会发生什么
以下是我将自然语言指令转换为 AI.MD 格式时使用的确切心智模型。
阶段 1:理解 — 像编译器一样阅读,而非像人类
我阅读 CLAUDE.md 就像在构建状态机,而非阅读文档。
对于每个句子,我问:
- 这是触发器吗?(什么输入激活此行为?)
- 这是动作吗?(AI 应该做什么?)
- 这是约束吗?(AI 不应该做什么?)
- 这是元数据吗?(优先级、时机、持久性、例外?)
- 这是人类解释吗?(规则存在的原因 — 删除这个)
示例分析:
Input: "收到任務→先用一句話複述(防搞混)(長對話中每個新任務都重新觸發) | 例外: signals命中「處理一下」=直接執行"
Decomposition:
├─ TRIGGER: "收到任務" → new-task
├─ ACTION: "先用一句話複述" → first-sentence="你要我做的是___"
├─ DELETE: "(防搞混)" → human motivation, AI doesn't need this
├─ METADATA: "(長對話中每個新任務都重新觸發)" → persist: every-new-task
└─ EXCEPTION: "例外: signals命中「處理一下」=直接執行" → exception: signal=處理一下 → skip
阶段 2:分解 — 将每个 | 和 () 拆分为原子规则
合规失败的第一大来源是复合规则。一行中用 | 分隔的 3 条规则对 AI 来说看起来像 1 条指令。它需要是 3 条独立的指令。
拆分测试: 如果你可以在句子的两个部分之间放"AND",它们就是独立的规则,必须在独立的行上。