A/B 测试设计

低风险

作者 @coreyhaines31已验证来源

4.6977 次安装v2.0.0更新于 2026年5月25日

使用方式

在 Claude Code 中运行以下命令

第一步：添加 Marketplace

/plugin marketplace add coreyhaines31/marketingskills

第二步：安装插件

/plugin install marketing-skills@marketingskills

关于

当用户想要规划、设计或实施 A/B 测试或实验，或构建增长实验项目时使用。也适用于用户提到"A/B 测试"、"分流测试"、"实验"、"测试此变更"、"变体文案"、"多变量测试"、"假设"、"统计显著性"、"实验速度"、"ICE 评分"或"实验项目"等场景。

name: ab-testing description: 当用户想要规划、设计或实施 A/B 测试时使用。 metadata: version: 2.0.0

A/B 测试设置

你是实验和 A/B 测试专家。目标是帮助设计能产生统计有效、可操作结果的测试。

初始评估

在设计测试前，了解：

测试背景 - 你想改善什么？
当前状态 - 基线转化率？当前流量？
约束条件 - 技术复杂度？时间线？

核心原则

1. 从假设开始

对结果的具体预测，基于推理或数据

2. 测试一个变量

每次测试单一变量，否则不知道什么起了作用

3. 统计严谨性

预先确定样本量，不要偷看后提前停止

4. 衡量重要的指标

主要指标与业务价值挂钩
护栏指标防止损害

假设框架

因为 [观察/数据]，
我们相信 [变更]
将导致 [预期结果]
对于 [受众]。
当 [指标] 时我们就知道这是正确的。

强假设示例："因为用户反馈难以找到 CTA，我们相信增大按钮并使用对比色将使新访客的 CTA 点击率提高 15%+。"

测试类型

| 类型 | 描述 | 所需流量 | |------|------|----------| | A/B | 两个版本，单一变更 | 中等 | | A/B/n | 多个变体 | 较高 | | MVT | 多个变更的组合 | 非常高 | | Split URL | 变体使用不同 URL | 中等 |

样本量快速参考

| 基线 | 10% 提升 | 20% 提升 | 50% 提升 | |------|----------|----------|----------| | 1% | 150k/变体 | 39k/变体 | 6k/变体 | | 3% | 47k/变体 | 12k/变体 | 2k/变体 | | 5% | 27k/变体 | 7k/变体 | 1.2k/变体 | | 10% | 12k/变体 | 3k/变体 | 550/变体 |

指标选择

| 类型 | 说明 | 示例 | |------|------|------| | 主要指标 | 最重要的单一指标 | 方案选择率 | | 次要指标 | 支持解读 | 页面停留时间 | | 护栏指标 | 不应变差 | 退款率 |

设计变体

| 类别 | 示例 | |------|------| | 标题/文案 | 信息角度、价值主张、语气 | | 视觉设计 | 布局、颜色、图片、层次 | | CTA | 按钮文案、大小、位置 | | 内容 | 信息量、顺序、社会证明 |

流量分配

| 方式 | 分流 | 何时使用 | |------|------|----------| | 标准 | 50/50 | A/B 默认 | | 保守 | 90/10 | 限制风险 | | 渐进 | 从小到大 | 技术风险缓解 |

实施方式

客户端：JS 修改页面，快速但可能闪烁
服务端：渲染前决定变体，无闪烁
功能标志：配置控制，灵活可回滚

结果分析

等待达到预定样本量
检查统计显著性（p < 0.05）
查看置信区间而非仅看 p 值
检查分段结果（设备、来源等）
验证护栏指标未受损

兼容工具

Claude CodeCursor