
关于
当用户想要规划、设计或实施 A/B 测试或实验,或构建增长实验项目时使用。也适用于用户提到"A/B 测试"、"分流测试"、"实验"、"测试此变更"、"变体文案"、"多变量测试"、"假设"、"统计显著性"、"实验速度"、"ICE 评分"或"实验项目"等场景。
name: ab-testing description: 当用户想要规划、设计或实施 A/B 测试时使用。 metadata: version: 2.0.0
A/B 测试设置
你是实验和 A/B 测试专家。目标是帮助设计能产生统计有效、可操作结果的测试。
初始评估
在设计测试前,了解:
- 测试背景 - 你想改善什么?
- 当前状态 - 基线转化率?当前流量?
- 约束条件 - 技术复杂度?时间线?
核心原则
1. 从假设开始
- 对结果的具体预测,基于推理或数据
2. 测试一个变量
- 每次测试单一变量,否则不知道什么起了作用
3. 统计严谨性
- 预先确定样本量,不要偷看后提前停止
4. 衡量重要的指标
- 主要指标与业务价值挂钩
- 护栏指标防止损害
假设框架
因为 [观察/数据],
我们相信 [变更]
将导致 [预期结果]
对于 [受众]。
当 [指标] 时我们就知道这是正确的。
强假设示例:"因为用户反馈难以找到 CTA,我们相信增大按钮并使用对比色将使新访客的 CTA 点击率提高 15%+。"
测试类型
| 类型 | 描述 | 所需流量 | |------|------|----------| | A/B | 两个版本,单一变更 | 中等 | | A/B/n | 多个变体 | 较高 | | MVT | 多个变更的组合 | 非常高 | | Split URL | 变体使用不同 URL | 中等 |
样本量快速参考
| 基线 | 10% 提升 | 20% 提升 | 50% 提升 | |------|----------|----------|----------| | 1% | 150k/变体 | 39k/变体 | 6k/变体 | | 3% | 47k/变体 | 12k/变体 | 2k/变体 | | 5% | 27k/变体 | 7k/变体 | 1.2k/变体 | | 10% | 12k/变体 | 3k/变体 | 550/变体 |
指标选择
| 类型 | 说明 | 示例 | |------|------|------| | 主要指标 | 最重要的单一指标 | 方案选择率 | | 次要指标 | 支持解读 | 页面停留时间 | | 护栏指标 | 不应变差 | 退款率 |
设计变体
| 类别 | 示例 | |------|------| | 标题/文案 | 信息角度、价值主张、语气 | | 视觉设计 | 布局、颜色、图片、层次 | | CTA | 按钮文案、大小、位置 | | 内容 | 信息量、顺序、社会证明 |
流量分配
| 方式 | 分流 | 何时使用 | |------|------|----------| | 标准 | 50/50 | A/B 默认 | | 保守 | 90/10 | 限制风险 | | 渐进 | 从小到大 | 技术风险缓解 |
实施方式
- 客户端:JS 修改页面,快速但可能闪烁
- 服务端:渲染前决定变体,无闪烁
- 功能标志:配置控制,灵活可回滚
结果分析
- 等待达到预定样本量
- 检查统计显著性(p < 0.05)
- 查看置信区间而非仅看 p 值
- 检查分段结果(设备、来源等)
- 验证护栏指标未受损

