Question 1

A/B 测试需要的最少流量是多少？

Accepted Answer

这取决于您的基准转化率和最小可检测效应。检测基准率 10% 上 5% 相对提升的典型测试，在 95% 显著性和 80% 功效下，每个变体需要约 30,000 名访客。

Question 2

我可以在一个测试中运行多个变体吗？

Accepted Answer

可以，但每个附加变体需要更多流量。A/B/n 测试比简单 A/B 测试需要明显更多的样本量。考虑多个变体是否真正必要，或者顺序测试是否更实用。

Question 3

我应该什么时候提前停止 A/B 测试？

Accepted Answer

很少。基于查看的早期停止会使统计保证失效。只有在技术失败、严重的护栏违规或您已预注册了具有适当统计校正的自适应设计时才提前停止。

Question 4

什么是护栏指标？

Accepted Answer

护栏指标监控您的测试不会造成伤害。示例包括：每用户收入、页面加载时间、客户支持工单或退订率。如果护栏失败，即使主要指标获胜也不要发布。

Question 5

我应该运行 A/B 测试多长时间？

Accepted Answer

至少运行一个完整业务周期（通常 1-2 周）以考虑工作日/周末变化。始终运行完整的计算样本量，而不是固定的日历持续时间。

Question 6

如果我的测试显示不确定结果怎么办？

Accepted Answer

结果不确定意味着您未检测到统计显著差异。这是宝贵的学习——要么您的效应量小于预期（需要更多流量），要么变更没有效应（考虑更大胆的变更）。

ab-test-setup

测试它