AB测试:基础概念、应用场景及入门指南(ab测试举例)

出境入境2024-03-10 11:51小乐

AB测试:基础概念、应用场景及入门指南(ab测试举例)

小编简介:AB测试技术最早应用于美国的互联网市场,进入国内市场只用了6、7年的时间。 2000年前后,以谷歌为首的互联网公司开始采用AB测试方法,利用数据帮助企业进行决策管理,降低试错成本,促进业务增长。 2010年后,AB测试开始呈现产品化趋势,成为企业决策的重要工具。

今天给大家分享一下AB测试的基础知识。

1.什么是AB测试?互联网行业日新月异,很多产品每周甚至每天都会迭代。无论是产品优化方向还是决策,都需要数据说话。

目前大多数产品迭代方式都是直接向所有用户发布某个版本。一旦遇到线上bug或者数据性能不佳,就必须紧急修复或优化功能,有时甚至需要回滚到之前的版本。

这对用户体验和项目进度都有很大的影响。如何解决这个问题呢?

AB测试可以很好的避免这个问题。所谓AB测试,就是在正式发布之前将用户流量分成几组,让用户分别看到不同的程序设计,并根据几组用户的真实数据反馈来验证数据效果。

如果新版本数据没有问题,可以考虑向所有用户发布新版本,这样可以有效降低所有在线用户发生意外的概率,提高用户体验。简单理解,其实就是初中的对照实验。一组是对照组,另一组是实验组。

哪些场景更适合AB测试?

2、AB测试的应用场景AB测试通常用于以下场景:

1.UI优化这是一个比较常见的场景。

与功能设计不同的是,它有很多逻辑思想,往往可以确定哪个解决方案是好的,哪个解决方案是坏的。 UI优化往往非常“艺术”。在看到真实的数据之前,往往任何人都很难解释哪种设计能够带来更好的数据效果。如下所示:

上图显示了颜色变化。这种情况下,通过AB测试来完成最终的解决方案是比较合适的。

2、文案改动其实和UI层面的优化非常相似。 [立即申请] 或[立即申请] 是同一个按钮吗?

如何决策,就交给AB测试吧~

3、页面布局页面布局主要是指同一页面上不同元素的排列方式。

4.算法优化算法优化也应该是AB测试的一个重要场景。

上线之前的算法基本上都是根据历史数据来训练和构建的。本地模型再好,上线后也未必表现良好。只有在线才是检验算法有效性的决定性标准。

但上线后的效果谁也不敢保证吧?这时候,做一些小流量的AB测试是一个非常好的、万能的选择。

3. 流量分配还讨论了AB 测试的基本概念。最重要的概念之一是用户流量分组。实际实现时,允许用户按照一定的规则随机访问某个版本。那么流量应该如何分配呢?

关于流量分配,主要有两点:同层互斥分配和分层流量正交。

1.同层的互斥分配。每层拥有所有流量。在同一层中,多个实验共享100%的流量,实验之间的流量互斥。例如,在同一层中,测试1占用了40%的流量,测试2最多只能使用60%的流量,以此类推。

有如下示意图:

同时运行多个实验时,如果希望测试结果尽可能准确,并保证实验互不干扰,建议将实验建立在同一层,且同一用户这一层只输入一个实验。

2.分层流量的正交分层意味着重用用户流量。如果测试1 和测试2 使用不同的层,则测试1 和测试2 都可以分配最多100% 的流量。在这种情况下,同一用户将同时进入试验1 和试验2。

当两次测试处于不同级别时,需要保证测试内容互不相关,否则测试数据会受到干扰。

当前平台中的每个实验都是一个独立的实验层。当一段流量经过每一层实验时,会被随机打散重组,保证每一层的流量相同。

例如:假设我现在有两个实验。实验A(实验组标记为版本A1,对照组标记为版本A2)分布在实验层1,占用该层流量的100%;实验B(实验组标记为版本A2)为B1,对照组标记为B2)分布在实验层2,也使用了该层100%的流量(需要注意的是,实验组Layer 1和实验Layer 2实际上是同一批用户,实验Layer 2只是复用了实验Layer 1流量)。

如果将A1组的流量分成两半,一部分放入B1组,另一部分放入B2组; A2组的流量也被分成两半,一部分放入B1组,另一部分放入B2组。那么两个实验的流量调用就会如下图所示。此时,实验A和实验B之间的流量是“正交”的。

关于AB测试,今天先分享这些。下一篇文章将分享业界对AB测试系统的调查,看看各大厂商如何将AB测试商业化。

本文最初由@冬至发表在《人人都是产品经理》上。未经作者许可禁止转载。

题图来自Unsplash,基于CC0许可证。

猜你喜欢