AB Testing在软体工程领域是一个耳熟能详的词,大家都知道AB Test的重要性。当产品经理提出的需求不合里(太难做)时,程序员们心理总是os,你怎么知道客户到底要什么,不也是拍脑袋想的吗,这时候我们可能会提出另一种作法,并要求他(她)去做一个AB Test来验证哪一个作法更好。
但是,大家可能不知道,要做一个成功的AB Test实验,它背后的成本是非常巨大的。首先,你必须做许多的分析,了解用户习惯与需求,然后做出合理的假设并决定变数(variation),接著,需要工程部门协助将AB Test进行实作并采集相关数据,有了数据之后,产品经理需要根据假设建立模型来验证假设,不断迭代最后获得一个结论。这个成本在B2B中尤其庞大,影响因素非常的多,包含取样率、用户特性等,这也使得许多B2B领域的产品经理对AB Test望而怯步。
那么,到底在B2B领域中要不要做AB Test呢?本篇大哉问就要带大家来探讨下这个问题了!

什么是AB Test

在开始大哉问之前,想先跟大家科普一下何谓AB Test,也让我们在后续讨论时能有更多的共鸣。
AB Test是一种以统计为导向的测试方法,在一个页面中,针对某一场景进行两种或以上的假设,并在同一时间内对不同的用户进行测试,以观察用户的反应。

AB Test通常包含以下的流程:

首先,在进行AB测试之前,产品经理需要先针对场景进行研究,并建立假说。接著,从假说当中归纳出变数,来决定实验如何进行,有了这些前置步骤后,就能进入到真正的测试环节,将两种假说实现到产品当中并投放给不同的人群进行使用以蒐集数据。最后,产品经理需要针对这些反馈数据进行分析,以获得实验结果并确立方案。
我们用几个真实的案例来描述一个AB Test是如何进行的。

真实案例:form表单设计

第一个案例是某云计算产品相关公司的报价单产生系统。产品经理在设计阶段调研了自家产品目前用户的报价习惯与流量,归纳出了A与B两种报价单的设计假说。其中A版本是一份详细的报价单,里面涉及了详细的配置与规格,设计上给人一种专业感,没有过多的点缀。B版本是一份看起来比较平易近人的报价单,需要填写的资料相对较少。这两种设计分别表示了两种假设,第一种假设是一份详细的报价单能凸显专业度,使用户相信专业并愿意来填写报价单,另一个则假设简单的填写表格能让用户更有意愿来填写。在变数上,包含了填写的难易程度、美观性、提交按钮的显易程度等等。
经过假说与变量控制后,最后落地的就是上图两个版本的表单,产品经理分别在同一时间对不同用户投放并蒐集数据。经过持续观察语分析,最后B表单胜出,流量差距高达385%。证明了平易近人的表单设计更受用户喜爱。

真实案例:DHL折扣广告

第二个案例是国际知名快递公司DHL的折扣广告。产品经理在设计广告时设立了两个假说,女性的广告代言人更加吸引民众的目光,以及,男性的广告代言人更加吸引民众的目光。因此,这里的变量就很明显,角色的性别对流量的影响。经过投放测试后发现,女性的广告代言人更加的吸引人,转化率比男性代言人高了8个百分比,说明对民众来说,女性代言人更具亲和力且更愿意点击购买,是不是很有趣?

可以把B2C领域的经验直接套用到B2B领域吗?

答案是不行的,两个领域特性相差太大。如同前面所说的,一个成功的AB Test大概会经历几个阶段。包含研究、建立假说、建立与执行实验、评估结果并验证假说等。

在实验过程中,实验结果通常有两种可能,第一是实验结果具有强有力的统计论证以证明假说的正确性,二是实验结果不具有足以证明假说的证据(在AB Test中这很常发生)。如果你的实验具有强有力的证据支撑每一个假说并且实验的过程是很快的,那么这样的AB Test将会非常有效率。在B2C场景中,假说相对容易形成,因为数据量大,所蒐集的数据具备统计意义,更方便产品经理形成假说,也因此做AB Test相对来说更有效率。然而,在B2B领域中就不是这么一回事了。因为B2B的客户面相的是公司,在取样率上远远比不上C端用户,这也导致B2B领域的统计特性薄弱,假说也相对难以形成。
另一个不行的原因在于流量。在B2C领域中,流量与收益常常是成正比关系,越多的流量就能带来越多的收益,因此在进行变量控制时,流量总是会随机地分配到一个或数个变量当中。然而,在B2B领域中,流量不全然正比于收益,访问B2B网站的用户中,可能很大一部分是游客,他们可能是透过广告或搜索进到网页当中进行调研。他们并不会花钱,因为他们可能只是企业员工的一员,没有决定采购的权力。这使得许多在B2C领域中已经耳熟能详的决策模型变得毫无用武之地。

AB Test在B2B领域中的挑战

B2B领域的产品经理们现在面临了三个AB Test的挑战:

  1. 难以制定最佳的KPI指标
  2. 需要大量的资源来进行AB Test
  3. 需要很长的时间才能得到结果

1. 难以制定最佳的KPI指标

在B2B场景中,我们所关注并且希望达到的结果往往是收入。理想上,我们在做实验时,应以收入为主要考量因子。在实际场景中,许多的B2B产品经理会将目标细化成使用潜在客户的转化率(如中长尾客户)、渠道机会(如客户合作等)与市场影响收入(如产品市场占有额)等评估目标,在SaaS中,可能会以LTV(生命周期总价值)作为主要的衡量指标。 
如果你没办法测量这些指标,那就意味著你没办法最佳化它。现在市面上大多数的AB Test工具都是针B2C场景,这意味著你没办法直接套用这些工具,因为他们所使用的量测指标没办法满足B2B的场景。

2. 需要大量的资源来进行AB Test

假设我们要做一场最节省成本的AB Test实验,那我们至少需要UED相关的设计师、前端开发工程师与数据分析工程师投入到这场实验当中。投入的时间也不是短暂的(一两个礼拜),因为一场成功的实验,必须长时间的观察以获取有效的样本数及避免落入「錯誤测试」当中。在B2C领域中,测试的时间相对较短,因为样本数可以很容易地被满足,同时取样本身基本符合常态分布。但在B2B领域中测试的时间相对会被拉长,除了样本数的原因外,另一个重要因素是取样偏差,因为在B2B领域中可能大多数的流量皆是访客,只有少部分人能成为真正带来收益的用户。因此,同样的人力资源在B2B的实验场中需要停留的时间就更久,需要分析的数据也更加复杂且可能无意义。

3. 需要很长的时间才能得到结果

如同2中所述,在B2B领域中因为样本数不足与样本偏差问题,会导致整体实验时间被拉长。然而,耗费的时间可能还不止于此。一般来说,AB Test是一个周期性并且迭代的一个过程,因为我们需要根据实验的结果来修正假说或重新定义变数,这会使得本来花费时间就长的实验变本加厉。也因此要获得结果的时间会比B2C领域长的更多。

那B2B领域还需要做AB Test吗?

看了上面那么多的挑战,我们还需要在B2B领域中做AB Test吗?我的答案是肯定的。因为AB Test所能带来的收益也是巨大的。我认为的优点:

1. AB Test可以帮助B2B产品更好的获得业务反馈

B2B产品虽然在用户体系上与B2C产品截然不同(客户不一定是用户),然而,我们依然可以透过服务好用户来影响客户的方式,来间接的增加收益。因此,怎么从AB Test当中获取用户的反馈来改进产品是很重要的。

2. AB Test可以帮助B2B产品增加流量

流量虽然在B2B产品中不是主要的衡量指标(因为与收益不一定成正比),然而,它的边际效益却能间接的达成收益的目的。例如上面所提到的市场影响收入、渠道机会等等。因此,透过AB Test,我们可以更好地改善产品来提升流量以达成收益的目的。

3. AB Test可以帮助B2B产品更好的探索市场

有时候,我们会有许多的新需求与新想法,但我们却不知道市场能不能接受它,这时候就能发挥AB Test真正的价值。

4. AB Test可以帮助B2B产品更好地增进用户体验

如上所述,用户与客户虽然在B2B场景中不是同一个人,但是有时候我们可以透过服务好用户来进阶的影响客户决策。例如在Dataworks产品中,良好的一个编辑体验与产品流程可以增加用户的工作效率,并间接的影响客户对Dataworks产品的评价。

5. AB Test可以帮助B2B产品渐进的来迭代产品

透过AB Test,我们可以了解用户对新功能或新版本的反馈,进而增进产品进行优化与迭代。

虽然在B2B领域中AB Test的成本相对来说高很多,但它的优势却是无法取代的!

怎么用正确的方式在B2B领域中做AB Test?

这里总结了几个在B2B领域中做AB Test的一些技巧。

1. 应该将重点放在大的变化上而不是小的细节中

为什么将重点放在大的变化上?一般来说,AB Test是一种统计学的实验方式,并且像其他的统计实验一样,它的可信度取决于样本数的多寡。什么叫做足够的样本数取决于以下三个因素:

  • 基础转化率
  • 欲达到的转化率提升情况
  • 信赖区间

一般情况下,我们在做AB Test时会以95%来做为信赖区间,这也意味著有5%的情况会发生例外的情况。这也表示,当我们有足够多的样本数时,例外发生的可能性也越低。
根据一份报告指出,若我们希望在2%的基础转化率下再增加10%,那我们至少需要39488份样本数才能达到95%的信赖区间; 同样地,若我们希望在2%的基础转化率上再增加50%,则只需要1871个样本数就能达到95%信赖区间。这之间差了21倍的样本数。因此,越大的转化率提升可以减少所需要的样本数

因为这些原因,B2B产品应该考虑在一些大的改变上进行AB Test,而不是一些小的改动,例如按钮的颜色变化、或是增加一段注释文字等。

例如上图,根据AB 测试,版本B的转化率提升了整整1.07倍,像这样的测试基本上不需要太多的样本数就能够达到统计学上的意义。

2. 从个性化开始

「大的变化」的其中关键一点是从买家个性化订制开始。
多数的B2B网站应该为不同的买方提供一些个性化订制的维度。一般AB Test的变数考量可以从端客户、领域别或是商业模式来著手。
举个例子,在某一个专业软件网站中便用了个性化试验。试验中他们使用考量了三个主要的领域客户:医疗、教育与金融。在分桶上,有50%的用户分配到了个性化页面,另外50%的用户则维持原来标准的页面。最后实验发现:

  • 透过个性化推荐的方式使业务增长了7%
  • 个性化推荐的首页增加了30%的点击率
  • 个性化推荐的页面增加了10%的PV
  • 周期同比增加了4%的业绩

个性化订制的收益不言而喻。

3. 用正确的工具做正确的事

在选择工具时,我们应该正视到一点,我们做的是B2B业务而非B2C业务。若依然按照B2C的方式来做测试
只会徒劳无功。
现今市面上许多的AB Test产品多半面向的是B2C的场景。虽然测试的方法与理论并无差别,但在实验变量与衡量实验结果的方法上却天差地别,造成这个情况的主要原因有:

  • 实验样本数的差异
  • 实验周期长短的差异
  • 实验结果解读的差异

在B2B当中,因为天生的样本数劣势,导致我们做起事来碍手碍脚的。为了弥补短版,我们应该选择一个合适的工具,这个工具能够提供我们合适的算法来解读实验结果,例如一些不需要大量样本数的统计学方法。另外,能够为B2B场景提供更多的实验变数。

结语

AB Test在B2B场景中虽然充满挑战,但我认为仍有做的必要,因为它带来的效益是没有其他方法能够取代的。为了更舒适的在B2B场景中进行AB Test,我们应该将重点放在大的变化上,使测试结果更具意义且节省成本开销,此外,我们应该从个性化开始,为不同的客户「定制化」他的网页。最后,我们应该选用正确的工具来进行AB Test。

原文链接
本文为阿里云原创内容,未经允许不得转载。

2020-08-24相关推荐

  1. (十三:2020.08.28)CVPR 2015 追踪之论文纲要(译)

    CVPR 2020 追踪之论文纲要(修正于2020.08.27) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...

  2. (十一:2020.08.28)CVPR 2017 追踪之论文纲要(译)

    CVPR 2017 追踪之论文纲要(修正于2020.08.28) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...

  3. (十四:2020.08.28)CVPR 2014 追踪之论文纲要(译)

    CVPR 2020 追踪之论文纲要(修正于2020.08.28) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...

  4. (九:2020.08.27)CVPR 2019 追踪之论文纲要(译)

    CVPR 2019 追踪之论文纲要(修正于2020.08.28) 讲在前面 论文目录 讲在前面 论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...

  5. python win7 64位 2020_Windows7 64位 2020第三版(2020.08.20)目前最完美支持Windows7的系统!!!...

    此系统基于微软Windows7  SP1原版制作.全程离线!安装最新补丁,仅做了适量精简保证稳定运行!此次分离出Windows7 64位单次下载大小已经缩小! ## 1.保留打印机驱动. 2.默认开启 ...

  6. 【2020/6/24整理版】利用csi tool获取csi数据并进行数据解析----适合初学的小白

    1.准备工作 <1> 查看自己电脑是否能安装Intel 5300网卡,不能安装的话直接看文章最后,尝试Atheros csi tool工具. <2> 安装Ubuntu系统,cs ...

  7. 纪中在家培训总结(2020.2.1~2020.2.24)

    前言 因为新型冠状病毒(疫情情况)的原因,纪中培训改为在家培训,一天的进度变成了两天甚至三天的进度QAQ,但我还是想说:武汉加油!中国加油! 这次培训总结没啥好写,请勿嘲讽 正文 Day 0(2020 ...

  8. 2012~2020年期货全品种TICK数据共享更新至2020.7.24

    VNPY官网 http://www.vnpy.cn 2020.6.10~2020.7.24 期货全市场行情数据 链接:https://pan.baidu.com/s/1AUIMnJFH1SmIdngA ...

  9. H5在线CAD,网页CAD,MxDraw云图平台2022.08.24更新

    SDK开发包下载地址: MxDraw云图平台 2022.08.24更新_梦想CAD控件 1. 增加对像扩展数据功能 2. 增加CAD结合GIS使用功能 https://www.mxdraw3d.com ...

  10. PHP面试总结 v2018.08.24

    最近公司业务调整,我不幸要成为失业的一员.最近开始面试,今天面试的时候发现自己的不足,可能是太长时间没面试了(又给自己贴金了),总结下. 面试的态度 匆匆忙忙,赶到面试地点,这个时候前台一般会拿张表格 ...

最新文章

  1. 分段线性插值Python实现(同时估计误差)
  2. 常见的10道Web前端面试题及答案分享!
  3. 关于GiF动图你不知道的9件事
  4. 使用Visio Viewer载入数据库中的Visio图
  5. 日志审计携手DDoS防护助力云上安全
  6. 网络操作系统 第七章 管理TCP/IP网络
  7. Spring AOP 功能使用详解
  8. 当科学家们使用计算机来试图,当科学家们使用计算机来试图预测复杂的--易哈佛考试题库...
  9. 以太坊到底是什么 | 工作原理
  10. 使用Pycharm运行TensorFlow,Virtualenv安装TensorFlow
  11. AIR是什么?.air文件如何打开?flex如何运行air文件
  12. 基于51单片机的数字电压表
  13. c语言sqlist结构体,数据结构的一个题目,有什么问题吗?问什么一直显示Sqlist结构体没定义...
  14. win10家庭版开启组策略方法
  15. 互联网面试六大常见问题及应对技巧,2021不再入坑!
  16. 【云原生|实战研发】2:Pod的深入实践与理解
  17. MAR位数反映存储单元的个数笔记
  18. Flink CDC 新一代数据集成框架
  19. 实验二 SQL 语言——SELECT 查询操作(第一部分)
  20. 如何给sqlserver 的表添加注释

热门文章

  1. php表单提交邮箱_最全实现dede订单表单提交发送到指定邮箱(附前台设置)
  2. 系统相机裁剪比例_拍不出好照片,你缺的不是好手机而是相机设置的秘笈
  3. 不在 sudoers 文件中。此事将被报告_快餐包装中检出致癌物质?麦当劳、汉堡王回应!...
  4. electron增加导航按钮_Electron发布6.0 Released版本
  5. oracle命令行原理,Oracle命令行操作方式
  6. 六西格玛dfss_向六西格玛质量水平进攻!
  7. java包名和类名可以一样吗_Java入门第三课:Java基本语法
  8. vue项目使用大华摄像头怎样初始化_Vue接入监控视频技术总结
  9. 高大上的集团名字_那些刚改了“高大上”名字的学校,你知道都有哪些吗?蜻蜓AI小编来帮你科普一下...
  10. linux 控制终端卡,配置通过串口控制linux操作系统的终端