AB测试——流程介绍(定义问题和指标选取)
前言: 作为AB测试的学习记录,本文主要介绍了AB测试的基本流程,以及指标类型和如何选取合适指标。
相关文章:AB测试——原理介绍
AB测试的基本流程是什么?
AB测试(也称为分流测试)是一种常用的实验设计方法,用于比较两种或多种不同的设计或策略,以确定哪种方案更有效。下面是AB测试的一般流程:
- 定义研究问题:确定要测试的问题或假设,并将其转化为可量化的指标。
- 设计测试方案:制定测试方案,包括定义测试组和对照组,确定样本量和测试时长等关键因素。
- 实施测试方案:实施测试方案,包括在测试组和对照组中分别应用不同的方案,并记录结果数据。
- 数据分析:统计分析收集的数据,比较测试组和对照组的差异,并确定哪种方案更有效。
- 结果解释和应用:根据数据分析结果,解释测试结果,并应用于实际业务中。
- 优化改进:根据测试结果和应用效果,进行优化改进,并持续跟踪测试方案的效果。
需要注意的是,AB测试的有效性取决于样本量和测试时长的设计,必须确保样本量足够大,测试时长足够长,才能保证测试结果的可信度和稳定性。此外,测试方案需要避免影响测试结果的偏差和干扰,例如排除不相关因素的影响。
1. 定义研究问题(Problem Statment)
首先,需要明确业务场景的背景现状,和产品经理沟通需要验证的方案是什么,目的是什么。
比如,我们先在需要上线一个新的APP的UI界面,目的为了吸引用户购买,提高用户的成交量。
- 变量/变体:一个新的UI界面
- 实验对象:APP用户
- 目的:提高成交量
通过对问题的分析和理解,实验设计者需要将一个商业问题转换成一个可量化、可通过实验验证的数学问题。
2. 选取指标 (Metrics Selection)
确定好实验的背景和目的,接下来就需要确认需要追踪和验证的数据指标。
2.1 指标的两种分类
对于指标,我们可以有两种分类方法。
按计算方式区分:
第一种按计算方式区分:
- 绝对值指标 : 单一的数值,比如利润总额、销售量、用户在线时间等。
- 相对值指标 :两个有联系的现象数值相比得到的比率。例如用户转化率、ROI等。
按业务特性区分:
第二种是根据各类指标在业务中的分工特性区分:
-
成功指标(Primary/Core/Success Metrics):
- 最核心的度量指标,决定新功能是否有价值、实验是否成功的度量。
- 比如:如果新的UI界面是为了提高用户的体验,那么用户在线时长、日活可以作为关键指标;如果是新的产品推送策略,为了提高销售和利润,那么利润就是最关键的核心指标
-
跟踪指标(Secondary/Tracking metrics):
- 跟踪指标不能直接测量新功能是否有效, 但是能帮助监测新功能是如何影响目标指标。 如果目标指标有异动,跟踪指标可以帮忙分析新功能是如何导致目标指标发生变化的。
- 比如在新界面上线后,
- 第一种情况: 用户购买量下降了,同时用户的浏览量和在线时长都减少了。UI界面设计不合理,令用户的使用体验变差,提前关闭APP,导致了购买下降。
- 第二种情况:用户购买量下降了,但是用户的浏览量和在线时长都提高了。新的UI设计让用户更愿意花时间浏览APP。因为浏览时间拉长,用户发现了很多喜欢的商品,但是由于选择过多,反而让用户更难下定决心购买。
-
护栏指标(guardrial metric):
- 护栏指标,是用来限制新设计带来的负面影响。
- 在这个UI界面的例子中,我们希望用户购买量能够上升,但同时不希望新的功能会影响日活量,如果新功能对日活量有一定的负面影响。那么表明有部分的用户不喜欢新的页面设计,这时我们就需要否决掉这个方案。
- 再举个广告投放的栗子:
- 许多APP都会使用不同的广告投放策略,在用户使用时推送广告。因为企业希望通过广告增加利润收入,所以广告投放策略的核心指标一般是广告盈利。
- 广告太多,或者广告质量不佳,就会直接导致用户在线时长、活跃度下降。若没有及时控制,可能会最终导致用户流失。 所以用户的在线时间、或者日活是需要监控的护栏指标。
2.2 如何找到合适的指标
AB测试的指标选择应该基于业务目标和测试假设,需要选择与目标直接相关、易于测量和可靠的指标,以确保测试的有效性和准确性。
选择指标的原则
下面是总结的一些基本原则:
- 关注核心业务指标:应优先考虑关键业务指标,如转化率、收入、利润等。这些指标与业务目标直接相关,能够直接反映实验效果。
- 考虑上下游指标:除了核心业务指标,还需要考虑与之相关的上下游指标。如用户满意度、页面停留时间、页面访问量等,以便全面了解实验效果。
- 易于测量:选择易于测量的指标可以降低测试成本和复杂度。
- 可靠性:需要选择可靠性高的指标,避免测量误差和偏差对测试结果的影响。
- 敏感性:需要选择敏感性高的指标,能够反映出实验效果的变化。
- 及时性:需要在短期内可以测量的指标,因为实验时长有限,我们要确保选择的指标可以在实验周期内测量完成。
- 可解释 :对于指标的变化,我们需要找出并且解释变化的原因和影响因素。
利用用户旅程图找到合适的指标
**用户旅程图(Customer Journey Map)**是一个描述用户在使用产品或服务过程中所经历的各个阶段和关键转折点的图表。

使用用户旅程图可以帮助我们更好地理解用户需求和行为,定位AB实验所处的用户旅程阶段,进而确定核心指标以及关键转折点(上下游指标)。
根据指标的分析结果,可以确定测试的优化方向,如优化页面设计、提高页面加载速度、调整价格策略等。
参考资料:
https://zhuanlan.zhihu.com/p/374586706
https://zhuanlan.zhihu.com/p/34084243
相关文章:
AB测试——流程介绍(定义问题和指标选取)
前言: 作为AB测试的学习记录,本文主要介绍了AB测试的基本流程,以及指标类型和如何选取合适指标。 相关文章:AB测试——原理介绍 AB测试的基本流程是什么? AB测试(也称为分流测试)是一种常用的实…...
Linux(Centos)安装Minio集群
目录1:简介2:功能与集成3:架构4:搭建集群4.1:挂载磁盘4.1.1:要求4.1.2:创建挂载目录4.1.3:注意:需要将新建的目录挂在到对应的磁盘下,磁盘不挂载好,集群启动会…...
LeetCode 1662. 检查两个字符串数组是否相等 / 795. 区间子数组个数 / 剑指 Offer 47. 礼物的最大价值
1662. 检查两个字符串数组是否相等 2022.11.1 新的一月又开始了 题目描述 给你两个字符串数组 word1 和 word2 。如果两个数组表示的字符串相同,返回 true ;否则,返回 false 。 数组表示的字符串 是由数组中的所有元素 按顺序 连接形成的…...
【C++】缺省参数函数重载
🏖️作者:malloc不出对象 ⛺专栏:C的学习之路 👦个人简介:一名双非本科院校大二在读的科班编程菜鸟,努力编程只为赶上各位大佬的步伐🙈🙈 目录前言一、缺省参数1.1 缺省参数的概念1…...
Hbuilder 下载与安装教程
文章目录Hbuilder下载与安装教程Hbuilder简介一,下载Hbuilder二,安装Hbuilder三,简单使用四,Hbuilderx 调试Hbuilder下载与安装教程 Hbuilder简介 Builder是DCloud(数字天堂)推出的一款支持HTML5的Web开发…...
Mybatis工程升级到FlunetMybatis后引发的问题以及解决方法
0. 背景交代为了提高开发速度,我打算将公司原有Mybatis框架升级为FlunetMybatis。可是遇到了一系列问题,下面开始爬坑工程结构示意如下:src/ ├── main │ ├── java.com.demo │ │ ├── Application.java //S…...
Oracle VM VirtualBox6.1.36导入ova虚拟机文件报错,代码: E_INVALIDARG (0x80070057)
问题 运维人员去客户现场部署应用服务,客户是windows server 服务器(客户不想买新机器),我们程序是在linux系统里运行(其实windows也可以,主要是为了保持各地环境一致方便更新和排查问题)我们使…...
Superset数据探索和可视化平台入门以及案例实操
1、Superset背景 1.1、Superset概述 Apache Superset是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义仪表盘。 1.2、环境说明 …...
VisualSP Enterprise - February crack
VisualSP Enterprise - February crack VisualSP(可视化支持平台)提供了一个上下文中完全可定制的培训平台,它可以作为企业web应用程序的覆盖层提供。无论员工正在使用什么应用程序,他们都能够快速访问页面培训和指导,说明如何最有效地使用该…...
004+limou+HTML——(4)HTML表格
000、前言 表格在实际开发中的应用还是比较多的,表格可以更加清晰地排列数据 001、基本结构 (1)构成 表格:<table>行:<tr>(table row,表格行),由多少组t…...
uniapp实现自定义相机
自定义相机起因由于最近用uniapp调用原生相机容易出现闪退问题,找了很多教程又是压缩图片又是优化代码,我表示并没有太大作用!!实现自定义相机使用效果图拓展实现多种自定义相机水印相机身份证相机人像相机起因 由于最近用uniapp调用原生相机容易出现闪退…...
插值多项式的龙格现象的介绍与模拟
在文章拉格朗日插值多项式的原理介绍及其应用中,笔者介绍了如何使用拉格朗日插值多项式来拟合任意数据点集。 事实上,插值多项式会更倾向于某些形状。德国数学家卡尔龙格Carl Runge发现,插值多项式在差值区间的端点附近会发生扭动&#x…...
Spring整体架构包含哪些组件?
Spring是一个轻量级java开源框架。Spring是为了解决企业应用开发的复杂性而创建的,它使用基本的JavaBean来完成以前只可能由EJB完成的事情。 Spring的用途不仅限于服务器端的开发,从简单性、可测试性和松耦合的角度而言,任何java应用都可以从…...
开发接口需要考虑哪些问题?
1 接口名字 user/ user/adduser/xxx 见名知意,调用接口的开发人员和后来接手的开发人员能够根据接口名称大致猜测出接口作用。 2 协议 设计接口时,应明确调用接口的协议,是采用HTTP协议,HTTPS协议还是FTP协议。比如跨语言调用通常使用WebS…...
关于Activiti7审批工作流绘画流程图(2)
文章目录一、25张表详解二、安装插件一.定制流程提示:以下是本篇文章正文内容,下面案例可供参考 一、25张表详解 虽然表很多,但是仔细观察,我们会发现Activiti 使用到的表都是 ACT_ 开头的。表名的第二部分用两个字母表明表的用…...
String.format()对日期进行格式化
前言:String.format()作为文本处理工具,为我们提供强大而丰富的字符串格式化功能,这里根据查阅的资料做个学习笔记,整理成如下文章,供后续复习查阅。一. format()方法的两种重载形式:format(String format,…...
核酸检测信息管理系统
目录前言一、功能与需求分析二、详细设计与实现1、data包(1)DataDataBase(2)NaPaNamePassword2、operation包(1)操作接口(2)Resident用户功能(3)Simper用户功…...
典型回溯题目 - 全排列(一、二)
典型回溯题目 - 全排列(一、二) 46. 全排列 题目链接:46. 全排列状 题目大意: 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 注意:(1…...
数据清洗和特征选择
数据清洗和特征选择 数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗>特征,标注数据生成>模型学习>模型应用”中的前两个步骤。 灰色框中蓝色箭头对应的是离线处理部分。主要工作是 从原始数据,如文本、图像或者应…...
java StringBuilder 和 StringBuffer 万字详解(深度讲解)
StringBuffer类介绍和溯源StringBuffer类常用构造器和常用方法StringBuffer类 VS String类(重要)二者的本质区别(含内存图解)二者的相互转化StringBuilder类介绍和溯源StringBuilder类常用构造器和常用方法String类,St…...
IDEA运行Tomcat出现乱码问题解决汇总
最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...
利用最小二乘法找圆心和半径
#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...
【p2p、分布式,区块链笔记 MESH】Bluetooth蓝牙通信 BLE Mesh协议的拓扑结构 定向转发机制
目录 节点的功能承载层(GATT/Adv)局限性: 拓扑关系定向转发机制定向转发意义 CG 节点的功能 节点的功能由节点支持的特性和功能决定。所有节点都能够发送和接收网格消息。节点还可以选择支持一个或多个附加功能,如 Configuration …...
Oracle11g安装包
Oracle 11g安装包 适用于windows系统,64位 下载路径 oracle 11g 安装包...
Leetcode33( 搜索旋转排序数组)
题目表述 整数数组 nums 按升序排列,数组中的值 互不相同 。 在传递给函数之前,nums 在预先未知的某个下标 k(0 < k < nums.length)上进行了 旋转,使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…...
ubuntu22.04有线网络无法连接,图标也没了
今天突然无法有线网络无法连接任何设备,并且图标都没了 错误案例 往上一顿搜索,试了很多博客都不行,比如 Ubuntu22.04右上角网络图标消失 最后解决的办法 下载网卡驱动,重新安装 操作步骤 查看自己网卡的型号 lspci | gre…...
Linux安全加固:从攻防视角构建系统免疫
Linux安全加固:从攻防视角构建系统免疫 构建坚不可摧的数字堡垒 引言:攻防对抗的新纪元 在日益复杂的网络威胁环境中,Linux系统安全已从被动防御转向主动免疫。2023年全球网络安全报告显示,高级持续性威胁(APT)攻击同比增长65%,平均入侵停留时间缩短至48小时。本章将从…...
TCP/IP 网络编程 | 服务端 客户端的封装
设计模式 文章目录 设计模式一、socket.h 接口(interface)二、socket.cpp 实现(implementation)三、server.cpp 使用封装(main 函数)四、client.cpp 使用封装(main 函数)五、退出方法…...
Java数组Arrays操作全攻略
Arrays类的概述 Java中的Arrays类位于java.util包中,提供了一系列静态方法用于操作数组(如排序、搜索、填充、比较等)。这些方法适用于基本类型数组和对象数组。 常用成员方法及代码示例 排序(sort) 对数组进行升序…...
FOPLP vs CoWoS
以下是 FOPLP(Fan-out panel-level packaging 扇出型面板级封装)与 CoWoS(Chip on Wafer on Substrate)两种先进封装技术的详细对比分析,涵盖技术原理、性能、成本、应用场景及市场趋势等维度: 一、技术原…...
