AB测试——流程介绍(定义问题和指标选取)
前言: 作为AB测试的学习记录,本文主要介绍了AB测试的基本流程,以及指标类型和如何选取合适指标。
相关文章:AB测试——原理介绍
AB测试的基本流程是什么?
AB测试(也称为分流测试)是一种常用的实验设计方法,用于比较两种或多种不同的设计或策略,以确定哪种方案更有效。下面是AB测试的一般流程:
- 定义研究问题:确定要测试的问题或假设,并将其转化为可量化的指标。
- 设计测试方案:制定测试方案,包括定义测试组和对照组,确定样本量和测试时长等关键因素。
- 实施测试方案:实施测试方案,包括在测试组和对照组中分别应用不同的方案,并记录结果数据。
- 数据分析:统计分析收集的数据,比较测试组和对照组的差异,并确定哪种方案更有效。
- 结果解释和应用:根据数据分析结果,解释测试结果,并应用于实际业务中。
- 优化改进:根据测试结果和应用效果,进行优化改进,并持续跟踪测试方案的效果。
需要注意的是,AB测试的有效性取决于样本量和测试时长的设计,必须确保样本量足够大,测试时长足够长,才能保证测试结果的可信度和稳定性。此外,测试方案需要避免影响测试结果的偏差和干扰,例如排除不相关因素的影响。
1. 定义研究问题(Problem Statment)
首先,需要明确业务场景的背景现状,和产品经理沟通需要验证的方案是什么,目的是什么。
比如,我们先在需要上线一个新的APP的UI界面,目的为了吸引用户购买,提高用户的成交量。
- 变量/变体:一个新的UI界面
- 实验对象:APP用户
- 目的:提高成交量
通过对问题的分析和理解,实验设计者需要将一个商业问题转换成一个可量化、可通过实验验证的数学问题。
2. 选取指标 (Metrics Selection)
确定好实验的背景和目的,接下来就需要确认需要追踪和验证的数据指标。
2.1 指标的两种分类
对于指标,我们可以有两种分类方法。
按计算方式区分:
第一种按计算方式区分:
- 绝对值指标 : 单一的数值,比如利润总额、销售量、用户在线时间等。
- 相对值指标 :两个有联系的现象数值相比得到的比率。例如用户转化率、ROI等。
按业务特性区分:
第二种是根据各类指标在业务中的分工特性区分:
-
成功指标(Primary/Core/Success Metrics):
- 最核心的度量指标,决定新功能是否有价值、实验是否成功的度量。
- 比如:如果新的UI界面是为了提高用户的体验,那么用户在线时长、日活可以作为关键指标;如果是新的产品推送策略,为了提高销售和利润,那么利润就是最关键的核心指标
-
跟踪指标(Secondary/Tracking metrics):
- 跟踪指标不能直接测量新功能是否有效, 但是能帮助监测新功能是如何影响目标指标。 如果目标指标有异动,跟踪指标可以帮忙分析新功能是如何导致目标指标发生变化的。
- 比如在新界面上线后,
- 第一种情况: 用户购买量下降了,同时用户的浏览量和在线时长都减少了。UI界面设计不合理,令用户的使用体验变差,提前关闭APP,导致了购买下降。
- 第二种情况:用户购买量下降了,但是用户的浏览量和在线时长都提高了。新的UI设计让用户更愿意花时间浏览APP。因为浏览时间拉长,用户发现了很多喜欢的商品,但是由于选择过多,反而让用户更难下定决心购买。
-
护栏指标(guardrial metric):
- 护栏指标,是用来限制新设计带来的负面影响。
- 在这个UI界面的例子中,我们希望用户购买量能够上升,但同时不希望新的功能会影响日活量,如果新功能对日活量有一定的负面影响。那么表明有部分的用户不喜欢新的页面设计,这时我们就需要否决掉这个方案。
- 再举个广告投放的栗子:
- 许多APP都会使用不同的广告投放策略,在用户使用时推送广告。因为企业希望通过广告增加利润收入,所以广告投放策略的核心指标一般是广告盈利。
- 广告太多,或者广告质量不佳,就会直接导致用户在线时长、活跃度下降。若没有及时控制,可能会最终导致用户流失。 所以用户的在线时间、或者日活是需要监控的护栏指标。
2.2 如何找到合适的指标
AB测试的指标选择应该基于业务目标和测试假设,需要选择与目标直接相关、易于测量和可靠的指标,以确保测试的有效性和准确性。
选择指标的原则
下面是总结的一些基本原则:
- 关注核心业务指标:应优先考虑关键业务指标,如转化率、收入、利润等。这些指标与业务目标直接相关,能够直接反映实验效果。
- 考虑上下游指标:除了核心业务指标,还需要考虑与之相关的上下游指标。如用户满意度、页面停留时间、页面访问量等,以便全面了解实验效果。
- 易于测量:选择易于测量的指标可以降低测试成本和复杂度。
- 可靠性:需要选择可靠性高的指标,避免测量误差和偏差对测试结果的影响。
- 敏感性:需要选择敏感性高的指标,能够反映出实验效果的变化。
- 及时性:需要在短期内可以测量的指标,因为实验时长有限,我们要确保选择的指标可以在实验周期内测量完成。
- 可解释 :对于指标的变化,我们需要找出并且解释变化的原因和影响因素。
利用用户旅程图找到合适的指标
**用户旅程图(Customer Journey Map)**是一个描述用户在使用产品或服务过程中所经历的各个阶段和关键转折点的图表。

使用用户旅程图可以帮助我们更好地理解用户需求和行为,定位AB实验所处的用户旅程阶段,进而确定核心指标以及关键转折点(上下游指标)。
根据指标的分析结果,可以确定测试的优化方向,如优化页面设计、提高页面加载速度、调整价格策略等。
参考资料:
https://zhuanlan.zhihu.com/p/374586706
https://zhuanlan.zhihu.com/p/34084243
相关文章:
AB测试——流程介绍(定义问题和指标选取)
前言: 作为AB测试的学习记录,本文主要介绍了AB测试的基本流程,以及指标类型和如何选取合适指标。 相关文章:AB测试——原理介绍 AB测试的基本流程是什么? AB测试(也称为分流测试)是一种常用的实…...
Linux(Centos)安装Minio集群
目录1:简介2:功能与集成3:架构4:搭建集群4.1:挂载磁盘4.1.1:要求4.1.2:创建挂载目录4.1.3:注意:需要将新建的目录挂在到对应的磁盘下,磁盘不挂载好,集群启动会…...
LeetCode 1662. 检查两个字符串数组是否相等 / 795. 区间子数组个数 / 剑指 Offer 47. 礼物的最大价值
1662. 检查两个字符串数组是否相等 2022.11.1 新的一月又开始了 题目描述 给你两个字符串数组 word1 和 word2 。如果两个数组表示的字符串相同,返回 true ;否则,返回 false 。 数组表示的字符串 是由数组中的所有元素 按顺序 连接形成的…...
【C++】缺省参数函数重载
🏖️作者:malloc不出对象 ⛺专栏:C的学习之路 👦个人简介:一名双非本科院校大二在读的科班编程菜鸟,努力编程只为赶上各位大佬的步伐🙈🙈 目录前言一、缺省参数1.1 缺省参数的概念1…...
Hbuilder 下载与安装教程
文章目录Hbuilder下载与安装教程Hbuilder简介一,下载Hbuilder二,安装Hbuilder三,简单使用四,Hbuilderx 调试Hbuilder下载与安装教程 Hbuilder简介 Builder是DCloud(数字天堂)推出的一款支持HTML5的Web开发…...
Mybatis工程升级到FlunetMybatis后引发的问题以及解决方法
0. 背景交代为了提高开发速度,我打算将公司原有Mybatis框架升级为FlunetMybatis。可是遇到了一系列问题,下面开始爬坑工程结构示意如下:src/ ├── main │ ├── java.com.demo │ │ ├── Application.java //S…...
Oracle VM VirtualBox6.1.36导入ova虚拟机文件报错,代码: E_INVALIDARG (0x80070057)
问题 运维人员去客户现场部署应用服务,客户是windows server 服务器(客户不想买新机器),我们程序是在linux系统里运行(其实windows也可以,主要是为了保持各地环境一致方便更新和排查问题)我们使…...
Superset数据探索和可视化平台入门以及案例实操
1、Superset背景 1.1、Superset概述 Apache Superset是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义仪表盘。 1.2、环境说明 …...
VisualSP Enterprise - February crack
VisualSP Enterprise - February crack VisualSP(可视化支持平台)提供了一个上下文中完全可定制的培训平台,它可以作为企业web应用程序的覆盖层提供。无论员工正在使用什么应用程序,他们都能够快速访问页面培训和指导,说明如何最有效地使用该…...
004+limou+HTML——(4)HTML表格
000、前言 表格在实际开发中的应用还是比较多的,表格可以更加清晰地排列数据 001、基本结构 (1)构成 表格:<table>行:<tr>(table row,表格行),由多少组t…...
uniapp实现自定义相机
自定义相机起因由于最近用uniapp调用原生相机容易出现闪退问题,找了很多教程又是压缩图片又是优化代码,我表示并没有太大作用!!实现自定义相机使用效果图拓展实现多种自定义相机水印相机身份证相机人像相机起因 由于最近用uniapp调用原生相机容易出现闪退…...
插值多项式的龙格现象的介绍与模拟
在文章拉格朗日插值多项式的原理介绍及其应用中,笔者介绍了如何使用拉格朗日插值多项式来拟合任意数据点集。 事实上,插值多项式会更倾向于某些形状。德国数学家卡尔龙格Carl Runge发现,插值多项式在差值区间的端点附近会发生扭动&#x…...
Spring整体架构包含哪些组件?
Spring是一个轻量级java开源框架。Spring是为了解决企业应用开发的复杂性而创建的,它使用基本的JavaBean来完成以前只可能由EJB完成的事情。 Spring的用途不仅限于服务器端的开发,从简单性、可测试性和松耦合的角度而言,任何java应用都可以从…...
开发接口需要考虑哪些问题?
1 接口名字 user/ user/adduser/xxx 见名知意,调用接口的开发人员和后来接手的开发人员能够根据接口名称大致猜测出接口作用。 2 协议 设计接口时,应明确调用接口的协议,是采用HTTP协议,HTTPS协议还是FTP协议。比如跨语言调用通常使用WebS…...
关于Activiti7审批工作流绘画流程图(2)
文章目录一、25张表详解二、安装插件一.定制流程提示:以下是本篇文章正文内容,下面案例可供参考 一、25张表详解 虽然表很多,但是仔细观察,我们会发现Activiti 使用到的表都是 ACT_ 开头的。表名的第二部分用两个字母表明表的用…...
String.format()对日期进行格式化
前言:String.format()作为文本处理工具,为我们提供强大而丰富的字符串格式化功能,这里根据查阅的资料做个学习笔记,整理成如下文章,供后续复习查阅。一. format()方法的两种重载形式:format(String format,…...
核酸检测信息管理系统
目录前言一、功能与需求分析二、详细设计与实现1、data包(1)DataDataBase(2)NaPaNamePassword2、operation包(1)操作接口(2)Resident用户功能(3)Simper用户功…...
典型回溯题目 - 全排列(一、二)
典型回溯题目 - 全排列(一、二) 46. 全排列 题目链接:46. 全排列状 题目大意: 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 注意:(1…...
数据清洗和特征选择
数据清洗和特征选择 数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗>特征,标注数据生成>模型学习>模型应用”中的前两个步骤。 灰色框中蓝色箭头对应的是离线处理部分。主要工作是 从原始数据,如文本、图像或者应…...
java StringBuilder 和 StringBuffer 万字详解(深度讲解)
StringBuffer类介绍和溯源StringBuffer类常用构造器和常用方法StringBuffer类 VS String类(重要)二者的本质区别(含内存图解)二者的相互转化StringBuilder类介绍和溯源StringBuilder类常用构造器和常用方法String类,St…...
wordpress后台更新后 前端没变化的解决方法
使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…...
SkyWalking 10.2.0 SWCK 配置过程
SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外,K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案,全安装在K8S群集中。 具体可参…...
【Oracle APEX开发小技巧12】
有如下需求: 有一个问题反馈页面,要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据,方便管理员及时处理反馈。 我的方法:直接将逻辑写在SQL中,这样可以直接在页面展示 完整代码: SELECTSF.FE…...
React第五十七节 Router中RouterProvider使用详解及注意事项
前言 在 React Router v6.4 中,RouterProvider 是一个核心组件,用于提供基于数据路由(data routers)的新型路由方案。 它替代了传统的 <BrowserRouter>,支持更强大的数据加载和操作功能(如 loader 和…...
MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例
一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...
AI Agent与Agentic AI:原理、应用、挑战与未来展望
文章目录 一、引言二、AI Agent与Agentic AI的兴起2.1 技术契机与生态成熟2.2 Agent的定义与特征2.3 Agent的发展历程 三、AI Agent的核心技术栈解密3.1 感知模块代码示例:使用Python和OpenCV进行图像识别 3.2 认知与决策模块代码示例:使用OpenAI GPT-3进…...
mongodb源码分析session执行handleRequest命令find过程
mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程,并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令,把数据流转换成Message,状态转变流程是:State::Created 》 St…...
五年级数学知识边界总结思考-下册
目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解:由来、作用与意义**一、知识点核心内容****二、知识点的由来:从生活实践到数学抽象****三、知识的作用:解决实际问题的工具****四、学习的意义:培养核心素养…...
HTML前端开发:JavaScript 常用事件详解
作为前端开发的核心,JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例: 1. onclick - 点击事件 当元素被单击时触发(左键点击) button.onclick function() {alert("按钮被点击了!&…...
R语言速释制剂QBD解决方案之三
本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...
