AB测试——流程介绍(定义问题和指标选取)
前言: 作为AB测试的学习记录,本文主要介绍了AB测试的基本流程,以及指标类型和如何选取合适指标。
相关文章:AB测试——原理介绍
AB测试的基本流程是什么?
AB测试(也称为分流测试)是一种常用的实验设计方法,用于比较两种或多种不同的设计或策略,以确定哪种方案更有效。下面是AB测试的一般流程:
- 定义研究问题:确定要测试的问题或假设,并将其转化为可量化的指标。
- 设计测试方案:制定测试方案,包括定义测试组和对照组,确定样本量和测试时长等关键因素。
- 实施测试方案:实施测试方案,包括在测试组和对照组中分别应用不同的方案,并记录结果数据。
- 数据分析:统计分析收集的数据,比较测试组和对照组的差异,并确定哪种方案更有效。
- 结果解释和应用:根据数据分析结果,解释测试结果,并应用于实际业务中。
- 优化改进:根据测试结果和应用效果,进行优化改进,并持续跟踪测试方案的效果。
需要注意的是,AB测试的有效性取决于样本量和测试时长的设计,必须确保样本量足够大,测试时长足够长,才能保证测试结果的可信度和稳定性。此外,测试方案需要避免影响测试结果的偏差和干扰,例如排除不相关因素的影响。
1. 定义研究问题(Problem Statment)
首先,需要明确业务场景的背景现状,和产品经理沟通需要验证的方案是什么,目的是什么。
比如,我们先在需要上线一个新的APP的UI界面,目的为了吸引用户购买,提高用户的成交量。
- 变量/变体:一个新的UI界面
- 实验对象:APP用户
- 目的:提高成交量
通过对问题的分析和理解,实验设计者需要将一个商业问题转换成一个可量化、可通过实验验证的数学问题。
2. 选取指标 (Metrics Selection)
确定好实验的背景和目的,接下来就需要确认需要追踪和验证的数据指标。
2.1 指标的两种分类
对于指标,我们可以有两种分类方法。
按计算方式区分:
第一种按计算方式区分:
- 绝对值指标 : 单一的数值,比如利润总额、销售量、用户在线时间等。
- 相对值指标 :两个有联系的现象数值相比得到的比率。例如用户转化率、ROI等。
按业务特性区分:
第二种是根据各类指标在业务中的分工特性区分:
-
成功指标(Primary/Core/Success Metrics):
- 最核心的度量指标,决定新功能是否有价值、实验是否成功的度量。
- 比如:如果新的UI界面是为了提高用户的体验,那么用户在线时长、日活可以作为关键指标;如果是新的产品推送策略,为了提高销售和利润,那么利润就是最关键的核心指标
-
跟踪指标(Secondary/Tracking metrics):
- 跟踪指标不能直接测量新功能是否有效, 但是能帮助监测新功能是如何影响目标指标。 如果目标指标有异动,跟踪指标可以帮忙分析新功能是如何导致目标指标发生变化的。
- 比如在新界面上线后,
- 第一种情况: 用户购买量下降了,同时用户的浏览量和在线时长都减少了。UI界面设计不合理,令用户的使用体验变差,提前关闭APP,导致了购买下降。
- 第二种情况:用户购买量下降了,但是用户的浏览量和在线时长都提高了。新的UI设计让用户更愿意花时间浏览APP。因为浏览时间拉长,用户发现了很多喜欢的商品,但是由于选择过多,反而让用户更难下定决心购买。
-
护栏指标(guardrial metric):
- 护栏指标,是用来限制新设计带来的负面影响。
- 在这个UI界面的例子中,我们希望用户购买量能够上升,但同时不希望新的功能会影响日活量,如果新功能对日活量有一定的负面影响。那么表明有部分的用户不喜欢新的页面设计,这时我们就需要否决掉这个方案。
- 再举个广告投放的栗子:
- 许多APP都会使用不同的广告投放策略,在用户使用时推送广告。因为企业希望通过广告增加利润收入,所以广告投放策略的核心指标一般是广告盈利。
- 广告太多,或者广告质量不佳,就会直接导致用户在线时长、活跃度下降。若没有及时控制,可能会最终导致用户流失。 所以用户的在线时间、或者日活是需要监控的护栏指标。
2.2 如何找到合适的指标
AB测试的指标选择应该基于业务目标和测试假设,需要选择与目标直接相关、易于测量和可靠的指标,以确保测试的有效性和准确性。
选择指标的原则
下面是总结的一些基本原则:
- 关注核心业务指标:应优先考虑关键业务指标,如转化率、收入、利润等。这些指标与业务目标直接相关,能够直接反映实验效果。
- 考虑上下游指标:除了核心业务指标,还需要考虑与之相关的上下游指标。如用户满意度、页面停留时间、页面访问量等,以便全面了解实验效果。
- 易于测量:选择易于测量的指标可以降低测试成本和复杂度。
- 可靠性:需要选择可靠性高的指标,避免测量误差和偏差对测试结果的影响。
- 敏感性:需要选择敏感性高的指标,能够反映出实验效果的变化。
- 及时性:需要在短期内可以测量的指标,因为实验时长有限,我们要确保选择的指标可以在实验周期内测量完成。
- 可解释 :对于指标的变化,我们需要找出并且解释变化的原因和影响因素。
利用用户旅程图找到合适的指标
**用户旅程图(Customer Journey Map)**是一个描述用户在使用产品或服务过程中所经历的各个阶段和关键转折点的图表。
使用用户旅程图可以帮助我们更好地理解用户需求和行为,定位AB实验所处的用户旅程阶段,进而确定核心指标以及关键转折点(上下游指标)。
根据指标的分析结果,可以确定测试的优化方向,如优化页面设计、提高页面加载速度、调整价格策略等。
参考资料:
https://zhuanlan.zhihu.com/p/374586706
https://zhuanlan.zhihu.com/p/34084243
相关文章:

AB测试——流程介绍(定义问题和指标选取)
前言: 作为AB测试的学习记录,本文主要介绍了AB测试的基本流程,以及指标类型和如何选取合适指标。 相关文章:AB测试——原理介绍 AB测试的基本流程是什么? AB测试(也称为分流测试)是一种常用的实…...

Linux(Centos)安装Minio集群
目录1:简介2:功能与集成3:架构4:搭建集群4.1:挂载磁盘4.1.1:要求4.1.2:创建挂载目录4.1.3:注意:需要将新建的目录挂在到对应的磁盘下,磁盘不挂载好,集群启动会…...
LeetCode 1662. 检查两个字符串数组是否相等 / 795. 区间子数组个数 / 剑指 Offer 47. 礼物的最大价值
1662. 检查两个字符串数组是否相等 2022.11.1 新的一月又开始了 题目描述 给你两个字符串数组 word1 和 word2 。如果两个数组表示的字符串相同,返回 true ;否则,返回 false 。 数组表示的字符串 是由数组中的所有元素 按顺序 连接形成的…...

【C++】缺省参数函数重载
🏖️作者:malloc不出对象 ⛺专栏:C的学习之路 👦个人简介:一名双非本科院校大二在读的科班编程菜鸟,努力编程只为赶上各位大佬的步伐🙈🙈 目录前言一、缺省参数1.1 缺省参数的概念1…...

Hbuilder 下载与安装教程
文章目录Hbuilder下载与安装教程Hbuilder简介一,下载Hbuilder二,安装Hbuilder三,简单使用四,Hbuilderx 调试Hbuilder下载与安装教程 Hbuilder简介 Builder是DCloud(数字天堂)推出的一款支持HTML5的Web开发…...

Mybatis工程升级到FlunetMybatis后引发的问题以及解决方法
0. 背景交代为了提高开发速度,我打算将公司原有Mybatis框架升级为FlunetMybatis。可是遇到了一系列问题,下面开始爬坑工程结构示意如下:src/ ├── main │ ├── java.com.demo │ │ ├── Application.java //S…...

Oracle VM VirtualBox6.1.36导入ova虚拟机文件报错,代码: E_INVALIDARG (0x80070057)
问题 运维人员去客户现场部署应用服务,客户是windows server 服务器(客户不想买新机器),我们程序是在linux系统里运行(其实windows也可以,主要是为了保持各地环境一致方便更新和排查问题)我们使…...

Superset数据探索和可视化平台入门以及案例实操
1、Superset背景 1.1、Superset概述 Apache Superset是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义仪表盘。 1.2、环境说明 …...

VisualSP Enterprise - February crack
VisualSP Enterprise - February crack VisualSP(可视化支持平台)提供了一个上下文中完全可定制的培训平台,它可以作为企业web应用程序的覆盖层提供。无论员工正在使用什么应用程序,他们都能够快速访问页面培训和指导,说明如何最有效地使用该…...

004+limou+HTML——(4)HTML表格
000、前言 表格在实际开发中的应用还是比较多的,表格可以更加清晰地排列数据 001、基本结构 (1)构成 表格:<table>行:<tr>(table row,表格行),由多少组t…...

uniapp实现自定义相机
自定义相机起因由于最近用uniapp调用原生相机容易出现闪退问题,找了很多教程又是压缩图片又是优化代码,我表示并没有太大作用!!实现自定义相机使用效果图拓展实现多种自定义相机水印相机身份证相机人像相机起因 由于最近用uniapp调用原生相机容易出现闪退…...

插值多项式的龙格现象的介绍与模拟
在文章拉格朗日插值多项式的原理介绍及其应用中,笔者介绍了如何使用拉格朗日插值多项式来拟合任意数据点集。 事实上,插值多项式会更倾向于某些形状。德国数学家卡尔龙格Carl Runge发现,插值多项式在差值区间的端点附近会发生扭动&#x…...

Spring整体架构包含哪些组件?
Spring是一个轻量级java开源框架。Spring是为了解决企业应用开发的复杂性而创建的,它使用基本的JavaBean来完成以前只可能由EJB完成的事情。 Spring的用途不仅限于服务器端的开发,从简单性、可测试性和松耦合的角度而言,任何java应用都可以从…...
开发接口需要考虑哪些问题?
1 接口名字 user/ user/adduser/xxx 见名知意,调用接口的开发人员和后来接手的开发人员能够根据接口名称大致猜测出接口作用。 2 协议 设计接口时,应明确调用接口的协议,是采用HTTP协议,HTTPS协议还是FTP协议。比如跨语言调用通常使用WebS…...

关于Activiti7审批工作流绘画流程图(2)
文章目录一、25张表详解二、安装插件一.定制流程提示:以下是本篇文章正文内容,下面案例可供参考 一、25张表详解 虽然表很多,但是仔细观察,我们会发现Activiti 使用到的表都是 ACT_ 开头的。表名的第二部分用两个字母表明表的用…...
String.format()对日期进行格式化
前言:String.format()作为文本处理工具,为我们提供强大而丰富的字符串格式化功能,这里根据查阅的资料做个学习笔记,整理成如下文章,供后续复习查阅。一. format()方法的两种重载形式:format(String format,…...

核酸检测信息管理系统
目录前言一、功能与需求分析二、详细设计与实现1、data包(1)DataDataBase(2)NaPaNamePassword2、operation包(1)操作接口(2)Resident用户功能(3)Simper用户功…...

典型回溯题目 - 全排列(一、二)
典型回溯题目 - 全排列(一、二) 46. 全排列 题目链接:46. 全排列状 题目大意: 给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 注意:(1…...

数据清洗和特征选择
数据清洗和特征选择 数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗>特征,标注数据生成>模型学习>模型应用”中的前两个步骤。 灰色框中蓝色箭头对应的是离线处理部分。主要工作是 从原始数据,如文本、图像或者应…...

java StringBuilder 和 StringBuffer 万字详解(深度讲解)
StringBuffer类介绍和溯源StringBuffer类常用构造器和常用方法StringBuffer类 VS String类(重要)二者的本质区别(含内存图解)二者的相互转化StringBuilder类介绍和溯源StringBuilder类常用构造器和常用方法String类,St…...

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式
一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明:假设每台服务器已…...

业务系统对接大模型的基础方案:架构设计与关键步骤
业务系统对接大模型:架构设计与关键步骤 在当今数字化转型的浪潮中,大语言模型(LLM)已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中,不仅可以优化用户体验,还能为业务决策提供…...
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする 1、前言(1)情况说明(2)工程师的信仰2、知识点(1) にする1,接续:名词+にする2,接续:疑问词+にする3,(A)は(B)にする。(2)復習:(1)复习句子(2)ために & ように(3)そう(4)にする3、…...
Python爬虫实战:研究feedparser库相关技术
1. 引言 1.1 研究背景与意义 在当今信息爆炸的时代,互联网上存在着海量的信息资源。RSS(Really Simple Syndication)作为一种标准化的信息聚合技术,被广泛用于网站内容的发布和订阅。通过 RSS,用户可以方便地获取网站更新的内容,而无需频繁访问各个网站。 然而,互联网…...
在鸿蒙HarmonyOS 5中使用DevEco Studio实现录音机应用
1. 项目配置与权限设置 1.1 配置module.json5 {"module": {"requestPermissions": [{"name": "ohos.permission.MICROPHONE","reason": "录音需要麦克风权限"},{"name": "ohos.permission.WRITE…...
【HTTP三个基础问题】
面试官您好!HTTP是超文本传输协议,是互联网上客户端和服务器之间传输超文本数据(比如文字、图片、音频、视频等)的核心协议,当前互联网应用最广泛的版本是HTTP1.1,它基于经典的C/S模型,也就是客…...
JVM暂停(Stop-The-World,STW)的原因分类及对应排查方案
JVM暂停(Stop-The-World,STW)的完整原因分类及对应排查方案,结合JVM运行机制和常见故障场景整理而成: 一、GC相关暂停 1. 安全点(Safepoint)阻塞 现象:JVM暂停但无GC日志,日志显示No GCs detected。原因:JVM等待所有线程进入安全点(如…...
C++八股 —— 单例模式
文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全(Thread Safety) 线程安全是指在多线程环境下,某个函数、类或代码片段能够被多个线程同时调用时,仍能保证数据的一致性和逻辑的正确性…...

【Oracle】分区表
个人主页:Guiat 归属专栏:Oracle 文章目录 1. 分区表基础概述1.1 分区表的概念与优势1.2 分区类型概览1.3 分区表的工作原理 2. 范围分区 (RANGE Partitioning)2.1 基础范围分区2.1.1 按日期范围分区2.1.2 按数值范围分区 2.2 间隔分区 (INTERVAL Partit…...
#Uniapp篇:chrome调试unapp适配
chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器:Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...