当前位置: 首页 > news >正文

常见的九种大数据分析模型

常见的9种大数据分析模型分别为:
事件分析、
属性分析、
渠道分析、
Session分析、
留存分析、
归因分析、
漏斗分析、
路径分析、
分布分析

1、【事件分析】
事件分析,是指用户在 APP、网站等应用上发生的行为,即何人,何时,何地,通过何种方式,做了什么事。
事件分析模型主要用于分析用户在应用上的行为,比如打开 APP、注册、登录、支付订单等。通过触发用户数、触发次数、访问时长等基础指标度量用户行为,同时也支持指标运算,构建复杂的指标衡量业务过程。
那么,事件分析模型能够解决哪些问题呢?
例如:
监测产品每天的用户数、访问次数、使用时长;趋势是否发生了变化?
引起变化的因素有哪些?
北京地区的用户和上海地区的用户,购买家电品类的金额分布差异在哪里?
今天在产品中发起了一个话题,各个时段用户的参与情况如何?
最近半年付费用户数和 ARPU 值是多少?

事件分析模型能够实时监测用户在不同平台的用户行为,通过不同维度归因指标变化因素,还能通过自定义指标组合成新的指标实现更为强大的分析能力。

在这里插入图片描述

2、【属性分析】
属性分析是基于用户自定义属性或预置属性的占比分析,能够按照不同的属性来统计用户数等指标的属性占比,进而得到初步的分析结论。例如,通过对性别属性的用户数占比分析,我们可以快速得到不同性别的用户数统计结果。

通过属性分析,可以快速查看在不同属性上的用户数分布情况,便于统计不同特征的用户总量,在使用属性分析的过程中,需要合理选择度量方式,常用的度量方式包括:用户数、去重数、总和、最大值、最小值、均值等。

例如:我们选择的指标为“累计消费金额的均值”,维度为“会员等级”,用户选择“所有用户”,那么我们得到的结果是“所有不同会员等级用户的平均消费金额是多少”。

属性分析模型同事件分析模型类似,可以进行多维度多用户之间的对比、多种图表形式展示统计结果。在有标签功能的场景下,还可以对不同版本标签的统计对比分析。

在这里插入图片描述

3、【渠道分析】

渠道,即企业(产品)与用户产生互动的各个触点,比如搜索引擎、社交媒体、广告平台、线下站会等等。

渠道分析模型用于分析用户(包括访客)的访问来源,通过访问用户数、访问次数、访问时长、跳出率等基础指标评估渠道质量,同时也支持自定义转化目标衡量渠道的转化效果。

那么,渠道分析能够解决哪些问题呢?
例如:
各个渠道实时的访问用户数、浏览量如何?
上周选择了多个渠道对网站进行推广,各个渠道带来的用户注册量如何?
社交媒体、搜索引擎、外部链接……哪个渠道带来的用户留存率更高?
微信来源用户更多集中在公众号还是朋友圈?
哪些搜索词带来的流量很大,且转化效果也好?

渠道分析模型通过定义基础指标和转化指标、选择分析平台、渠道维度,就能够清晰地呈现各渠道表现,从而评估不同渠道的实际产出效果,最终选择优质渠道组合,提高整体ROI。

在这里插入图片描述
4、【Session分析】
Session,即会话,是指在指定的时间段内在网站/H5/小程序/APP上发生的一系列用户行为的集合。
例如,一次会话可以包含多个页面浏览、交互事件等。Session 是具备时间属性的,根据不同的切割规则,可以生成不同长度的 Session。

Session分析模型含多种度量 Session 访问质量的指标,包括访问次数、人均访问次数、总访问时长、单次访问时长、单次访问深度、跳出次数、跳出率、退出次数、退出率、人均访问时长、总页面停留时长、平均页面停留时长。

在这里插入图片描述
不同于事件分析,Session 分析中额外支持了一些维度的细分,以满足特定场景下针对 Session 分析的需求,包括:

渠道来源分组:用以区分每次访问的渠道来源,仅适用于 Web/H5/小程序;
浏览页面数:以步长5为间隔,统计每次浏览页面数的分布情况;
着陆页:用以区分每次访问的着陆页,可以评价不同着陆页的访问质量;
退出页:用以区分每次访问的退出页,可以评价不同页面的退出情况,找到退出率高的页面进行优化;
访问时长:按照 0-3 secs,3-10 secs,10-30 secs,30-60 secs,1-3 mins,3-10 mins,10-30 mins,30-60 mins,1 hour 以上的区间进行划分,统计每次访问的时长分布。

同事件分析类似,Session 分析也支持多指标、多维度和多过滤条件,同时也支持多用户分群之间的横向对比。同时在 Session 分析中,还支持按照日、周、月三种不同粒度来进行统计分析,用户可以根据查询数据的时间跨度来选择合适的粒度进行分析。

5、【留存分析 】
留存分析 留存是指用户在 APP、网站等应用上使用过,并一段时间后仍有使用。

留存分析模型是一种衡量用户健康度/参与度的方法,超越下载量、DAU 等指标,深入了解用户的留存和流失状况,发现影响产品可持续增长的关键因素,指导市场决策、产品改进、提升用户价值等。

那么,留存分析模型能够解决哪些问题呢?
例如:
上个月做了一次产品迭代,如何评估其效果?
是否完成了产品经理期望完成的行为?
作为一个社交 APP,在注册后不添加好友和添加 10 个好友的用户后续留存有差异吗?
短期留存低,长期留存一定很差吗?
两个推广渠道带来不同的用户,哪个渠道的用户更有可能是的高价值用户?
近 30 天注册的用户,半个月都没有回访的用户比例是多少?

留存分析模型支持条件过滤和多人群的对比分析,支持对全量数据随机抽样计算。同时我们还可以通过留存分析判断新用户在几天、几周、几月后是否愿意回来使用你的功能,还可自定义初始行为和结束行为进行功能留存分析。

在这里插入图片描述
留存是基于某个用户群体的初始行为时间来计算的,描述发生了某个行为的同期群,在一段时间后是否发生了期望的行为。初始行为和后续行为均可以是任意事件或者某个具体的事件。

不同的分析场景中可以设置多个不同的留存条件来分析:
初始行为和后续行为设置为相同,对比不同的功能重复发生的情况,发现用户对不同功能的使用粘性;
初始行为相同,设置不同的后续行为,对比同一个优化是否对其他功能有不同的影响;
后续行为相同,设置不同的初始行为,对比发现不同的运营手段、产品功能对核心业务目标的影响。

6、【归因分析】
归因分析 在做运营活动时,我们可能会在产品内的多个运营位上投放活动素材,试图在用户与产品交互过程中的各个触点上,吸引用户的注意力,引导流量走向和用户行为,促成最终转化。此外,用户本身可能还会通过搜索、内容推荐等触点获取信息,这些触点对用户是否能达成转化也发挥着重要作用。
也就是说,在用户转化路径上,站内的众多触点都参与了对用户的劝说和引导,影响了用户的最终决策。那么,对比各个用户触点,它们对关键指标的达成分别贡献了多大力量,是否都如运营人员所预期的那样,具有优秀的转化能力;亦或者,存在被低估的情况?在之后的运营中,该如何调整对各运营位资源投入的权重分配?

对于以上问题,归因分析提供了一种直观的度量 —— 转化贡献度,主要用于衡量和评估站内的用户触点对总体转化目标达成(如订单总金额)所作出的贡献,可以非常直接地量化每个运营位和触点的转化效果和价值贡献。常见的归因分析模型有以下五种
在这里插入图片描述
首次触点归因:
将转化功劳 100% 归于首次互动的待归因事件;
末次触点归因:将转化功劳 100% 归于末次互动的待归因事件;
线性归因:将转化功劳平均分配给转化路径上的所有待归因事件;
位置归因:按待归因事件在转化路径上的位置分配转化功劳,一般首次和末次互动的事件各占 40%,中间触点的事件均分剩余的 20%; 时间衰减归因:按待归因事件发生的时间顺序,分配转化功劳,距离目标事件发生时间越近的待归因事件,做出的贡献越大,分配到的功劳越多。

7、【路径分析】
路径分析 路径是指用户在应用中使用的行为轨迹。在产品运营过程中,无论是产品、运营还是市场团队都希望能够清晰地了解用户行为路径,来验证运营思路、指导产品迭代优化,达到用户增长、转化的最终目的。

当有明确的转化路径时,通过预先建立漏斗来监测转化率会比较容易。但是很多情况下,虽然有最终的转化目标,但是用户到达该目标却有多条路径,无法确定哪条路径是用户走得最多的路径,哪条转化路径最短,这时候就需要智能路径分析模型的帮助。
在这里插入图片描述
通过智能路径分析模型能够解决如下问题:

用户主要是从哪条路径最终形成支付转化的?
用户离开预想的路径后,实际走向是什么?
不同特征的用户行为路径有什么差异?

8、【漏斗分析】
漏斗分析,是分析用户使用某项业务时,经过一系列步骤转化效果的方法。漏斗分析模型能够灵活自定义多步骤之间的转化过程,找到关键流失环节及影响因素,进而分析用户行为进行针对性优化动作。

在这里插入图片描述
官网流量很大,但注册用户很少,是过程中哪个环节出了问题?
用户从“注册 – 绑卡 - 提交订单 - 支付订单” 总体转化率如何?
不同地区的用户支付转化率有什么差异?
两个推广渠道带来了不同的用户,哪个渠道的注册转化率高?
上周针对注册环节的问题做了一次优化,转化率趋势是否有提升?

在理想情况下,用户会沿着产品设计的路径到达最终目标事件,但实际情况是用户行为路径是多种多样的。通过埋点事件配置关键业务路径,可以分析多种业务场景下转化和流失的情况,我们不仅找出产品潜在问题的位置,还可以定位每个环节流失用户,进而定向营销促转化。

9、【分布分析】
分布分析主要能够提供「维度指标化」之后的数据分解能力,将原有维度按照一定的数值区间进行维度划分,进而分析每个维度区间的分布情况,在以下分析场景中十分常见:分析订单的金额分布、分析某类特殊事件的发生时段分布、分析某类特殊事件的发生次数分布、分析触发某类事件的用户年龄分布。

在这里插入图片描述
由此可见,分布分析主要针对的是数值型和日期型这两类属性,如金额、年龄、时间、频次,因此当用户打点上传的数据中包括这两类属性时,那么在日常的分析中就有可能会使用分布分析来解决一些特定问题。常用指标有:X 事件的次数分布、X 事件的活跃时段分布、X 事件的活跃天数分布、X 事件 Y 属性的总和/均值/人均值等分布。

相关文章:

常见的九种大数据分析模型

常见的9种大数据分析模型分别为: 事件分析、 属性分析、 渠道分析、 Session分析、 留存分析、 归因分析、 漏斗分析、 路径分析、 分布分析 1、【事件分析】 事件分析,是指用户在 APP、网站等应用上发生的行为,即何人,何时&…...

射频识别(RFID)技术的基本原理、特性、发展和应用

何谓射频识别 随着高科技的蓬勃发展,智能化管理已经走进了人们的社会生活,一些门禁卡、第二代身份证、公交卡、超市的物品标签等,这些卡片正在改变人们的生活方式。其实秘密就在这些卡片都使用了射频识别技术,可以说射频识别已成…...

3.3 二维随机变量条件分布

学习目标: 要学习二维随机变量的条件分布,我可能会采取以下步骤: 复习边缘分布和联合分布:首先需要了解二维随机变量的边缘分布和联合分布的概念以及相应的公式。 复习条件概率:学习条件概率的定义和计算公式&#x…...

Kafka——概述、安装及命令行操作

文章目录一、概述1.1、定义1.2、如何运作?1.3、传统消息队列的应用场景1.4、消息队列的两种模式1.5、Kafka的基础架构二、安装(需要安装zookeeper)三、常用命令行操作3.1、主题命令行操作3.2、生产者命令行操作3.3、消费者命令行操作一、概述…...

怎么控制ERP企业管理系统开发的价格

企业资源规划(ERP)是一种广泛使用的商业软件系统,用于管理企业的各个方面,包括财务、供应链、客户关系、人力资源等等。开发一个适合企业的ERP系统可能是一项昂贵的任务,但控制ERP企业管理系统开发的价格是可行的。以下…...

我在“Now In Android”中学到的 9 件事

我在“Now In Android”中学到的 9 件事 Now in Android是一款功能齐全的 Android 应用程序,完全使用 Kotlin 和 Jetpack Compose 构建。它遵循 Android 设计和开发最佳实践,旨在为开发人员提供有用的参考。 https://github.com/android/nowinandroid UI…...

ChatGPT宝藏插件丨装上之后,上网、语音聊天、一键分享对话……简直让你爽到起飞!

今天分享4个让你的 ChatGPT 功能更强大的浏览器插件,装上就能用,每一个都是精挑细选。 1. WebChatGPT 很多小伙伴在用 ChatGPT查阅信息时,发现它有一个致命的问题: ChatGPT的知识库全部截止到 2021年9月,正常情况下…...

私有句柄表

私有句柄表 实验环境 win7 x86 什么是私有句柄表? 私有句柄表是操作系统内部的一种数据结构,用于存储一个进程所拥有的句柄(或称为句柄对象)的信息。在操作系统中,句柄是一个标识符,用于唯一标识一个对…...

Vue——类与样式绑定

目录 Class 与 Style 绑定​ 绑定 HTML class​ 绑定对象​ 绑定数组​ 在组件上使用​ 绑定内联样式​ 绑定对象​ 绑定数组​ 自动前缀​ 样式多值​ Class 与 Style 绑定​ 数据绑定的一个常见需求场景是操纵元素的 CSS class 列表和内联样式。因为 class 和 styl…...

软考中项计算题总结

计算题在下午的考试属于重中之重,可以说得计算题得天下,先把计算题搞定,再看案例找错题,这2个是最容易得分的,所以对于进度、成本类的计算题一定要搞懂: 所属项目过程计算计算公式说明进度管理三点估算&am…...

如何使用基于GPT-4的Cursor编辑器提升开发效率

程序员最恨两件事情:一是别人代码不写文档,二是要让自己写文档。随着 GPT-4 的到来这些都不是问题了,顺带可能连程序员都解决了。。。 之前一直觉得 AI 生成的代码也就写个面试题的水平,小打小闹,现在时代可变了。Curs…...

压箱底教程分享,手把手教会你如何注册target账号和下单

喜欢套利的朋友肯定都认识target这个平台吧,它是美国热门的综合性海淘网站之一。东哥近日收到私信有朋友向我请教在注册target账号时遇到的一些问题,所以今天东哥想跟大家分享的就是就是target账号注册教程和下单流程,让也想注册target账号的…...

一次性搞懂dBSPL、dBm、dBu、dBV、dBFS的区别!

相信学习音乐制作的同学在混音阶段经常会碰到各种关于声音的单位,其中最具代表性的可能就是分贝家族的单位了,如dBSPL、dBm、dBu、dBV、dBFS等。 那么,这些单位分别表示什么,又有什么区别呢? 描述声音信号强弱的单位…...

漂亮实用的15个脑图模板,你知道哪些是AI做的吗?

对于很多第一次接触到思维导图的朋友,看到软件的时候往往找不到方向,不知道如何创作? 今天大家的好助手来了。 一是有大量的思维导图模板,大家看着模板做,慢慢就会做了。 二是ProcessOn 思维导图已经可以用AI 做思维…...

历代程序员都无法逃脱的诅咒 -- 低代码

1764年5月4日星期四 愤怒的纺织工人 纵火烧毁了哈格里夫斯的家 因为他发明的珍妮纺织机 让很多当地的手工纺织工人失业了 这也被认为是第一次工业革命的开端 由于事发的星期四 所以这一事件也被称作疯狂星期四 类似的变革 也一次次的出现在软件行业 他是历代程序员都无法逃脱的…...

14Exceptional Control Flow Exceptions and Process(异常控制流,异常和进程)

异常控制流 异常控制流出现的地方: 异常控制流(Exceptional Control Flow,ECF)是程序执行过程中由于某些特殊事件或条件而导致的控制流的改变。异常控制流通常出现在以下几种情况: 硬件异常和中断:硬件异…...

LeetCode - 两数之和

题目信息 源地址:两数之和 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出和为目标值 target 的那两个整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不…...

Python 小型项目大全 31~35

三十一、猜数字 原文:http://inventwithpython.com/bigbookpython/project31.html 猜数字是初学者练习基本编程技术的经典游戏。在这个游戏中,电脑会想到一个介于 1 到 100 之间的随机数。玩家有 10 次机会猜出数字。每次猜中后,电脑会告诉玩…...

他又赚了一万美金

有一些学员真的挺能干的,收了一万刀,感到欣慰,毕竟在国外lead这条路,有很多人被骗,也有很多人赚钱。 但是大部分人跟着某一些所谓的大佬,最后自己却不动手操作。 ​ 从一开始怕跟我学习,到最后选…...

企业工程项目管理系统+spring cloud 系统管理+java 系统设置+二次开发

工程项目各模块及其功能点清单 一、系统管理 1、数据字典:实现对数据字典标签的增删改查操作 2、编码管理:实现对系统编码的增删改查操作 3、用户管理:管理和查看用户角色 4、菜单管理:实现对系统菜单的增删改查操…...

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻

在如今就业市场竞争日益激烈的背景下,越来越多的求职者将目光投向了日本及中日双语岗位。但是,一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧?面对生疏的日语交流环境,即便提前恶补了…...

云计算——弹性云计算器(ECS)

弹性云服务器:ECS 概述 云计算重构了ICT系统,云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台,包含如下主要概念。 ECS(Elastic Cloud Server):即弹性云服务器,是云计算…...

多场景 OkHttpClient 管理器 - Android 网络通信解决方案

下面是一个完整的 Android 实现&#xff0c;展示如何创建和管理多个 OkHttpClient 实例&#xff0c;分别用于长连接、普通 HTTP 请求和文件下载场景。 <?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas…...

STM32+rt-thread判断是否联网

一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...

OkHttp 中实现断点续传 demo

在 OkHttp 中实现断点续传主要通过以下步骤完成&#xff0c;核心是利用 HTTP 协议的 Range 请求头指定下载范围&#xff1a; 实现原理 Range 请求头&#xff1a;向服务器请求文件的特定字节范围&#xff08;如 Range: bytes1024-&#xff09; 本地文件记录&#xff1a;保存已…...

使用van-uploader 的UI组件,结合vue2如何实现图片上传组件的封装

以下是基于 vant-ui&#xff08;适配 Vue2 版本 &#xff09;实现截图中照片上传预览、删除功能&#xff0c;并封装成可复用组件的完整代码&#xff0c;包含样式和逻辑实现&#xff0c;可直接在 Vue2 项目中使用&#xff1a; 1. 封装的图片上传组件 ImageUploader.vue <te…...

【论文笔记】若干矿井粉尘检测算法概述

总的来说&#xff0c;传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度&#xff0c;通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

自然语言处理——Transformer

自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效&#xff0c;它能挖掘数据中的时序信息以及语义信息&#xff0c;但是它有一个很大的缺陷——很难并行化。 我们可以考虑用CNN来替代RNN&#xff0c;但是…...

【JavaWeb】Docker项目部署

引言 之前学习了Linux操作系统的常见命令&#xff0c;在Linux上安装软件&#xff0c;以及如何在Linux上部署一个单体项目&#xff0c;大多数同学都会有相同的感受&#xff0c;那就是麻烦。 核心体现在三点&#xff1a; 命令太多了&#xff0c;记不住 软件安装包名字复杂&…...