当前位置: 首页 > news >正文

读书笔记//来自公众号(1)

——【9大数据分析方法】——

总结1:多部分方法用于定位问题,相关分析法与指标拆解法可以解释问题。
总结2:抓住两个关键因素:维度(类别)、指标

一、周期性分析

1.常见的周期包括2种:自然周期/生命周期。

  • 自然周期:指标随时间推移而自然发生波动。
  • 生命周期依据对象分为3类:商品生命周期,app生命周期,用户生命周期。参考线:时间轴+指标走势。如:第1天/第2天/第3天,天/周/月。

2.周期性分析的作用:做出一个参考曲线,为进一步判断提供依据。

二、结构分析

1.结构分析,对指标在维度上做层层拆解和对比,如用户、行业、渠道、区域、产品等维度。
2.结构分析的作用:把握结构变化情况,追踪指标走势,能快速定位问题发生点,为进一步针对性提出解决方案提供方向。

三、分层分析

1.用户分群、商品ABC分析、行业二八法则,本质就是分层分析。
2.分层分析,针对单一指标,是为了应对平均值失效的场景,如异常值、极大值等
3.设定分层的层级的方法: “二四六八十”法则

  • 比平均值高的,根据平均值的2倍、4倍、6倍、、分层。
  • 比平均值低的,根据平均值的1/2、1/4分层。
    4.分层分析的作用:是其他分析的前哨战,做好分层,能引发更多思考和分析。
    5.单一指标用分层分析,两个指标用矩阵分析,多个指标用DEA模型。

四、矩阵分析

1.矩阵分析,对两个指标各自确定一个阈值分类点,划分出4个象限,把分析对象映射到矩阵图上。阈值客观上可以取平均数,主观上可以根据专家判断、或资源承受力等。
2.矩阵分析的作用:从两个指标交叉对比种发现问题。
3.常见的KANO模型(用户需求分析)和波士顿矩阵(企业实力分析),本质就是找两个评价指标,构造交叉矩阵,对业务分类。两个指标可以是互相矛盾的(收入规模和利润)、或互相促进的(增长率和占有率)。
4.有两个场景不适合用矩阵分析,①有极值影响平均数,②两个指标高度相关。

五、指标拆解

1.常见指标关系:

  • 并列关系(相互独立),如业绩=客户数x消费率x客单价
  • 串行关系(前后关系),如漏斗模型最后一个指标的逆推

2.固定的指标拆解法:财务分析领域的杜邦分析(利润=收入-成本),零售行业的人货场模型。

3.指标拆解的流程:

  • 找到主指标
  • 找到负责主指标的部门
  • 确认子指标可采集到数据
  • 列车拆解公式,进行数据对比

4.指标拆解的作用:可以发现问题,解释问题。

六、漏斗分析

1.漏斗分析,可处理多个指标,指标对应业务在流程上有顺序关系。
2.漏斗分析的作用:可以看到问题发生在哪里,但无法解释。

七、相关分析

1.直接相关,即有些指标之间天然存在关系,有三种形式:

  • 在结构分析法种,整体指标与部分指标之间的关系
  • 在指标拆解中,主指标与子指标之间的关系
  • 在漏斗分析法中,前后步骤指标之间的关系
    2.间接相关。有两种常用分析方法:散点图、计算相关系数。
    3.相关分析法的不足:
  • 相关不等于因果
  • 相关分析不能解决非量化指标因素。有时候我们寻找关系的因素不能量化,如装修风格。关于非量化特征与指标的关系,用标签分析法。
    4.相关分析的作用:可以解释问题、可以预测。

八、标签分析

1.标签分析,把难以量化的因素转化为标签类别,比较不同标签下指标的差异。
2.标签化要确保标准统一、达成统一认识。
3.qx感觉标签分析与结构分析有很多相似之处。

九、MECE法

1.当有太多因素影响分析不知从何入手,可以用MECE把影响因素梳理清楚。先把最大因素分离出来,再分离小的因素。由大到小,逐步剥洋葱。
2.MECE指的是相互独立、完全穷尽的分类原则,可采用二分法(A和非A)。
3.该方法的不足是,有些因素无法量化,有时候缺乏数据。

——【必备7大能力】——

能力一:理解业务
业务流程、业务动作、业务方期望的结果
能力二:梳理需求
清晰的需求要说清楚5W:
who:数据使用者
when:数据使用时间
where:数据使用场合
why:使用数据原因(做监控?找原因?做预测?)
what:具体数据格式
能力三:梳理指标体系
qx根据我的项目经验,一开始的指标比较基础,往往为了满足监控和效果统计,随着业务深入开展,需要查找指标异常原因,在分析中提炼固化一些指标。业务发生变化,如变动更复杂更多样,相应要增加指标,同时理清指标间的关系。
能力四:梳理标签体系
注意:业务部门对标签有约定俗成的说法,不同部门之间标签口径混乱不一。能沟通一致最好,不能的话出报告要备注。
能力五:选择分析方法——数据分析
预测类方法:用哪个模型?
原因类方法:从哪个角度切入?如果构建逻辑链?
检验类方法:假设是什么?从哪个角度检验?
评估类方法:从哪些角度评估更合理、全面?
能力六:设计数据实验
结合业务流程,设计实验方法,要考虑具体问题:如抽样方式、样本量等等。
能力七:输出数据报告
做好汇报,很考验综合能力。数据分析首先是描述和发现问题。异常指标往往指向对应业务的负责人/负责部门,这是个找茬的活儿啊。
业务通常会找各种理由:

  • 质疑数据
  • 活动不如预期、指标不达标,如“自然增长率”计算不合理,或者大环境不行

本篇整理来自微信公众号【码工小熊】。作者在互联网大厂从事数据分析,很勤快,写了很多总结。有一些真知灼见,值得摘要。

相关文章:

读书笔记//来自公众号(1)

——【9大数据分析方法】—— 总结1:多部分方法用于定位问题,相关分析法与指标拆解法可以解释问题。 总结2:抓住两个关键因素:维度(类别)、指标 一、周期性分析 1.常见的周期包括2种:自然周期…...

10款让程序员用了会上瘾的工具

程序员必定会爱上的10款工具,相信肯定有不少是你的心头好,尤其是第4款。 第一款:TrueCryptTrueCrypt 可能很多人没用过,它是一个加密软件,能够对磁盘进行加密。还在担心自己电脑中的重要文件、私密档案被人查看&…...

类和对象(下)(一)

类和对象(下)(一)1.再谈构造函数1.1构造函数体赋值1.2初始化列表1.3explicit关键字2.static成员2.1概念2.2特性3.匿名对象🌟🌟hello,各位读者大大们你们好呀🌟🌟 &#x…...

46.在ROS中实现global planner(2)

前文实现了一个global planner的模板,并且可以工作,本文将实现astar算法,为后续完成一个astar global planner做准备 1. AStar简介 1.1 AStar Astar算法是一种图形搜索算法,常用于寻路。Astar算法原理网上可以找到很多,简单的说…...

05- 泰坦尼克号海难生死预测 (机器学习集成算法) (项目五)

Kaggle: 一个数据建模和数据分析竞赛平台sns画柱状图: sns.barplot(datatrain,xPclass,ySurvived)查看数据分布(survived 和 fare): sns.FacetGrid(train,hueSurvived,aspect3) ageFacetsns.FacetGrid(train,hueSurvived,aspect3) ageFacet.map(sns.kdeplot,Fare,shadeTrue) …...

【python百炼成魔】python运算符的使用与输入输出函数

文章目录前言一. python 运算符1.1 算术运算符1.2 .赋值运算符1.3 比较运算符1.4. 布尔运算符二. 输入和输出函数2.1 print函数2.1.1 help函数查看帮助文档2.1.2 print的格式化输出2.2 format函数2.3 input数据接收函数写在最后前言 Python 中的运算符主要分为算术运算符、比较…...

uniapp实现app检查更新与升级-uni-upgrade-center详解

app检查更新与升级 参考链接: 升级中心uni-upgrade-center - App uni-admin h5 api App资源在线升级更新 uni-app使用plus注意事项 关于在线升级(WGT)的几个疑问 什么是升级中心uni-upgrade-center uniapp官方开发的App版本更新的插件&#…...

公司项目引入这种方式,开发应用真是又快又准!

试想一下,你开足马力提了一串需求,给开发精英团队也好,给外包也行,都要等个半年甚至更久才会给到你一个满意的产品,你是否还有动力? 这还不止,业务越来越复杂,最初的需求也在随着着…...

virtuoso数据库介绍

在国内,对海量 RDF 数据的管理有着迫切的实际需求; RDF:Resource Description Framework,是一个使用XML语法来表示的资料模型(Data model),用来描述Web资源的特性,及资源与资源之间的关系。 Virtuoso可以对…...

linux高级命令之编辑器 vim

编辑器 vim学习目标能够说出vim的三种工作模式能够说出vim对应复制和粘贴命令1. vim 的介绍vim 是一款功能强大的文本编辑器,也是早年 Vi 编辑器的加强版,它的最大特色就是使用命令进行编辑,完全脱离了鼠标的操作。2. vim 的工作模式命令模式…...

分布式光伏储能系统的优化配置方法(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...

Grafana loki部署及使用及问题处理方法(超详细)

一、下载软件 因为我是本地测试,所以用的windows版本的包,loki服务window版本的安装包下载地址:下载地址,选择 promtail-windows版本的安装包下载地址:下载地址 Grafana服务的下载地址:下载地址 二、配置…...

vue项目如何使用 SheetJS(xlsx)插件?

简言 SheetJS是一款非常好用的前端处理表格文件的工具。它分社区版和专业版,我们今天来介绍如何简单使用它的社区版。 SheetJS社区版官网 介绍 你应该打开官网浏览具体使用详情。 安装 打开官网在如上图的Installation板块中可以找到各种运行模块的使用方式。 …...

项目管理工具dhtmlxGantt甘特图入门教程(九):支持哪些数据格式(上篇)

dhtmlxGantt是用于跨浏览器和跨平台应用程序的功能齐全的Gantt图表,可满足项目管理控件应用程序的所有需求,是最完善的甘特图图表库这篇文章给大家讲解 dhtmlxGantt 的数据属性和数据库结构。 DhtmlxGantt正版试用下载(qun:764…...

iView Table合并单元格(行、列)

行/列合并设置属性 span-method 可以指定合并行或列的算法。该方法参数为 4 个对象:row: 当前行column: 当前列rowIndex: 当前行索引columnIndex: 当前列索引该函数可以返回一个包含两个元素的数组,第一个元素代表 rowspan,第二个元素代表 co…...

如何用P6软件编制项目进度计划(下)

卷首语 根据项目合同包含的工作范围进行工作分解(WBS),按照业主的要求及项目管理的需要,考虑不同阶段和层次,适时编制出项目管理所要求的的各级进度计划。 4搜集项目计划与进度控制相关信息 搜集与项目计划编制与进…...

环境配置完整指导——Installing C++ Distributions of PyTorch

目录一、前言二、动手开始做1. 安装cuda 11.42. 安装visual studio 2019 community3. 安装libtorch4. 安装mingw-w645. 配置环境变量6. 打开vscode开始写程序7. 运行程序8. 其他报错信息文章简介:这篇文章用于介绍在windows10 vscode中,跑通如下代码的全…...

深度学习——自注意力机制和位置编码(笔记)

1.自注意力: ①在深度学习中,经常使用卷积神经网络或者循环神经网络对序列进行编码 ②对于key,value和query,自注意力有一套自己的选法,因为key,value和query的值来自同一组输入。因此被称为自注意力或内部注意力 2…...

内网渗透(三十)之横向移动篇-利用远控工具向日葵横向移动

系列文章第一章节之基础知识篇 内网渗透(一)之基础知识-内网渗透介绍和概述 内网渗透(二)之基础知识-工作组介绍 内网渗透(三)之基础知识-域环境的介绍和优点 内网渗透(四)之基础知识-搭建域环境 内网渗透(五)之基础知识-Active Directory活动目录介绍和使用 内网渗透(六)之基…...

自动化测试中,该如何高效管理测试数据?

今晚在某个测试群,看到有人问了一个问题:把测试数据放配置文件读取和放文件通过函数调用读取有什么区别? 当时我下意识的这么回答:数据量越大,配置文件越臃肿,放在专门的数据文件(比如excel&am…...

AI-调查研究-01-正念冥想有用吗?对健康的影响及科学指南

点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...

idea大量爆红问题解决

问题描述 在学习和工作中,idea是程序员不可缺少的一个工具,但是突然在有些时候就会出现大量爆红的问题,发现无法跳转,无论是关机重启或者是替换root都无法解决 就是如上所展示的问题,但是程序依然可以启动。 问题解决…...

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介 对于社交类软件的功能,我们需要对它的功能特点进行分析: 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具: mysql:关系型数据库&am…...

Cesium1.95中高性能加载1500个点

一、基本方式&#xff1a; 图标使用.png比.svg性能要好 <template><div id"cesiumContainer"></div><div class"toolbar"><button id"resetButton">重新生成点</button><span id"countDisplay&qu…...

Python如何给视频添加音频和字幕

在Python中&#xff0c;给视频添加音频和字幕可以使用电影文件处理库MoviePy和字幕处理库Subtitles。下面将详细介绍如何使用这些库来实现视频的音频和字幕添加&#xff0c;包括必要的代码示例和详细解释。 环境准备 在开始之前&#xff0c;需要安装以下Python库&#xff1a;…...

鱼香ros docker配置镜像报错:https://registry-1.docker.io/v2/

使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题 一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题&#xff1a;docker pull 失败 网络不同&#xff0c;需要使用镜像源 按照如下步骤操作 sudo vi /etc/docker/dae…...

QT: `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中&#xff0c;将 long long 类型转换为 QString 可以通过以下两种常用方法实现&#xff1a; 方法 1&#xff1a;使用 QString::number() 直接调用 QString 的静态方法 number()&#xff0c;将数值转换为字符串&#xff1a; long long value 1234567890123456789LL; …...

浅谈不同二分算法的查找情况

二分算法原理比较简单&#xff0c;但是实际的算法模板却有很多&#xff0c;这一切都源于二分查找问题中的复杂情况和二分算法的边界处理&#xff0c;以下是博主对一些二分算法查找的情况分析。 需要说明的是&#xff0c;以下二分算法都是基于有序序列为升序有序的情况&#xf…...

Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理

引言 Bitmap&#xff08;位图&#xff09;是Android应用内存占用的“头号杀手”。一张1080P&#xff08;1920x1080&#xff09;的图片以ARGB_8888格式加载时&#xff0c;内存占用高达8MB&#xff08;192010804字节&#xff09;。据统计&#xff0c;超过60%的应用OOM崩溃与Bitm…...