数据分析基础-数据可视化07-用数据分析讲故事
· 如何构建⼀个引⼈⼊胜的故事?
⾸先:要想象什么?
· 可视化什么⽐如何可视化更重要
· 统计分析:GIGO(垃圾输⼊,垃圾输出)
· 在可视化分析环境中:
吉⾼ → 您⽆法从可视化的不适当数据中获得太多信息。
· 因此,⽬标是:“垃圾,⾦⼦出去”
下⼀篇:你为什么要想象?
两个主要原因:
· 理解/解释数据
· 组织/整理数据并解释数据的趋势/特征
· 不得煽动观众。
· 让数据说话。
· 获得新的假设/⻅解
· 使⽤可视化来帮助获得新的假设
· 让⽤⼾从不同的⻆度查看数据。
然后:设置 KGI 和 KPI
⼀旦您决定了可视化的⽬标对象/概念:
· 需要设定KGI(关键⽬标指标)和KPI(关键绩效指标)。
· 凯基证券将定量评估要可视化的对象/概念
· KPI 源⾃KGI,描述了实现KGI 需要做什么。
· 例如,EC 站点销售额的增加
· 凯基证券:增加销售额,
· KPI:客⼾数量、每个客⼾的价格、客⼾持续性等。
关键绩效指标详情
· ⽰例:Web 服务
· 典型KPI之⼀:客⼾持久性
· 您将如何确定“客⼾忠诚度”的适当定义?
· 5 天/周?、每天?、1 天/⽉(对于昂贵的物品)?
· 持久性的定义是否适合您的 Web 服务类型?
· 还有其他例⼦吗?
· 与健康有关?
造型
建模中不同类型的变量
· ⽬标变量:使⽤模型解释的变量
· 销售瓶装⽔
· 解释变量:解释⽬标变量的变量
· 温度、价格、季节
· ⼯具/操纵变量:解释变量,其值可以控制(更改)。
· 价格
选择变量
· 区分⼯具变量和⾮⼯具变量很重要
· 温度每升⾼ 1 度,WB 销售额就会增加 7%
· 但是,您⽆法操纵温度……使⽤此解释变量来有意增加销量没有⽤处。
· W.Bs 的价格可以被操纵。
· 选择适当的解释变量对于通过交互式可视化创建和探索数据空间⾮常重
要。
选择 KPI
⽰例:EC位点分析
关键绩效指标
唯⼀⽤⼾ (UU) 注册的唯⼀⽤⼾
每⽇活跃⽤⼾ (DAU) 每天登录的唯⼀⽤⼾数
每⽉活跃⽤⼾ (MAU) 每⽉⾄少使⽤该服务⼀次的唯⼀⽤⼾
购买⽤⼾ (PU) 购买过的唯⼀⽤⼾
每⽤⼾平均收⼊ (ARPU) 销售额/⽇活跃⽤⼾数
每个购买⽤⼾的平均收⼊ (ARPPU) 销售/PU
坚持 在指定时间段内使⽤该服务的唯⼀⽤⼾
转换率 成功参与/购买特定促销/⽬标商品的唯⼀⽤⼾
活跃⽐率 DAU / 会员总数
提取 退出的唯⼀⾝份⽤⼾
点击次数 ⼴告点击次数
⻚⾯预览 访问某些⻚⾯的数量
每次⾏动成本 获取⼀名⽤⼾的成本(营销活动成本/您获取的⽤⼾数量)
KPI 应该… - 第⼀部分
· 与凯基证券直接相关
· 蝴蝶效应 :
“巴西蝴蝶翅膀的扇动是否会在德克萨斯州引发⻰卷⻛?“——爱德华·诺顿·洛伦兹
(1972)
· 对于KPI值的变化,关联唯⼀的解释
· ARPU(每⽤⼾平均收⼊):销售额/DAU(每⽇活跃⽤⼾)
· 如果 ARPU 下降,是因为
· 总购买量减少了?
· DAU 因某些促销活动⽽激增?
KPI 应该… - 第⼆部分
· 从最低必要性开始
· 不要增加 KPI 数量(可视化变量)
· ⽤⼾当时只能理解少量的视觉变量
· 例如,如果“销售额”是 KGI,则您只需要 DAU、ARPPU 和转化率
KPI 应该… - 第三部分
· 明确规定
· “⻚⾯浏览量”是⼀个好的 KPI 吗?
· ⻚⾯查看:显⽰⻚⾯时增加计数
· 弹出窗⼝怎么样?
· ⻓⻚怎么样
· 您可能需要记录适当的⽤⼾活动⽇志
· 您会使⽤什么类型的信息来代替⻚⾯视图?
KPI 应该… - 第四部分
· 根据数据类型分类
· 回到
· 定性
· 定量
· 绝对的
· 序数
· 间隔(可以+/-)
· ⽐率(可以做+、-、*、/)
根据数据类型对 KPI 进⾏分类
例⼦
· USS 分数(学习调查单元)
(1) ⾮常不同意 (2) 不同意 (3) 中性 (4) 同意 (5) ⾮常同意
· USS 平均得分为
· ⼤学为 3.2
· X 学院为 3.4
· 研究 Y 的单位为 4.2
- 会出现什么问题?
- 适当的⽤途是什么?
- 我们应该展⽰什么?
关键绩效指标导出
⽅法
如果您的原始数据集中没有适当的 KPI 数据,
请考虑通过以下⽅式使⽤现有数据导出它们:
如果你不这样做
找到关键绩效指标,
建造它们!
· 合并数据
合并数据
合并多个数据以创建新的 KPI
· BMI = 体重/(⾝⾼^2)
转换数据
· 转换数据
· 使⽤⽐较指标
· 使⽤汇总统计数据
· 公制转换
· 费⽤:$ -> ⾼/中/低
· 维度较少的数据
· ⽐率(占总数的百分⽐)
· 问题?(胜率、击杀死亡率)
· 标准化
· 标准分数:将分布拟合为(平均:50,标准:10)
使⽤⽐较指标——第⼀部分
例⼦
· 上半场:服务 A 有 100,000 UU,服务 B 有 10,000 UU
· 下半场:服务 A 有 110,000 UU,服务 B 有 15,000 UU
指标
· 差异:服务 A 增加了 10K UU,服务 B 增加了 5K UU
· ⽐率:服务A 的UU 增加10%,服务B 的UU 增加50%
- 哪⼀种更适合衡量影响⼒?
- 哪⼀种更适合衡量增⻓?
使⽤⽐较指标——第⼆部分
· 与不同⽬标进⾏⽐较:
· 许多孩⼦使⽤服务“X”,因此应该定制服务“X”以适合孩⼦。
· 我们是否应该检查其他年龄段的⽐例?
· 您可能会发现>65 岁的年龄组可能具有相似的⽐例……。这是什么意思?
· 相同⽬标类型的时间⽐较:
· 绝对值
· 指数:上个⽉销量为100,本⽉销量为120,指数=1.2
· 变化:120 ‒ 100 = 20。
· 变化率:20 / 100 = 0.2
使⽤⽐较指标 - 第三部分
· 不同⽬标类型的时间⽐较:
· ⼯会就加薪进⾏谈判
· 公司年利润增加
· ⼯资增加
- 公司将使⽤什么 KPI 来避免⼯资上涨?
- ⼯会应该使⽤什么 KPI 来说服加薪?
使⽤汇总统计数据
· 平均的
· 中位数
· 最常⻅的值
概括
· 根据您的⽬标确定/选择 KGI/KPI
· 了解为什么要可视化某些类型的数据
· 了解为什么要使⽤某些视觉变量/⽅法
相关文章:
数据分析基础-数据可视化07-用数据分析讲故事
如何构建⼀个引⼈⼊胜的故事? ⾸先:要想象什么? 可视化什么⽐如何可视化更重要 统计分析:GIGO(垃圾输⼊,垃圾输出) 在可视化分析环境中: 吉⾼ → 您⽆法从可视化的不适当数据中获…...
策略模式简介
概念: 策略模式(Strategy Pattern)是一种行为型设计模式,它定义了一系列算法,并将每个算法封装到独立的类中,使得它们可以互相替换。通过使用策略模式,客户端可以在运行时选择不同的算法来解决…...
学术加油站|基于端到端性能的学习型基数估计器综合测评
编者按 本文系东北大学李俊虎所著,也是「 OceanBase 学术加油站」系列第 11 篇内容。 「李俊虎:东北大学计算机科学与工程学院在读硕士生,课题方向为数据库查询优化,致力于应用 AI 技术改进传统基数估计器,令数据库选…...
MySQL 使用规范 —— 如何建好字段和索引
一、案例背景 二、库表规范 1. 建表相关规范 2. 字段相关规范 3. 索引相关规范 4. 使用相关规范 三、建表语句 三、语句操作 1. 插入操作 2. 查询操作 四、其他配置 1. 监控活动和性能: 2. 连接数查询和配置 本文的宗旨在于通过简单干净实践的方式教会读…...
Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt Tuning
本文是LLM系列文章,针对《Relation Extraction as Open-book Examination: Retrieval 关系提取作为开卷测试:检索增强提示调整 摘要1 引言2 方法3 实验4 相关工作5 结论 摘要 经过预训练的语言模型通过表现出显著的小样本学习能力,对关系提取…...
FFmpeg报错:Connection to tcp://XXX?timeout=XXX failed: Connection timed out
一、现象 通过FFmpeg(FFmpeg的版本是5.0.3)拉摄像机的rtsp流获取音视频数据,执行命令: ./ffmpeg -timeout 3000000 -i "rtsp://172.16.17.156/stream/video5" 报错:Connection to tcp://XXX?timeoutXXX …...
iOS开发Swift-7-得分,问题序号,约束对象,提示框,类方法与静态方法-趣味问答App
1.根据用户回答计算得分 ViewController.swift: import UIKitclass ViewController: UIViewController {var questionIndex 0var score 0IBOutlet weak var questionLabel: UILabel!IBOutlet weak var scoreLabel: UILabel!override func viewDidLoad() {super.viewDidLoad()…...
AUTOSAR规范与ECU软件开发(实践篇)7.10MCAL模块配置方法及常用接口函数介绍之Base与Resource的配置
目录 1、前言 2 、Base与Resource模块 1、前言 本例程的硬件平台为MPC5744P开发板,主要配置MPC5744P的mcal的每个模块的配置,如要配置NXP的MCU之S32k324的例程请参考: 2 、Base与Resource模块 Base与Resource这两个模块与具体功能无关&…...
Android11编译第二弹:USB连接MTP模式+USB调试+USB信任
一、为什么需要开启USB信任和ADB调试 问题1:原始的AOSP,如果通过USB连接设备以后,会弹窗提示用户选择连接模式:MTP,大容量磁盘,照片等模式; 问题2:USB连接设备以后,需要…...
Unity ShaderGraph教程——基础shader
1.基本贴图shader: 基础贴图实现:主贴图、自发光贴图、光滑度贴图、自发光贴图(自发光还加入了颜色影响和按 钮开关). 步骤:最左侧操作组——新建texture2D——新建sample texture 2D承…...
第 3 章 栈和队列(单链队列)
1. 背景说明 队列(queue)是一种先进先出(first in first out,缩为 FIFO)的线性表。它只允许在表的一端进行插入,而在另一端删除元素。 2. 示例代码 1)status.h /* DataStructure 预定义常量和类型头文件 */#ifndef STATUS_H #define STATUS_H/* 函数结果…...
【DFS】1254. 统计封闭岛屿的数目
1254. 统计封闭岛屿的数目 解题思路 封闭岛屿就是上下左右全部被1包围的0 也就是靠边的0不算做封闭岛屿首先将上下左右的边界上的岛屿全部变成海洋然后在对剩下的岛屿进行DFS遍历 class Solution {public int closedIsland(int[][] grid) {// 封闭岛屿就是上下左右全部被1包…...
C#--sugarClient使用之ColumnName
使用Sugar ORM框架可以很方便地实现表名和实体名的映射,可以按照以下步骤进行操作: 创建一个实体类,定义实体的属性及其他信息。 [SugarTable("user_info")] // 指定实体对应的表名 public class User {public int Id { get; set…...
深度学习-4-二维目标检测-YOLOv5源码测试与训练
本文采用的YOLOv5源码是ultralytics发行版3.1 YOLOv5源码测试与训练 1.Anaconda环境配置 1.1安装Anaconda Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科学计算、数据分析的 Python 包。 官方网址下载安装包&…...
找不到msvcp140.dll的解决方法【msvcp140.dll修复工具下载】
今天,我将为大家分享一个与我们日常工作息息相关的话题——msvcp140.dll重新安装的5种解决方法。在接下来的时间里,我将向大家介绍什么是msvcp140.dll,为什么会丢失,以及它的用途。最后,我将为大家提供5种解决方法,帮助…...
内网隧道代理技术(二十)之 CS使用HTTP代理上线不出网机器
CS使用HTTP代理上线不出网机器 CS工具自带上线不出网机器 如图A区域存在一台中转机器,这台机器可以出网,这种是最常见的情况。我们在渗透测试的过程中经常是拿下一台边缘机器,其有多块网卡,边缘机器可以访问内网机器,内网机器都不出网。这种情况下拿这个边缘机器做中转,…...
安卓 tcp 客户端
安卓 tcp 客户端 Server:8888 是Qt 写的Tcp 服务器 ip 是 192.168.2.103 port是8888 安卓手机运行 kotlin 语法的Tcp Client ,连接,收发数据 效果如下图 Tcpclient package com.example.myapplicationimport android.os.Handler import android.os.Loo…...
flutter plugins插件【三】【Flutter Intl】
3、 Flutter Intl 多语言国际化 在Android Studio中菜单Tools找到flutter intl创建多语言配置。 创建后会在pubspec.yaml出现 flutter_intl:enabled: true 在工程的lib会生成l10n与generated文件夹 l10n包含 intl_en.arb intl_zn.arb 我们在intl_en.arb添加 { home: &quo…...
简单了解ICMP协议
目录 一、什么是ICMP协议? 二、ICMP如何工作? 三、ICMP报文格式 四、ICMP的作用 五、ICMP的典型应用 5.1 Ping程序 5.2 Tracert(Traceroute)路径追踪程序 一、什么是ICMP协议? ICMP因特网控制报文协议是一个差错报告机制,…...
MVCC究竟是什么?
1.MVCC概念 MVCC,全称多版本并发控制 MVCC究竟是什么? 通俗的来说MVCC就是为了在读取数据时不加锁来提高读取效率的一种办法,MVCC解决的是读写时线程安全问题,线程不用去抢占读写锁。MVCC中的读就是快照读,…...
wordpress后台更新后 前端没变化的解决方法
使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…...
应用升级/灾备测试时使用guarantee 闪回点迅速回退
1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间, 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点,不需要开启数据库闪回。…...
三维GIS开发cesium智慧地铁教程(5)Cesium相机控制
一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点: 路径验证:确保相对路径.…...
Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
前端倒计时误差!
提示:记录工作中遇到的需求及解决办法 文章目录 前言一、误差从何而来?二、五大解决方案1. 动态校准法(基础版)2. Web Worker 计时3. 服务器时间同步4. Performance API 高精度计时5. 页面可见性API优化三、生产环境最佳实践四、终极解决方案架构前言 前几天听说公司某个项…...
python/java环境配置
环境变量放一起 python: 1.首先下载Python Python下载地址:Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个,然后自定义,全选 可以把前4个选上 3.环境配置 1)搜高级系统设置 2…...
【网络安全产品大调研系列】2. 体验漏洞扫描
前言 2023 年漏洞扫描服务市场规模预计为 3.06(十亿美元)。漏洞扫描服务市场行业预计将从 2024 年的 3.48(十亿美元)增长到 2032 年的 9.54(十亿美元)。预测期内漏洞扫描服务市场 CAGR(增长率&…...
linux 错误码总结
1,错误码的概念与作用 在Linux系统中,错误码是系统调用或库函数在执行失败时返回的特定数值,用于指示具体的错误类型。这些错误码通过全局变量errno来存储和传递,errno由操作系统维护,保存最近一次发生的错误信息。值得注意的是,errno的值在每次系统调用或函数调用失败时…...
微服务商城-商品微服务
数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...
成都鼎讯硬核科技!雷达目标与干扰模拟器,以卓越性能制胜电磁频谱战
在现代战争中,电磁频谱已成为继陆、海、空、天之后的 “第五维战场”,雷达作为电磁频谱领域的关键装备,其干扰与抗干扰能力的较量,直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器,凭借数字射…...
