数据分析基础-数据可视化07-用数据分析讲故事
· 如何构建⼀个引⼈⼊胜的故事?
⾸先:要想象什么?
· 可视化什么⽐如何可视化更重要
· 统计分析:GIGO(垃圾输⼊,垃圾输出)
· 在可视化分析环境中:
吉⾼ → 您⽆法从可视化的不适当数据中获得太多信息。
· 因此,⽬标是:“垃圾,⾦⼦出去”
下⼀篇:你为什么要想象?
两个主要原因:
· 理解/解释数据
· 组织/整理数据并解释数据的趋势/特征
· 不得煽动观众。
· 让数据说话。
· 获得新的假设/⻅解
· 使⽤可视化来帮助获得新的假设
· 让⽤⼾从不同的⻆度查看数据。
然后:设置 KGI 和 KPI
⼀旦您决定了可视化的⽬标对象/概念:
· 需要设定KGI(关键⽬标指标)和KPI(关键绩效指标)。
· 凯基证券将定量评估要可视化的对象/概念
· KPI 源⾃KGI,描述了实现KGI 需要做什么。
· 例如,EC 站点销售额的增加
· 凯基证券:增加销售额,
· KPI:客⼾数量、每个客⼾的价格、客⼾持续性等。
关键绩效指标详情
· ⽰例:Web 服务
· 典型KPI之⼀:客⼾持久性
· 您将如何确定“客⼾忠诚度”的适当定义?
· 5 天/周?、每天?、1 天/⽉(对于昂贵的物品)?
· 持久性的定义是否适合您的 Web 服务类型?
· 还有其他例⼦吗?
· 与健康有关?
造型
建模中不同类型的变量
· ⽬标变量:使⽤模型解释的变量
· 销售瓶装⽔
· 解释变量:解释⽬标变量的变量
· 温度、价格、季节
· ⼯具/操纵变量:解释变量,其值可以控制(更改)。
· 价格
选择变量
· 区分⼯具变量和⾮⼯具变量很重要
· 温度每升⾼ 1 度,WB 销售额就会增加 7%
· 但是,您⽆法操纵温度……使⽤此解释变量来有意增加销量没有⽤处。
· W.Bs 的价格可以被操纵。
· 选择适当的解释变量对于通过交互式可视化创建和探索数据空间⾮常重
要。
选择 KPI
⽰例:EC位点分析
关键绩效指标
唯⼀⽤⼾ (UU) 注册的唯⼀⽤⼾
每⽇活跃⽤⼾ (DAU) 每天登录的唯⼀⽤⼾数
每⽉活跃⽤⼾ (MAU) 每⽉⾄少使⽤该服务⼀次的唯⼀⽤⼾
购买⽤⼾ (PU) 购买过的唯⼀⽤⼾
每⽤⼾平均收⼊ (ARPU) 销售额/⽇活跃⽤⼾数
每个购买⽤⼾的平均收⼊ (ARPPU) 销售/PU
坚持 在指定时间段内使⽤该服务的唯⼀⽤⼾
转换率 成功参与/购买特定促销/⽬标商品的唯⼀⽤⼾
活跃⽐率 DAU / 会员总数
提取 退出的唯⼀⾝份⽤⼾
点击次数 ⼴告点击次数
⻚⾯预览 访问某些⻚⾯的数量
每次⾏动成本 获取⼀名⽤⼾的成本(营销活动成本/您获取的⽤⼾数量)
KPI 应该… - 第⼀部分
· 与凯基证券直接相关
· 蝴蝶效应 :
“巴西蝴蝶翅膀的扇动是否会在德克萨斯州引发⻰卷⻛?“——爱德华·诺顿·洛伦兹
(1972)
· 对于KPI值的变化,关联唯⼀的解释
· ARPU(每⽤⼾平均收⼊):销售额/DAU(每⽇活跃⽤⼾)
· 如果 ARPU 下降,是因为
· 总购买量减少了?
· DAU 因某些促销活动⽽激增?
KPI 应该… - 第⼆部分
· 从最低必要性开始
· 不要增加 KPI 数量(可视化变量)
· ⽤⼾当时只能理解少量的视觉变量
· 例如,如果“销售额”是 KGI,则您只需要 DAU、ARPPU 和转化率
KPI 应该… - 第三部分
· 明确规定
· “⻚⾯浏览量”是⼀个好的 KPI 吗?
· ⻚⾯查看:显⽰⻚⾯时增加计数
· 弹出窗⼝怎么样?
· ⻓⻚怎么样
· 您可能需要记录适当的⽤⼾活动⽇志
· 您会使⽤什么类型的信息来代替⻚⾯视图?
KPI 应该… - 第四部分
· 根据数据类型分类
· 回到
· 定性
· 定量
· 绝对的
· 序数
· 间隔(可以+/-)
· ⽐率(可以做+、-、*、/)
根据数据类型对 KPI 进⾏分类
例⼦
· USS 分数(学习调查单元)
(1) ⾮常不同意 (2) 不同意 (3) 中性 (4) 同意 (5) ⾮常同意
· USS 平均得分为
· ⼤学为 3.2
· X 学院为 3.4
· 研究 Y 的单位为 4.2
- 会出现什么问题?
- 适当的⽤途是什么?
- 我们应该展⽰什么?
关键绩效指标导出
⽅法
如果您的原始数据集中没有适当的 KPI 数据,
请考虑通过以下⽅式使⽤现有数据导出它们:
如果你不这样做
找到关键绩效指标,
建造它们!
· 合并数据
合并数据
合并多个数据以创建新的 KPI
· BMI = 体重/(⾝⾼^2)
转换数据
· 转换数据
· 使⽤⽐较指标
· 使⽤汇总统计数据
· 公制转换
· 费⽤:$ -> ⾼/中/低
· 维度较少的数据
· ⽐率(占总数的百分⽐)
· 问题?(胜率、击杀死亡率)
· 标准化
· 标准分数:将分布拟合为(平均:50,标准:10)
使⽤⽐较指标——第⼀部分
例⼦
· 上半场:服务 A 有 100,000 UU,服务 B 有 10,000 UU
· 下半场:服务 A 有 110,000 UU,服务 B 有 15,000 UU
指标
· 差异:服务 A 增加了 10K UU,服务 B 增加了 5K UU
· ⽐率:服务A 的UU 增加10%,服务B 的UU 增加50%
- 哪⼀种更适合衡量影响⼒?
- 哪⼀种更适合衡量增⻓?
使⽤⽐较指标——第⼆部分
· 与不同⽬标进⾏⽐较:
· 许多孩⼦使⽤服务“X”,因此应该定制服务“X”以适合孩⼦。
· 我们是否应该检查其他年龄段的⽐例?
· 您可能会发现>65 岁的年龄组可能具有相似的⽐例……。这是什么意思?
· 相同⽬标类型的时间⽐较:
· 绝对值
· 指数:上个⽉销量为100,本⽉销量为120,指数=1.2
· 变化:120 ‒ 100 = 20。
· 变化率:20 / 100 = 0.2
使⽤⽐较指标 - 第三部分
· 不同⽬标类型的时间⽐较:
· ⼯会就加薪进⾏谈判
· 公司年利润增加
· ⼯资增加
- 公司将使⽤什么 KPI 来避免⼯资上涨?
- ⼯会应该使⽤什么 KPI 来说服加薪?
使⽤汇总统计数据
· 平均的
· 中位数
· 最常⻅的值
概括
· 根据您的⽬标确定/选择 KGI/KPI
· 了解为什么要可视化某些类型的数据
· 了解为什么要使⽤某些视觉变量/⽅法
相关文章:
数据分析基础-数据可视化07-用数据分析讲故事
如何构建⼀个引⼈⼊胜的故事? ⾸先:要想象什么? 可视化什么⽐如何可视化更重要 统计分析:GIGO(垃圾输⼊,垃圾输出) 在可视化分析环境中: 吉⾼ → 您⽆法从可视化的不适当数据中获…...
策略模式简介
概念: 策略模式(Strategy Pattern)是一种行为型设计模式,它定义了一系列算法,并将每个算法封装到独立的类中,使得它们可以互相替换。通过使用策略模式,客户端可以在运行时选择不同的算法来解决…...
学术加油站|基于端到端性能的学习型基数估计器综合测评
编者按 本文系东北大学李俊虎所著,也是「 OceanBase 学术加油站」系列第 11 篇内容。 「李俊虎:东北大学计算机科学与工程学院在读硕士生,课题方向为数据库查询优化,致力于应用 AI 技术改进传统基数估计器,令数据库选…...
MySQL 使用规范 —— 如何建好字段和索引
一、案例背景 二、库表规范 1. 建表相关规范 2. 字段相关规范 3. 索引相关规范 4. 使用相关规范 三、建表语句 三、语句操作 1. 插入操作 2. 查询操作 四、其他配置 1. 监控活动和性能: 2. 连接数查询和配置 本文的宗旨在于通过简单干净实践的方式教会读…...
Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt Tuning
本文是LLM系列文章,针对《Relation Extraction as Open-book Examination: Retrieval 关系提取作为开卷测试:检索增强提示调整 摘要1 引言2 方法3 实验4 相关工作5 结论 摘要 经过预训练的语言模型通过表现出显著的小样本学习能力,对关系提取…...
FFmpeg报错:Connection to tcp://XXX?timeout=XXX failed: Connection timed out
一、现象 通过FFmpeg(FFmpeg的版本是5.0.3)拉摄像机的rtsp流获取音视频数据,执行命令: ./ffmpeg -timeout 3000000 -i "rtsp://172.16.17.156/stream/video5" 报错:Connection to tcp://XXX?timeoutXXX …...
iOS开发Swift-7-得分,问题序号,约束对象,提示框,类方法与静态方法-趣味问答App
1.根据用户回答计算得分 ViewController.swift: import UIKitclass ViewController: UIViewController {var questionIndex 0var score 0IBOutlet weak var questionLabel: UILabel!IBOutlet weak var scoreLabel: UILabel!override func viewDidLoad() {super.viewDidLoad()…...
AUTOSAR规范与ECU软件开发(实践篇)7.10MCAL模块配置方法及常用接口函数介绍之Base与Resource的配置
目录 1、前言 2 、Base与Resource模块 1、前言 本例程的硬件平台为MPC5744P开发板,主要配置MPC5744P的mcal的每个模块的配置,如要配置NXP的MCU之S32k324的例程请参考: 2 、Base与Resource模块 Base与Resource这两个模块与具体功能无关&…...
Android11编译第二弹:USB连接MTP模式+USB调试+USB信任
一、为什么需要开启USB信任和ADB调试 问题1:原始的AOSP,如果通过USB连接设备以后,会弹窗提示用户选择连接模式:MTP,大容量磁盘,照片等模式; 问题2:USB连接设备以后,需要…...
Unity ShaderGraph教程——基础shader
1.基本贴图shader: 基础贴图实现:主贴图、自发光贴图、光滑度贴图、自发光贴图(自发光还加入了颜色影响和按 钮开关). 步骤:最左侧操作组——新建texture2D——新建sample texture 2D承…...
第 3 章 栈和队列(单链队列)
1. 背景说明 队列(queue)是一种先进先出(first in first out,缩为 FIFO)的线性表。它只允许在表的一端进行插入,而在另一端删除元素。 2. 示例代码 1)status.h /* DataStructure 预定义常量和类型头文件 */#ifndef STATUS_H #define STATUS_H/* 函数结果…...
【DFS】1254. 统计封闭岛屿的数目
1254. 统计封闭岛屿的数目 解题思路 封闭岛屿就是上下左右全部被1包围的0 也就是靠边的0不算做封闭岛屿首先将上下左右的边界上的岛屿全部变成海洋然后在对剩下的岛屿进行DFS遍历 class Solution {public int closedIsland(int[][] grid) {// 封闭岛屿就是上下左右全部被1包…...
C#--sugarClient使用之ColumnName
使用Sugar ORM框架可以很方便地实现表名和实体名的映射,可以按照以下步骤进行操作: 创建一个实体类,定义实体的属性及其他信息。 [SugarTable("user_info")] // 指定实体对应的表名 public class User {public int Id { get; set…...
深度学习-4-二维目标检测-YOLOv5源码测试与训练
本文采用的YOLOv5源码是ultralytics发行版3.1 YOLOv5源码测试与训练 1.Anaconda环境配置 1.1安装Anaconda Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux, Mac, Windows, 包含了众多流行的科学计算、数据分析的 Python 包。 官方网址下载安装包&…...
找不到msvcp140.dll的解决方法【msvcp140.dll修复工具下载】
今天,我将为大家分享一个与我们日常工作息息相关的话题——msvcp140.dll重新安装的5种解决方法。在接下来的时间里,我将向大家介绍什么是msvcp140.dll,为什么会丢失,以及它的用途。最后,我将为大家提供5种解决方法,帮助…...
内网隧道代理技术(二十)之 CS使用HTTP代理上线不出网机器
CS使用HTTP代理上线不出网机器 CS工具自带上线不出网机器 如图A区域存在一台中转机器,这台机器可以出网,这种是最常见的情况。我们在渗透测试的过程中经常是拿下一台边缘机器,其有多块网卡,边缘机器可以访问内网机器,内网机器都不出网。这种情况下拿这个边缘机器做中转,…...
安卓 tcp 客户端
安卓 tcp 客户端 Server:8888 是Qt 写的Tcp 服务器 ip 是 192.168.2.103 port是8888 安卓手机运行 kotlin 语法的Tcp Client ,连接,收发数据 效果如下图 Tcpclient package com.example.myapplicationimport android.os.Handler import android.os.Loo…...
flutter plugins插件【三】【Flutter Intl】
3、 Flutter Intl 多语言国际化 在Android Studio中菜单Tools找到flutter intl创建多语言配置。 创建后会在pubspec.yaml出现 flutter_intl:enabled: true 在工程的lib会生成l10n与generated文件夹 l10n包含 intl_en.arb intl_zn.arb 我们在intl_en.arb添加 { home: &quo…...
简单了解ICMP协议
目录 一、什么是ICMP协议? 二、ICMP如何工作? 三、ICMP报文格式 四、ICMP的作用 五、ICMP的典型应用 5.1 Ping程序 5.2 Tracert(Traceroute)路径追踪程序 一、什么是ICMP协议? ICMP因特网控制报文协议是一个差错报告机制,…...
MVCC究竟是什么?
1.MVCC概念 MVCC,全称多版本并发控制 MVCC究竟是什么? 通俗的来说MVCC就是为了在读取数据时不加锁来提高读取效率的一种办法,MVCC解决的是读写时线程安全问题,线程不用去抢占读写锁。MVCC中的读就是快照读,…...
DeepSeek 赋能智慧能源:微电网优化调度的智能革新路径
目录 一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战 二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位 三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...
Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件
今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...
前端开发面试题总结-JavaScript篇(一)
文章目录 JavaScript高频问答一、作用域与闭包1.什么是闭包(Closure)?闭包有什么应用场景和潜在问题?2.解释 JavaScript 的作用域链(Scope Chain) 二、原型与继承3.原型链是什么?如何实现继承&a…...
uniapp中使用aixos 报错
问题: 在uniapp中使用aixos,运行后报如下错误: AxiosError: There is no suitable adapter to dispatch the request since : - adapter xhr is not supported by the environment - adapter http is not available in the build 解决方案&…...
浅谈不同二分算法的查找情况
二分算法原理比较简单,但是实际的算法模板却有很多,这一切都源于二分查找问题中的复杂情况和二分算法的边界处理,以下是博主对一些二分算法查找的情况分析。 需要说明的是,以下二分算法都是基于有序序列为升序有序的情况…...
Element Plus 表单(el-form)中关于正整数输入的校验规则
目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入(联动)2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...
Java + Spring Boot + Mybatis 实现批量插入
在 Java 中使用 Spring Boot 和 MyBatis 实现批量插入可以通过以下步骤完成。这里提供两种常用方法:使用 MyBatis 的 <foreach> 标签和批处理模式(ExecutorType.BATCH)。 方法一:使用 XML 的 <foreach> 标签ÿ…...
RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill
视觉语言模型(Vision-Language Models, VLMs),为真实环境中的机器人操作任务提供了极具潜力的解决方案。 尽管 VLMs 取得了显著进展,机器人仍难以胜任复杂的长时程任务(如家具装配),主要受限于人…...
接口自动化测试:HttpRunner基础
相关文档 HttpRunner V3.x中文文档 HttpRunner 用户指南 使用HttpRunner 3.x实现接口自动化测试 HttpRunner介绍 HttpRunner 是一个开源的 API 测试工具,支持 HTTP(S)/HTTP2/WebSocket/RPC 等网络协议,涵盖接口测试、性能测试、数字体验监测等测试类型…...
【Android】Android 开发 ADB 常用指令
查看当前连接的设备 adb devices 连接设备 adb connect 设备IP 断开已连接的设备 adb disconnect 设备IP 安装应用 adb install 安装包的路径 卸载应用 adb uninstall 应用包名 查看已安装的应用包名 adb shell pm list packages 查看已安装的第三方应用包名 adb shell pm list…...
