读书笔记//《数据分析之道》
出版时间:2022年
作者曾在互联网大厂做数据分析。从举例可以洞见作者的工作经历。
点评:作者在数据分析领域非常资深,尝试在书中提供一个数据分析工作框架参考。书本内容有点感觉是ppt的集合,辅以案例说明。不过,干货还是很多。
一、数据治理
1、什么是数据治理
数据治理是逐步实现数据价值的过程。具体来说,数据治理是指将零散的用户数据通过采集、传输、储存等一系列标准化流程变成格式规范、结构统一的数据,并构建严格规范的综合数据管控机制;对这些标准化的数据进行进一步加工分析,形成具有指导意义的业务监控报表、业务监控模型,以辅助业务方进行决策。
2、数据治理的流程

3、数据治理的部分岗位职责
- 数据分析师:负责数据的即时查询和指标体系、报表体系的建设以及输出各项业务报告;
- 数据产品经理:负责数据产品原型设计以及推动数据产品的实现和落地;
- 数据挖掘与算法工程师:基于业务问题开发数据模型以辅助业务方进行决策。

二、数据思维
1、数据思维应用场景

如:构建有效的监控体系和客观的评价标准,用合理的分析方法探究原因以及评价效果,综合运用统计学知识对活动效果进行评估。
2、如何培养数据思维
(1) 熟悉业务及常用的数据分析方法,最好建立自己的分析体系

- 对比分析是得出数据结论最简单有效的方法。(单独出一篇说明)
- 分群思维是贯穿数据分析全链路的分析思维。(单独出一篇说明)
- 相关性分析师探索变量关系的方法,但是相关性不代表因果性。需要掌握必要的因果推断方法。(单独出一篇说明)
(2)面对具体问题,多问为什么,树立目标意识,找出需求背后的潜在分析点
切忌沦为业务方的“取数工具人”。要多沟通,挖掘数据需求背后的真实用意,主动提出更多数据分析,切实解决业务问题。
(3)建立标准,通过客观的标准代替主观的判断
数据分析师排查业务问题的步骤:
用假设检验,代替预设立场——>与特定标准进行比较——>排查原因——>定位问题。
(4) 基于分析结果,为业务方提出切实可行的解决方案
数据分析师提出合理建议会经历的三个阶段:给数据,给报告,给观点。给观点比较难,不仅需要熟练的分析技巧、缜密的数据思维,还需要对业务有极深的了解。
数据分析师需要避免的几种提建议的方式:

三、数据埋点
在数据产生过程,数据分析师需要关注三个问题:
第一,用户的哪些行为会被采集到,是在客户端还是在服务器被采集到;
第二,实现用户数据采集的技术有哪些以及它们之间的异同;
第三,采集到的用户数据是如何实现上报的。
数据埋点流程:

埋点设计6步骤:

四、数据标签体系(典型:用户画像)
用户画像是数据标签体系的一种。用户画像,是把用户的多维度标签按照一定规律进行组合,以提高数据分析师的分析效率,更好地辅助运营人员进行决策。
《用户画像》 传送门
1、数据标签体系的作用
用户洞察、个性推荐、渠道优化、营销增强等。
2、数据标签的分类
从计算方式层面分类,可以分为统计类标签、规则类标签、模型类标签(如机器学习类标签)。
数据分析师负责统计类标签、规则类标签的构建和维护;算法工程师负责模型类标签的维护。
按更新时间分类:离线标签、实时标签。
数据标签可以根据不同的业务需求和业务形态进行层级分类,分类原则遵照MECE原则(相互独立、完全穷尽)
3、数据标签体系构建流程

五、数据指标体系
xxx
相关文章:
读书笔记//《数据分析之道》
出版时间:2022年 作者曾在互联网大厂做数据分析。从举例可以洞见作者的工作经历。 点评:作者在数据分析领域非常资深,尝试在书中提供一个数据分析工作框架参考。书本内容有点感觉是ppt的集合,辅以案例说明。不过,干货还…...
1个串口用1根线实现多机半双工通信+开机控制电路
功能需求: 主机使用一个串口,与两个从机进行双向通信,主机向从机发送数据,从机能够返回数据,由于结构限制,主机与从机之间只有3根线(电源、地、数据线),并且从机上没有设…...
KUKA机器人外部自动运行模式的相关信号配置
KUKA机器人外部自动运行模式的相关信号配置 通过例如PLC这样的控制器来进行外部自动运行控制时,运行接口向机器人控制系统发出机器人进程的相关信号(例如运行许可、故障确认、程序启动等),机器人向上级控制系统发送有关运行状态和故障状态的信息。 必需的配置: 配置CEL…...
【RabbitMQ笔记02】消息队列RabbitMQ七种模式之最简单的模式
这篇文章,主要介绍RabbitMQ消息队列中七种模式里面最简单的使用模式。 目录 一、消息队列的使用 1.1、消息队列七种模式 1.2、最简单的模式使用 (1)引入依赖 (2)编写生产者 (3)编写消费者…...
Spring MVC 源码- RequestToViewNameTranslator 组件
RequestToViewNameTranslator 组件RequestToViewNameTranslator 组件,视图名称转换器,用于解析出请求的默认视图名。就是说当 ModelAndView 对象不为 null,但是它的 View 对象为 null,则需要通过 RequestToViewNameTranslator 组件…...
Linux--TCP编程--0216 17
观前提示:本篇博文的一些接口需要前几篇博文实现的 线程池的实现Liunx--线程池的实现--0208 09_Gosolo!的博客-CSDN博客 线程池的单例模式Linux--线程安全的单例模式--自旋锁--0211_Gosolo!的博客-CSDN博客 1.TCP编程需要用的接口 创建 sock…...
关于设计模式的记录
############### 先弄清楚类模型的关系 ############### 万物的抽象关系 ############### 1.组合 composition实菱形 实线 无填充箭头整体与部分的关系同生共死代码体现:成员变量如:生命体与器官,http请求(请求行,请求…...
Lambda-常见的函数式接口
如果需要使用Lambda接口,就必须要有一个函数式接口 函数式接口是有且仅有一个抽象方法的接口, 对应的注解是FunctionalInterface Java中内置的常见函数式接口如下: 1.Runnable/ Callable /*** The <code>Runnable</code> interface should be implem…...
P1196 [NOI2002] 银河英雄传说 带权并查集
[NOI2002] 银河英雄传说 题目背景 公元 580158015801 年,地球居民迁至金牛座 α\alphaα 第二行星,在那里发表银河联邦创立宣言,同年改元为宇宙历元年,并开始向银河系深处拓展。 宇宙历 799799799 年,银河系的两大军…...
【项目实战】快来入门Groovy的基础语法吧
一、Groovy是什么? 1.1 与Java语言的关系 下一代的Java 语言,增强Java平台的唯一的脚本语言跟java一样,它也运行在 JVM 中。支持Java平台,无缝的集成了Java 的类和库;Groovy是一种运行在JVM上的动态语言,跑在JVM中的另一种语言编译后的.groovy也是以class的形式出现的。1…...
Mybatis中的动态SQL
Mybatis中的动态SQL 当存在多条件查询的SQL时,当用户某个条件的属性没有写时,就会存在问题,在test中则不能很好的运行 所以Mybatis提出了动态SQL。 即判断用户是否输入了某个属性 动态SQL中的一些问题 方法一 这个里的and是为了确保if条…...
VUE常用API
1.$set数据变了,视图没变 this.$set(targe,key,value)2.$nextTick:返回参数[函数]。是一个异步的,功能获得更新后DOM$nextTick(callback){return Promise.resolve().then(()>{callback();}) }3.$refs获取dom4.$el获取当前组件根…...
25 openEuler管理网络-使用nmcli命令配置ip
文章目录25 openEuler管理网络-使用nmcli命令配置ip25.1 nmcli介绍25.2 设备管理25.2.1 连接到设备25.2.2 断开设备连接25.3 设置网络连接25.3.1 配置动态IP连接25.3.1.1 配置IP25.3.1.2 激活连接并检查状态25.3.2 配置静态IP连接25.3.2.1 配置IP25.3.2.2 激活连接并检查状态25…...
如何安装和使用A-ops工具?
一、pip配置 1.配置信任域 pip3 config set global.trusted-host mirrors.tools.huawei.com2.配置pip源的url地址pip3 config set global.index-url http://mirrors.tools.huawei.com/pypi/simple 二、npm安装及配置 npm -v检测系统有无安装npm,如果没有的话需要配置ope…...
MySql数据库环境部署
MySql基础与Sql数据库概述基础环境的建立MYSQL数据库的连接方法MySql的默认数据库数据库端口号数据库概述 数据库(DataBase,DB)∶存储在磁带、磁盘、光盘或其他外存介质上、按定结构组织在一起的相关数据的集合。数据库管理系统〈DataBase Management S…...
极品笔记,阿里P7爆款《K8s+Jenkins》技术笔记,职场必备
前些日子从阿里的朋友那里取得这两份K8sJenkins的爆款技术笔记:《K8S(kubernetes)学习指南》《Jenkins持续集成从入门到精通》,非常高质量的干货,我立马收藏! 而今天咱们文章的主角就是这非常之干货的技术笔记:K8SJenk…...
数据结构:各种排序方法的综合比较
排序方法的选用应视具体场合而定。一般情况下考虑的原则有:(1)待排序的记录个数 n;(2)记录本身的大小;(3)关键字的分布情况:(4)对排序稳定性的要求等。 1.时间性能 (1) 按平均的时间性能来分,有三类排序方法: 时间复杂度为 O(nlogn)的方法有:快速排序、堆排序和归并排序,其中…...
【设计模式】 策略模式介绍及C代码实现
【设计模式】 策略模式介绍及C代码实现 背景 在软件构建过程中,某些对象使用的算法可能多种多样,经常改变,如果将这些算法都编码到对象中,将会使对象变得异常复杂,而且有时候支持不使用的算法也是一个性能负担。 如何…...
【数据库】第二章 关系数据库
第二章 关系数据库 2.1关系数据结构及形式化定义 关系 域(domain) :域是一组具有相同数据类型的值的集合,可以取值的个数叫基数 笛卡尔积 :一个记录叫做一个元组(tuple),元组中每一个属性值,叫一个分量 基数&…...
oracle和mysql的分页
oracle的分页:rownum 注意:: 对 ROWNUM 只能使用 < 或 <, 用 、 >、 > 都不能返回任何数据。 rownum是对结果集的编序排列,始终是从1开始,所以rownum直接使用时不允许使用>、> 所以当查询中间部分的信息时&…...
嵌入式设备参数存储方案设计与优化
嵌入式设备参数存储方案设计与实现1. 项目概述在嵌入式系统开发中,参数存储是一个基础但至关重要的功能模块。合理的参数存储方案直接影响产品的可靠性、可维护性和升级扩展能力。本文将深入分析嵌入式设备中常见的参数存储方案,重点解决结构体存储方式存…...
效率提升50%:OpenClaw+GLM-4.7-Flash的会议纪要自动化
效率提升50%:OpenClawGLM-4.7-Flash的会议纪要自动化 1. 为什么需要自动化会议纪要 作为技术团队负责人,我每周要参加至少8场会议。过去两年里,我尝试过各种会议纪要工具——从讯飞听见的语音转写,到Notion AI的摘要生成&#x…...
10天掌握Python编程(附20节实战视频),网盘资源速领
1. 为什么选择Python作为编程入门首选? 如果你正在寻找一门适合零基础学习的编程语言,Python绝对是你的不二之选。作为一门解释型高级语言,Python以其简洁优雅的语法和强大丰富的生态圈闻名。我十年前刚开始接触编程时,就是从Pyth…...
Shell脚本实战指南:从零基础到自动化高手
1. Shell脚本入门:从Hello World到实战 第一次接触Shell脚本时,我和大多数人一样,被那些神秘的符号和命令搞得一头雾水。直到我意识到,Shell脚本其实就是把平时在终端里手动输入的命令,写进一个文件里自动执行。举个例…...
告别硬编码!Activiti7流程变量与监听器实战:动态分配审批人与业务数据流转
Activiti7流程变量与监听器实战:动态审批人分配与业务数据流转 在业务流程管理(BPM)领域,硬编码审批人始终是系统灵活性的主要障碍。当组织架构调整或审批规则变化时,传统方案往往需要重新部署流程定义。本文将深入探…...
基于Koopman算子的四旋翼无人机MPC控制开发:一种创新的数据驱动方法
318-一种基于Koopman算子的模型预测控制MPC控制四旋翼无人机开发 简介: 一种基于Koopman算子和扩展动态模式分解(EDMD)的四旋翼无人机学习和控制的新型数据驱动方法。 基于欧拉角(表示方向)等传统方法构建EDMD的观测器已知涉及奇异性。 为了解决这个问题,…...
不止于模拟器:在Windows10上用VS2019+QEMU调试EDK2 UEFI应用的完整流程
从零构建UEFI开发环境:VS2019与QEMU深度整合实战指南 在当今固件开发领域,UEFI已逐步取代传统BIOS成为主流标准。对于开发者而言,搭建一个高效的UEFI开发环境是进行底层系统开发的第一步。本文将带你深入探索如何在Windows10平台上࿰…...
数学学习者的终极指南:如何高效利用开源资源库构建完整知识体系
数学学习者的终极指南:如何高效利用开源资源库构建完整知识体系 【免费下载链接】awesome-math A curated list of awesome mathematics resources 项目地址: https://gitcode.com/GitHub_Trending/aw/awesome-math 在数字化学习时代,如何从海量的…...
AI辅助学术写作:Qwen3-0.6B-FP8搭配LaTeX生成论文章节与参考文献
AI辅助学术写作:Qwen3-0.6B-FP8搭配LaTeX生成论文章节与参考文献 写论文,尤其是写引言和参考文献,是不是让你特别头疼?对着空白的文档发呆,不知道从何下笔;或者为了找一篇关键的参考文献,在数据…...
MusePublic部署案例:离线环境无网络部署与本地模型缓存策略
MusePublic部署案例:离线环境无网络部署与本地模型缓存策略 1. 项目概述 MusePublic是一款专为艺术感时尚人像创作设计的轻量化文本生成图像系统。这个项目基于专属大模型构建,采用安全高效的safetensors格式封装,特别针对艺术人像的优雅姿…...
