当前位置: 首页 > news >正文

读书笔记//《数据分析之道》

出版时间:2022年
作者曾在互联网大厂做数据分析。从举例可以洞见作者的工作经历。
点评:作者在数据分析领域非常资深,尝试在书中提供一个数据分析工作框架参考。书本内容有点感觉是ppt的集合,辅以案例说明。不过,干货还是很多。

一、数据治理

1、什么是数据治理

数据治理是逐步实现数据价值的过程。具体来说,数据治理是指将零散的用户数据通过采集、传输、储存等一系列标准化流程变成格式规范、结构统一的数据,并构建严格规范的综合数据管控机制;对这些标准化的数据进行进一步加工分析,形成具有指导意义的业务监控报表、业务监控模型,以辅助业务方进行决策。

2、数据治理的流程

在这里插入图片描述
3、数据治理的部分岗位职责

  • 数据分析师:负责数据的即时查询和指标体系、报表体系的建设以及输出各项业务报告;
  • 数据产品经理:负责数据产品原型设计以及推动数据产品的实现和落地;
  • 数据挖掘与算法工程师:基于业务问题开发数据模型以辅助业务方进行决策。
    在这里插入图片描述

二、数据思维

1、数据思维应用场景
在这里插入图片描述
如:构建有效的监控体系和客观的评价标准,用合理的分析方法探究原因以及评价效果,综合运用统计学知识对活动效果进行评估。

2、如何培养数据思维

(1) 熟悉业务及常用的数据分析方法,最好建立自己的分析体系
在这里插入图片描述

  • 对比分析是得出数据结论最简单有效的方法。(单独出一篇说明)
  • 分群思维是贯穿数据分析全链路的分析思维。(单独出一篇说明)
  • 相关性分析师探索变量关系的方法,但是相关性不代表因果性。需要掌握必要的因果推断方法。(单独出一篇说明)

(2)面对具体问题,多问为什么,树立目标意识,找出需求背后的潜在分析点
切忌沦为业务方的“取数工具人”。要多沟通,挖掘数据需求背后的真实用意,主动提出更多数据分析,切实解决业务问题。

(3)建立标准,通过客观的标准代替主观的判断
数据分析师排查业务问题的步骤:
用假设检验,代替预设立场——>与特定标准进行比较——>排查原因——>定位问题。

(4) 基于分析结果,为业务方提出切实可行的解决方案
数据分析师提出合理建议会经历的三个阶段:给数据,给报告,给观点。给观点比较难,不仅需要熟练的分析技巧、缜密的数据思维,还需要对业务有极深的了解。

数据分析师需要避免的几种提建议的方式
在这里插入图片描述

三、数据埋点

在数据产生过程,数据分析师需要关注三个问题:
第一,用户的哪些行为会被采集到,是在客户端还是在服务器被采集到;
第二,实现用户数据采集的技术有哪些以及它们之间的异同;
第三,采集到的用户数据是如何实现上报的。

数据埋点流程:
在这里插入图片描述
埋点设计6步骤:
在这里插入图片描述

四、数据标签体系(典型:用户画像)

用户画像是数据标签体系的一种。用户画像,是把用户的多维度标签按照一定规律进行组合,以提高数据分析师的分析效率,更好地辅助运营人员进行决策。
《用户画像》 传送门

1、数据标签体系的作用
用户洞察、个性推荐、渠道优化、营销增强等。

2、数据标签的分类
从计算方式层面分类,可以分为统计类标签、规则类标签、模型类标签(如机器学习类标签)。
数据分析师负责统计类标签、规则类标签的构建和维护;算法工程师负责模型类标签的维护。
按更新时间分类:离线标签、实时标签。

数据标签可以根据不同的业务需求和业务形态进行层级分类,分类原则遵照MECE原则(相互独立、完全穷尽)

3、数据标签体系构建流程
在这里插入图片描述

五、数据指标体系

xxx

相关文章:

读书笔记//《数据分析之道》

出版时间:2022年 作者曾在互联网大厂做数据分析。从举例可以洞见作者的工作经历。 点评:作者在数据分析领域非常资深,尝试在书中提供一个数据分析工作框架参考。书本内容有点感觉是ppt的集合,辅以案例说明。不过,干货还…...

1个串口用1根线实现多机半双工通信+开机控制电路

功能需求: 主机使用一个串口,与两个从机进行双向通信,主机向从机发送数据,从机能够返回数据,由于结构限制,主机与从机之间只有3根线(电源、地、数据线),并且从机上没有设…...

KUKA机器人外部自动运行模式的相关信号配置

KUKA机器人外部自动运行模式的相关信号配置 通过例如PLC这样的控制器来进行外部自动运行控制时,运行接口向机器人控制系统发出机器人进程的相关信号(例如运行许可、故障确认、程序启动等),机器人向上级控制系统发送有关运行状态和故障状态的信息。 必需的配置:  配置CEL…...

【RabbitMQ笔记02】消息队列RabbitMQ七种模式之最简单的模式

这篇文章,主要介绍RabbitMQ消息队列中七种模式里面最简单的使用模式。 目录 一、消息队列的使用 1.1、消息队列七种模式 1.2、最简单的模式使用 (1)引入依赖 (2)编写生产者 (3)编写消费者…...

Spring MVC 源码- RequestToViewNameTranslator 组件

RequestToViewNameTranslator 组件RequestToViewNameTranslator 组件,视图名称转换器,用于解析出请求的默认视图名。就是说当 ModelAndView 对象不为 null,但是它的 View 对象为 null,则需要通过 RequestToViewNameTranslator 组件…...

Linux--TCP编程--0216 17

观前提示:本篇博文的一些接口需要前几篇博文实现的 线程池的实现Liunx--线程池的实现--0208 09_Gosolo!的博客-CSDN博客 线程池的单例模式Linux--线程安全的单例模式--自旋锁--0211_Gosolo!的博客-CSDN博客 1.TCP编程需要用的接口 创建 sock…...

关于设计模式的记录

############### 先弄清楚类模型的关系 ############### 万物的抽象关系 ############### 1.组合 composition实菱形 实线 无填充箭头整体与部分的关系同生共死代码体现:成员变量如:生命体与器官,http请求(请求行,请求…...

Lambda-常见的函数式接口

如果需要使用Lambda接口&#xff0c;就必须要有一个函数式接口 函数式接口是有且仅有一个抽象方法的接口, 对应的注解是FunctionalInterface Java中内置的常见函数式接口如下: 1.Runnable/ Callable /*** The <code>Runnable</code> interface should be implem…...

P1196 [NOI2002] 银河英雄传说 带权并查集

[NOI2002] 银河英雄传说 题目背景 公元 580158015801 年&#xff0c;地球居民迁至金牛座 α\alphaα 第二行星&#xff0c;在那里发表银河联邦创立宣言&#xff0c;同年改元为宇宙历元年&#xff0c;并开始向银河系深处拓展。 宇宙历 799799799 年&#xff0c;银河系的两大军…...

【项目实战】快来入门Groovy的基础语法吧

一、Groovy是什么? 1.1 与Java语言的关系 下一代的Java 语言,增强Java平台的唯一的脚本语言跟java一样,它也运行在 JVM 中。支持Java平台,无缝的集成了Java 的类和库;Groovy是一种运行在JVM上的动态语言,跑在JVM中的另一种语言编译后的.groovy也是以class的形式出现的。1…...

Mybatis中的动态SQL

Mybatis中的动态SQL 当存在多条件查询的SQL时&#xff0c;当用户某个条件的属性没有写时&#xff0c;就会存在问题&#xff0c;在test中则不能很好的运行 所以Mybatis提出了动态SQL。 即判断用户是否输入了某个属性 动态SQL中的一些问题 方法一 这个里的and是为了确保if条…...

VUE常用API

1.$set数据变了&#xff0c;视图没变 this.$set(targe&#xff0c;key&#xff0c;value)2.$nextTick:返回参数[函数]。是一个异步的&#xff0c;功能获得更新后DOM$nextTick(callback){return Promise.resolve().then(()>{callback();}) }3.$refs获取dom4.$el获取当前组件根…...

25 openEuler管理网络-使用nmcli命令配置ip

文章目录25 openEuler管理网络-使用nmcli命令配置ip25.1 nmcli介绍25.2 设备管理25.2.1 连接到设备25.2.2 断开设备连接25.3 设置网络连接25.3.1 配置动态IP连接25.3.1.1 配置IP25.3.1.2 激活连接并检查状态25.3.2 配置静态IP连接25.3.2.1 配置IP25.3.2.2 激活连接并检查状态25…...

如何安装和使用A-ops工具?

一、pip配置 1.配置信任域 ​ pip3 config set global.trusted-host mirrors.tools.huawei.com2.配置pip源的url地址pip3 config set global.index-url http://mirrors.tools.huawei.com/pypi/simple 二、npm安装及配置 npm -v检测系统有无安装npm,如果没有的话需要配置ope…...

MySql数据库环境部署

MySql基础与Sql数据库概述基础环境的建立MYSQL数据库的连接方法MySql的默认数据库数据库端口号数据库概述 数据库&#xff08;DataBase&#xff0c;DB)∶存储在磁带、磁盘、光盘或其他外存介质上、按定结构组织在一起的相关数据的集合。数据库管理系统〈DataBase Management S…...

极品笔记,阿里P7爆款《K8s+Jenkins》技术笔记,职场必备

前些日子从阿里的朋友那里取得这两份K8sJenkins的爆款技术笔记&#xff1a;《K8S(kubernetes)学习指南》《Jenkins持续集成从入门到精通》&#xff0c;非常高质量的干货&#xff0c;我立马收藏&#xff01; 而今天咱们文章的主角就是这非常之干货的技术笔记&#xff1a;K8SJenk…...

数据结构:各种排序方法的综合比较

排序方法的选用应视具体场合而定。一般情况下考虑的原则有:(1)待排序的记录个数 n;(2)记录本身的大小;(3)关键字的分布情况:(4)对排序稳定性的要求等。 1.时间性能 (1) 按平均的时间性能来分,有三类排序方法: 时间复杂度为 O(nlogn)的方法有:快速排序、堆排序和归并排序,其中…...

【设计模式】 策略模式介绍及C代码实现

【设计模式】 策略模式介绍及C代码实现 背景 在软件构建过程中&#xff0c;某些对象使用的算法可能多种多样&#xff0c;经常改变&#xff0c;如果将这些算法都编码到对象中&#xff0c;将会使对象变得异常复杂&#xff0c;而且有时候支持不使用的算法也是一个性能负担。 如何…...

【数据库】第二章 关系数据库

第二章 关系数据库 2.1关系数据结构及形式化定义 关系 域&#xff08;domain) :域是一组具有相同数据类型的值的集合&#xff0c;可以取值的个数叫基数 笛卡尔积 &#xff1a;一个记录叫做一个元组&#xff08;tuple),元组中每一个属性值&#xff0c;叫一个分量 基数&…...

oracle和mysql的分页

oracle的分页&#xff1a;rownum 注意:&#xff1a; 对 ROWNUM 只能使用 < 或 <, 用 、 >、 > 都不能返回任何数据。 rownum是对结果集的编序排列&#xff0c;始终是从1开始&#xff0c;所以rownum直接使用时不允许使用>、> 所以当查询中间部分的信息时&…...

嵌入式设备参数存储方案设计与优化

嵌入式设备参数存储方案设计与实现1. 项目概述在嵌入式系统开发中&#xff0c;参数存储是一个基础但至关重要的功能模块。合理的参数存储方案直接影响产品的可靠性、可维护性和升级扩展能力。本文将深入分析嵌入式设备中常见的参数存储方案&#xff0c;重点解决结构体存储方式存…...

效率提升50%:OpenClaw+GLM-4.7-Flash的会议纪要自动化

效率提升50%&#xff1a;OpenClawGLM-4.7-Flash的会议纪要自动化 1. 为什么需要自动化会议纪要 作为技术团队负责人&#xff0c;我每周要参加至少8场会议。过去两年里&#xff0c;我尝试过各种会议纪要工具——从讯飞听见的语音转写&#xff0c;到Notion AI的摘要生成&#x…...

10天掌握Python编程(附20节实战视频),网盘资源速领

1. 为什么选择Python作为编程入门首选&#xff1f; 如果你正在寻找一门适合零基础学习的编程语言&#xff0c;Python绝对是你的不二之选。作为一门解释型高级语言&#xff0c;Python以其简洁优雅的语法和强大丰富的生态圈闻名。我十年前刚开始接触编程时&#xff0c;就是从Pyth…...

Shell脚本实战指南:从零基础到自动化高手

1. Shell脚本入门&#xff1a;从Hello World到实战 第一次接触Shell脚本时&#xff0c;我和大多数人一样&#xff0c;被那些神秘的符号和命令搞得一头雾水。直到我意识到&#xff0c;Shell脚本其实就是把平时在终端里手动输入的命令&#xff0c;写进一个文件里自动执行。举个例…...

告别硬编码!Activiti7流程变量与监听器实战:动态分配审批人与业务数据流转

Activiti7流程变量与监听器实战&#xff1a;动态审批人分配与业务数据流转 在业务流程管理&#xff08;BPM&#xff09;领域&#xff0c;硬编码审批人始终是系统灵活性的主要障碍。当组织架构调整或审批规则变化时&#xff0c;传统方案往往需要重新部署流程定义。本文将深入探…...

基于Koopman算子的四旋翼无人机MPC控制开发:一种创新的数据驱动方法

318-一种基于Koopman算子的模型预测控制MPC控制四旋翼无人机开发 简介&#xff1a; 一种基于Koopman算子和扩展动态模式分解(EDMD)的四旋翼无人机学习和控制的新型数据驱动方法。 基于欧拉角(表示方向)等传统方法构建EDMD的观测器已知涉及奇异性。 为了解决这个问题&#xff0c…...

不止于模拟器:在Windows10上用VS2019+QEMU调试EDK2 UEFI应用的完整流程

从零构建UEFI开发环境&#xff1a;VS2019与QEMU深度整合实战指南 在当今固件开发领域&#xff0c;UEFI已逐步取代传统BIOS成为主流标准。对于开发者而言&#xff0c;搭建一个高效的UEFI开发环境是进行底层系统开发的第一步。本文将带你深入探索如何在Windows10平台上&#xff0…...

数学学习者的终极指南:如何高效利用开源资源库构建完整知识体系

数学学习者的终极指南&#xff1a;如何高效利用开源资源库构建完整知识体系 【免费下载链接】awesome-math A curated list of awesome mathematics resources 项目地址: https://gitcode.com/GitHub_Trending/aw/awesome-math 在数字化学习时代&#xff0c;如何从海量的…...

AI辅助学术写作:Qwen3-0.6B-FP8搭配LaTeX生成论文章节与参考文献

AI辅助学术写作&#xff1a;Qwen3-0.6B-FP8搭配LaTeX生成论文章节与参考文献 写论文&#xff0c;尤其是写引言和参考文献&#xff0c;是不是让你特别头疼&#xff1f;对着空白的文档发呆&#xff0c;不知道从何下笔&#xff1b;或者为了找一篇关键的参考文献&#xff0c;在数据…...

MusePublic部署案例:离线环境无网络部署与本地模型缓存策略

MusePublic部署案例&#xff1a;离线环境无网络部署与本地模型缓存策略 1. 项目概述 MusePublic是一款专为艺术感时尚人像创作设计的轻量化文本生成图像系统。这个项目基于专属大模型构建&#xff0c;采用安全高效的safetensors格式封装&#xff0c;特别针对艺术人像的优雅姿…...