数据分析入门
B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili
一、岗位:数据分析师
Q1 数据分析师在公司做什么工作?

数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况;
通过对用户精细化分析,找出增长点,强化核心业务或开拓新业务。
Q2 数据分析师使用什么工具?

使用sql对接数据源,excel对接业务人员。python在生产力方面与同行拉开差距。
Q3 数据分析师需要具备什么技术能力?

1.业务能力。在熟知业务的基础上,设计更加有价值的监测指标与用户埋点,获取更有价值的数据,为后续分析打下基础。
2.Excel、Sql、Python等分析软件。主要用于已获取数据的自动整合、监测、分发等,用来减轻人工的工作量。
3.统计学、数据分析报告、业务能力等。分析客观数据,得出分析结论。
4.BI平台。在该平台中完成上述工作,需要掌握平台的使用方法。
5.机器学习、搭建指标体系等相关知识。用于支撑核心业务增长或开拓新业务线。
6.行业报告分析。用于行业、数据探索。

业务可以通过积极参与业务会议等方式掌握。和运营相比,掌握业务全局。
sql等工具通过系统学习和使用掌握。和表哥表姐相比,对业务有更深的掌握,通过数据分析总结。
数据分析通过系统的学习掌握。是数据分析师结果产出物,直接效益的体现。
python通过系统的学习掌握,用于加强自身竞争力,成为领域专家。
Q4 如何进行学习规划?

列出所需的技术栈,根据市场需求与自身特点(对自身是优势)分出优先级。
Q5 到达新公司后,如何迅速了解业务?

1.获得公司架构图。从中了解部门怎么设置,业务怎么开展。从用户到下订单的整个业务流程中,各部门如何参与,负责哪些业务。重点看运营架构、产品架构。
2.获取业务数据表。作为用户使用。获得主表、用户行为。
二、如何获得数据:指标体系与用户路径
Q1 指标可以用来干什么?
建立指标体系目的是获得全面而充足数据支撑,通过分析,从而发现问题、或得出主观问题的结论。

优秀的指标体系在制定每个指标时,会与业务目标密切关联,紧密围绕活动策略,数据结果可以有效的衡量产品的健康程度与策略是否有效。

Q2 指标包含什么构成要素?
Q3 面对混乱的指标数据时,如何将其定量比较?
指标之间因为计数单位、数据量、计算方式等量纲的不同,导致无法直接进行比较。
基于此问题,通常采用归一化和标准化两种方法来去除量纲。
- 归一化:通过对同一组的统计量做统计,使该组数值在0-1之间变化。公式:(当前值-最小值)/(最大值-最小值)。归一化后,不同组数据即可做出比较。
- 标准化:在计算一组数据的方差后,通过开根号的方式去除该组数据的量纲。
Q4 如何拆分指标?
1.在宏观上,从指标本身类型和获得复杂度来说,包括基础指标、复合指标和派生指标。

2.当聚焦在产品的不同生命周期阶段时,会产生各阶段的重点关注指标。

3.当细化到每个具体的业务时,从业务工作的拆分来讲,可根据业务的不同分为不同的指标类。

4.对于互联网产品来说,会特别关注以下指标。

5.从用户行为的角度来看,通过用户在关键路径上的一系列行为,为每个行为拆分测量指标。 
Q5 如何分析用户路径?
视频类用户路径
电商购物用户路径 
内容平台用户路径
三、指标数据的分析
Q1 获得指标数据后,可以分析什么信息?
1.分析不同类型业务在整个业务中的占比情况
2.分析业务的增长趋势 
3.通过与自己、他人进行比较,分析业务的增长率和竞争力 
4.通过画象限的方法,分析出强势和弱势的业务 
5.通过对头部流量的分析,分析流量投入的集中程度 
6.通过对地域、用户、业务的维度分析,分析不同维度的用户对业务的偏好。 
TGI指数:在某个活动中,目标群体在总人群中的占比
——地域维度
——用户维度
——业务维度
06 复杂指标数据的影响因素有什么
指标的影响因素包括产品本身素质和用户群体两方面影响。
产品本身素质包括用户流量、转化率、成功率、价格等多项产品因素组成;用户群体为目标群体的群体特性。
用户群体作为对最为影响产品成功的部分,对受众群体做出细分,并进行完善的用户画像来研究。

四、分析的进行:统计
Q1 如何判断数据是否稳定?
描述统计学用于研究单个变量的集中趋势与离散趋势。 
选择一个数值来作为中心
Q2 确定中心数时,如何保证数据的代表性?

方差=[(数值1-平均数)²+(数值2-平均值)²+…]/N
用来直观的对比离散程度的高低
标准差²=方差。去除方差的量纲,更精准的提现离散趋势
极差=(最大-最小) 。提现数据的偏差程度
偏差、方差共同描述离散程度。
Q3 如何判断数据范围?

Q4 如何找到异常值?
当数据服从正态分布,使用3σ原则
当数据不服从正态分布,使用箱线图

1.从小到大排列已有数据
2.选取25%,50%,75%,100%位距的数值
3.计算四分位距IQR,从而获得箱线图中箱子的长度;箱线图为数据提供3倍IQR的容错量。
IQR=Q3-Q1;上界=Q3+1.5IQR;下界=Q3-1.5IQR
4.根据数值画出箱线图,极限外的数据排除为异常数据
Q5 根据当前数据,如何预测接下来的趋势?
略
五、分析结果的运用
Q1 如何获得问题的结果?

1.罗列关联的数据(不同分析角度寻找不同数据)
2.列出公式,计算单位供给能力
3.列出公式,计算需求量
4.计算供给量

Q2 如何进行事件的策划?

人、时、地、事、因、做、果
把项目实际落地的具体手段。
策划产品活动案例


思考的基础是信息。若缺少信息,通过提问获得基础数据和细节。如:定价、产品价值、用户画像等。
分析付费点案例
拆分维度案例
Q3 如何分析用户的增长和留存?
常规模型:分析用户增长和留存的模型AARRR

拼多多模式:RARRA模型
留存——激活——传播——变现——注册
游戏化思路

游戏化用户增长策略:八角模型

相关文章:
数据分析入门
B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili 一、岗位:数据分析师 Q1 数据分析师在公司做什么工作? 数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况; 通过对用户精细化分析&am…...
车载网关通信能力解析——SV900-5G车载网关推荐
随着车联网的发展,各类车载设备对车载网关的需求日益增长。车载网关作为车与车、车与路、车与云之间连接的关键设备,其通信能力直接影响整个系统的性能。本文将详细解析车载网关的通信能力,并推荐性价比高的SV900-5G车载网关。 链接直达:https://www.key-iot.com/i…...
服务器中了mkp勒索病毒怎么处理,mkp勒索病毒解密,数据恢复
10月份以来,云天数据恢复中心陆续接到很多企业的求助,企业的服务器遭到了mkp勒索病毒攻击,导致企业的服务器数据库被加密,严重影响了企业工作,通过这一波mkp勒索病毒的攻击,云天数据恢复工程师为大家总结了…...
义乌再次位列第一档!2022年跨境电商综试区评估结果揭晓!
义乌跨境电商综试区捷报频传,在商务部公布的“2022年跨境电子商务综合试验区评估”结果中,中国(义乌)跨境电子商务综合试验区(以下简称:“跨境综试区”)评估结果为成效明显,综合排名…...
07、Python -- 序列相关函数与封包解包
目录 使用函数字符串也能比较大小序列封包序列解包多变量同时赋值 最大值、最小值、长度 序列解包与封包 使用函数 len()、max()、min() 函数可获取元组、列表的长度、最大值和最小值。 字符串也能比较大小 字符串比较大小时,将会依次按字符串中每个字符对应的编…...
# Spring 事务失效场景
Spring 事务失效场景 文章目录 Spring 事务失效场景前言事务不生效未开启事务事务方法未被Spring管理访问权限问题基于接口的代理源码解读 CGLIB代理 方法用final修饰同一类中的方法调用多线程调用不支持事务 事务不回滚设置错误的事务传播机制捕获了异常手动抛了别的异常自定义…...
华为OD 停车场车辆统计(100分)【java】A卷+B卷
华为OD统一考试A卷+B卷 新题库说明 你收到的链接上面会标注A卷还是B卷。目前大部分收到的都是B卷。 B卷对应20022部分考题以及新出的题目,A卷对应的是新出的题目。 我将持续更新最新题目 获取更多免费题目可前往夸克网盘下载,请点击以下链接进入: 我用夸克网盘分享了「华为O…...
出差学小白知识No6:LD_PRELOAD变量路径不对找不到库文件
交叉编译的时候出现以下问题,显示LD_PRELOAD变量找不到路劲 首先先查看一下LD_PRELOAD的路径:echo $LD_PRELOAD 如果输出一大串,那么先进行清空:unset LD_PRELOAD 重新给LD_PRELOAD进行赋值他的路径和库文件: expor…...
利用dns协议发起ddos反射攻击
利用DNS服务器发起反射型DDOS,攻击带宽 基本思路: 1、利用any类型的dns查询,可完成发送少量请求数据,获得大量返回数据。 2、将原请求地址改为受害者地址,则dns会向受害者返回大量数据,占用带宽 警告&…...
Tcl基础知识
一、概述 Tcl 语言的全称 Tool Command Language,即工具命令语言。这种需要在 EDA 工具中使用的相当之多,或者说几乎每个 EDA 工具都支持 Tcl 语言,并将它作为自己的命令shell。 静态时序分析中多用的 Synopsys Tcl 语言,…...
Go中的编程模式:Pipeline
本文章我们重点来介绍一下 Go 编程中的 Pipeline 模式。用过 Linux 命令行的人都不会陌生,它是一种把各种命令拼接起来完成一个更强功能的技术方法,在C语言中也有pipe管道的叫法,具体的有兴趣的同学也可以去了解。 现在的流式处理、函数式编程、应用网关对微服务进行简单的…...
2023最新pytorch安装教程,简单易懂,面向初学者(Anaconda+GPU)
一、前言 目前是2023.1.27,鉴于本人安装过程中踩得坑,安装之前我先给即将安装pytorch的各位提个醒,有以下几点需要注意 1.判断自己电脑是否有GPU 注意这点很重要,本教程面向有NVIDA显卡的电脑,如果你的电脑没有GPU或者使用AMD显…...
Redis为什么变慢了
一、Redis为什么变慢了 1.Redis真的变慢了吗? 对 Redis 进行基准性能测试 例如,我的机器配置比较低,当延迟为 2ms 时,我就认为 Redis 变慢了,但是如果你的硬件配置比较高,那么在你的运行环境下,可能延迟是 0.5ms 时就可以认为 Redis 变慢了。 所以,你只有了解了你的…...
空中计算(Over-the-Air Computation)学习笔记
文章目录 写在前面 写在前面 本文是论文A Survey on Over-the-Air Computation的阅读笔记: 通信和计算通常被视为独立的任务。 从工程的角度来看,这种方法是非常有效的,因为可以执行孤立的优化。 然而,对于许多面向计算的应用程序…...
如何高效率地阅读论文
▚ 01 Active versus passive reading: how to read scientific papers? 📢小疑则小悟,大疑则大悟,不疑则不悟。 If you read/do research with small questions in mind, you learn small things. If you do so with big questions in…...
FreeRTOS学习day1
顾名思义 免费的实时操作系统 用法基本和Linux下的多线程编程类似 探索者开发版实验 动态创建4个任务start_task task1 task2 task3 优先级依次为1 2 3 4 (注意优先级不能为0,0是空闲任务) 我的理解:主线程start_task 主线程 task1 ta…...
【Web】| CSS Float (浮动)的使用方法
Float(浮动)概念 CSS的Float(浮动),会使得元素向左或者向右移动,其它周围元素也会重新排列。 Float浮动,往往是用于图像,但它的布局一样非常有效。 元素如何浮动 元素的水平方向…...
#力扣:面试题 02.03. 删除中间节点@FDDLC
面试题 02.03. 删除中间节点 - 力扣(LeetCode) 一、Java /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode(int x) { val x; }* }*/ class Solution {public void deleteNode(List…...
多线程原子性、一致性与有序性
作者:逍遥Sean 简介:一个主修Java的Web网站\游戏服务器后端开发者 主页:https://blog.csdn.net/Ureliable 觉得博主文章不错的话,可以三连支持一下~ 如有需要我的支持,请私信或评论留言! 前言: …...
读书笔记:Effective C++ 2.0 版,条款28(namespace )
条款28: 划分全局名字空间 namespace 作为前缀,防止不同名字域的类型、常量等互相污染。 没命名的名字空间一般用于限制名字空间内部元素的可见性。 namespace sdm {const double book_version 2.0;class handle { ... };handle& gethandle(); }早期用struct模…...
从零实现富文本编辑器#5-编辑器选区模型的状态结构表达
先前我们总结了浏览器选区模型的交互策略,并且实现了基本的选区操作,还调研了自绘选区的实现。那么相对的,我们还需要设计编辑器的选区表达,也可以称为模型选区。编辑器中应用变更时的操作范围,就是以模型选区为基准来…...
macOS多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用
文章目录 问题现象问题原因解决办法 问题现象 macOS启动台(Launchpad)多出来了:Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。 问题原因 很明显,都是Google家的办公全家桶。这些应用并不是通过独立安装的…...
工业自动化时代的精准装配革新:迁移科技3D视觉系统如何重塑机器人定位装配
AI3D视觉的工业赋能者 迁移科技成立于2017年,作为行业领先的3D工业相机及视觉系统供应商,累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成,通过稳定、易用、高回报的AI3D视觉系统,为汽车、新能源、金属制造等行…...
重启Eureka集群中的节点,对已经注册的服务有什么影响
先看答案,如果正确地操作,重启Eureka集群中的节点,对已经注册的服务影响非常小,甚至可以做到无感知。 但如果操作不当,可能会引发短暂的服务发现问题。 下面我们从Eureka的核心工作原理来详细分析这个问题。 Eureka的…...
让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比
在机器学习的回归分析中,损失函数的选择对模型性能具有决定性影响。均方误差(MSE)作为经典的损失函数,在处理干净数据时表现优异,但在面对包含异常值的噪声数据时,其对大误差的二次惩罚机制往往导致模型参数…...
A2A JS SDK 完整教程:快速入门指南
目录 什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除 什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库ÿ…...
Python Ovito统计金刚石结构数量
大家好,我是小马老师。 本文介绍python ovito方法统计金刚石结构的方法。 Ovito Identify diamond structure命令可以识别和统计金刚石结构,但是无法直接输出结构的变化情况。 本文使用python调用ovito包的方法,可以持续统计各步的金刚石结构,具体代码如下: from ovito…...
计算机基础知识解析:从应用到架构的全面拆解
目录 前言 1、 计算机的应用领域:无处不在的数字助手 2、 计算机的进化史:从算盘到量子计算 3、计算机的分类:不止 “台式机和笔记本” 4、计算机的组件:硬件与软件的协同 4.1 硬件:五大核心部件 4.2 软件&#…...
LabVIEW双光子成像系统技术
双光子成像技术的核心特性 双光子成像通过双低能量光子协同激发机制,展现出显著的技术优势: 深层组织穿透能力:适用于活体组织深度成像 高分辨率观测性能:满足微观结构的精细研究需求 低光毒性特点:减少对样本的损伤…...
【LeetCode】3309. 连接二进制表示可形成的最大数值(递归|回溯|位运算)
LeetCode 3309. 连接二进制表示可形成的最大数值(中等) 题目描述解题思路Java代码 题目描述 题目链接:LeetCode 3309. 连接二进制表示可形成的最大数值(中等) 给你一个长度为 3 的整数数组 nums。 现以某种顺序 连接…...

