当前位置: 首页 > news >正文

数据分析入门

B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili

一、岗位:数据分析师

Q1 数据分析师在公司做什么工作? 

数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况;

通过对用户精细化分析,找出增长点,强化核心业务或开拓新业务。 

Q2 数据分析师使用什么工具?

使用sql对接数据源,excel对接业务人员。python在生产力方面与同行拉开差距。

Q3 数据分析师需要具备什么技术能力?

1.业务能力。在熟知业务的基础上,设计更加有价值的监测指标与用户埋点,获取更有价值的数据,为后续分析打下基础。

2.Excel、Sql、Python等分析软件。主要用于已获取数据的自动整合、监测、分发等,用来减轻人工的工作量。

3.统计学、数据分析报告、业务能力等。分析客观数据,得出分析结论。

4.BI平台。在该平台中完成上述工作,需要掌握平台的使用方法。

5.机器学习、搭建指标体系等相关知识。用于支撑核心业务增长或开拓新业务线。

6.行业报告分析。用于行业、数据探索。 

业务可以通过积极参与业务会议等方式掌握。和运营相比,掌握业务全局。

sql等工具通过系统学习和使用掌握。和表哥表姐相比,对业务有更深的掌握,通过数据分析总结。

数据分析通过系统的学习掌握。是数据分析师结果产出物,直接效益的体现。

python通过系统的学习掌握,用于加强自身竞争力,成为领域专家。

Q4 如何进行学习规划?

 

列出所需的技术栈,根据市场需求与自身特点(对自身是优势)分出优先级。

Q5 到达新公司后,如何迅速了解业务?

1.获得公司架构图。从中了解部门怎么设置,业务怎么开展。从用户到下订单的整个业务流程中,各部门如何参与,负责哪些业务。重点看运营架构、产品架构。

2.获取业务数据表。作为用户使用。获得主表、用户行为。

二、如何获得数据:指标体系与用户路径

Q1 指标可以用来干什么?

建立指标体系目的是获得全面而充足数据支撑,通过分析,从而发现问题、或得出主观问题的结论。 

优秀的指标体系在制定每个指标时,会与业务目标密切关联,紧密围绕活动策略,数据结果可以有效的衡量产品的健康程度与策略是否有效。  

 

Q2 指标包含什么构成要素?

Q3 面对混乱的指标数据时,如何将其定量比较?

指标之间因为计数单位、数据量、计算方式等量纲的不同,导致无法直接进行比较。

基于此问题,通常采用归一化标准化两种方法来去除量纲。 

  • 归一化:通过对同一组的统计量做统计,使该组数值在0-1之间变化。公式:(当前值-最小值)/(最大值-最小值)。归一化后,不同组数据即可做出比较。
  • 标准化:在计算一组数据的方差后,通过开根号的方式去除该组数据的量纲。 

Q4 如何拆分指标?  

1.在宏观上,从指标本身类型和获得复杂度来说,包括基础指标、复合指标和派生指标。

2.当聚焦在产品的不同生命周期阶段时,会产生各阶段的重点关注指标。

3.当细化到每个具体的业务时,从业务工作的拆分来讲,可根据业务的不同分为不同的指标类。 

4.对于互联网产品来说,会特别关注以下指标。 

5.从用户行为的角度来看,通过用户在关键路径上的一系列行为,为每个行为拆分测量指标。

Q5 如何分析用户路径?

视频类用户路径

电商购物用户路径 

内容平台用户路径

三、指标数据的分析 

Q1 获得指标数据后,可以分析什么信息? 

1.分析不同类型业务在整个业务中的占比情况

2.分析业务的增长趋势 

3.通过与自己、他人进行比较,分析业务的增长率和竞争力  

4.通过画象限的方法,分析出强势和弱势的业务  

5.通过对头部流量的分析,分析流量投入的集中程度 

6.通过对地域、用户、业务的维度分析,分析不同维度的用户对业务的偏好。  

TGI指数:在某个活动中,目标群体在总人群中的占比

——地域维度

——用户维度

——业务维度

06 复杂指标数据的影响因素有什么

指标的影响因素包括产品本身素质和用户群体两方面影响。

产品本身素质包括用户流量、转化率、成功率、价格等多项产品因素组成;用户群体为目标群体的群体特性。

用户群体作为对最为影响产品成功的部分,对受众群体做出细分,并进行完善的用户画像来研究。


四、分析的进行:统计

Q1 如何判断数据是否稳定?

描述统计学用于研究单个变量的集中趋势与离散趋势。 


选择一个数值来作为中心

Q2 确定中心数时,如何保证数据的代表性?



方差=[(数值1-平均数)²+(数值2-平均值)²+…]/N 

用来直观的对比离散程度的高低

标准差²=方差。去除方差的量纲,更精准的提现离散趋势

极差=(最大-最小) 。提现数据的偏差程度

偏差、方差共同描述离散程度。

Q3 如何判断数据范围?



Q4 如何找到异常值?

当数据服从正态分布,使用3σ原则

当数据不服从正态分布,使用箱线图


1.从小到大排列已有数据

2.选取25%,50%,75%,100%位距的数值

3.计算四分位距IQR,从而获得箱线图中箱子的长度;箱线图为数据提供3倍IQR的容错量。

IQR=Q3-Q1;上界=Q3+1.5IQR;下界=Q3-1.5IQR

4.根据数值画出箱线图,极限外的数据排除为异常数据

Q5 根据当前数据,如何预测接下来的趋势?

五、分析结果的运用

Q1 如何获得问题的结果?



1.罗列关联的数据(不同分析角度寻找不同数据)

2.列出公式,计算单位供给能力

3.列出公式,计算需求量

4.计算供给量


Q2 如何进行事件的策划?

人、时、地、事、因、做、果

把项目实际落地的具体手段。

策划产品活动案例

思考的基础是信息。若缺少信息,通过提问获得基础数据和细节。如:定价、产品价值、用户画像等。



分析付费点案例

拆分维度案例


Q3 如何分析用户的增长和留存?

常规模型:分析用户增长和留存的模型AARRR


拼多多模式:RARRA模型

留存——激活——传播——变现——注册

游戏化思路


游戏化用户增长策略:八角模型

相关文章:

数据分析入门

B站:01第一课 数据分析岗位职责和数据分析师_哔哩哔哩_bilibili 一、岗位:数据分析师 Q1 数据分析师在公司做什么工作? 数据来源于公司核心业务,通过监测业务健康度来确定业务的健康状况; 通过对用户精细化分析&am…...

车载网关通信能力解析——SV900-5G车载网关推荐

随着车联网的发展,各类车载设备对车载网关的需求日益增长。车载网关作为车与车、车与路、车与云之间连接的关键设备,其通信能力直接影响整个系统的性能。本文将详细解析车载网关的通信能力,并推荐性价比高的SV900-5G车载网关。 链接直达:https://www.key-iot.com/i…...

服务器中了mkp勒索病毒怎么处理,mkp勒索病毒解密,数据恢复

10月份以来,云天数据恢复中心陆续接到很多企业的求助,企业的服务器遭到了mkp勒索病毒攻击,导致企业的服务器数据库被加密,严重影响了企业工作,通过这一波mkp勒索病毒的攻击,云天数据恢复工程师为大家总结了…...

义乌再次位列第一档!2022年跨境电商综试区评估结果揭晓!

义乌跨境电商综试区捷报频传,在商务部公布的“2022年跨境电子商务综合试验区评估”结果中,中国(义乌)跨境电子商务综合试验区(以下简称:“跨境综试区”)评估结果为成效明显,综合排名…...

07、Python -- 序列相关函数与封包解包

目录 使用函数字符串也能比较大小序列封包序列解包多变量同时赋值 最大值、最小值、长度 序列解包与封包 使用函数 len()、max()、min() 函数可获取元组、列表的长度、最大值和最小值。 字符串也能比较大小 字符串比较大小时,将会依次按字符串中每个字符对应的编…...

# Spring 事务失效场景

Spring 事务失效场景 文章目录 Spring 事务失效场景前言事务不生效未开启事务事务方法未被Spring管理访问权限问题基于接口的代理源码解读 CGLIB代理 方法用final修饰同一类中的方法调用多线程调用不支持事务 事务不回滚设置错误的事务传播机制捕获了异常手动抛了别的异常自定义…...

华为OD 停车场车辆统计(100分)【java】A卷+B卷

华为OD统一考试A卷+B卷 新题库说明 你收到的链接上面会标注A卷还是B卷。目前大部分收到的都是B卷。 B卷对应20022部分考题以及新出的题目,A卷对应的是新出的题目。 我将持续更新最新题目 获取更多免费题目可前往夸克网盘下载,请点击以下链接进入: 我用夸克网盘分享了「华为O…...

出差学小白知识No6:LD_PRELOAD变量路径不对找不到库文件

交叉编译的时候出现以下问题,显示LD_PRELOAD变量找不到路劲 首先先查看一下LD_PRELOAD的路径:echo $LD_PRELOAD 如果输出一大串,那么先进行清空:unset LD_PRELOAD 重新给LD_PRELOAD进行赋值他的路径和库文件: expor…...

利用dns协议发起ddos反射攻击

利用DNS服务器发起反射型DDOS,攻击带宽 基本思路: 1、利用any类型的dns查询,可完成发送少量请求数据,获得大量返回数据。 2、将原请求地址改为受害者地址,则dns会向受害者返回大量数据,占用带宽 警告&…...

Tcl基础知识

一、概述 Tcl 语言的全称 Tool Command Language,即工具命令语言。这种需要在 EDA 工具中使用的相当之多,或者说几乎每个 EDA 工具都支持 Tcl 语言,并将它作为自己的命令shell。 静态时序分析中多用的 Synopsys Tcl 语言&#xff0c…...

Go中的编程模式:Pipeline

本文章我们重点来介绍一下 Go 编程中的 Pipeline 模式。用过 Linux 命令行的人都不会陌生,它是一种把各种命令拼接起来完成一个更强功能的技术方法,在C语言中也有pipe管道的叫法,具体的有兴趣的同学也可以去了解。 现在的流式处理、函数式编程、应用网关对微服务进行简单的…...

2023最新pytorch安装教程,简单易懂,面向初学者(Anaconda+GPU)

一、前言 目前是2023.1.27,鉴于本人安装过程中踩得坑,安装之前我先给即将安装pytorch的各位提个醒,有以下几点需要注意 1.判断自己电脑是否有GPU 注意这点很重要,本教程面向有NVIDA显卡的电脑,如果你的电脑没有GPU或者使用AMD显…...

Redis为什么变慢了

一、Redis为什么变慢了 1.Redis真的变慢了吗? 对 Redis 进行基准性能测试 例如,我的机器配置比较低,当延迟为 2ms 时,我就认为 Redis 变慢了,但是如果你的硬件配置比较高,那么在你的运行环境下,可能延迟是 0.5ms 时就可以认为 Redis 变慢了。 所以,你只有了解了你的…...

空中计算(Over-the-Air Computation)学习笔记

文章目录 写在前面 写在前面 本文是论文A Survey on Over-the-Air Computation的阅读笔记: 通信和计算通常被视为独立的任务。 从工程的角度来看,这种方法是非常有效的,因为可以执行孤立的优化。 然而,对于许多面向计算的应用程序…...

如何高效率地阅读论文

▚ 01 Active versus passive reading: how to read scientific papers? 📢小疑则小悟,大疑则大悟,不疑则不悟。 If you read/do research with small questions in mind, you learn small things. If you do so with big questions in…...

FreeRTOS学习day1

顾名思义 免费的实时操作系统 用法基本和Linux下的多线程编程类似 探索者开发版实验 动态创建4个任务start_task task1 task2 task3 优先级依次为1 2 3 4 (注意优先级不能为0,0是空闲任务) 我的理解:主线程start_task 主线程 task1 ta…...

【Web】| CSS Float (浮动)的使用方法

Float(浮动)概念 CSS的Float(浮动),会使得元素向左或者向右移动,其它周围元素也会重新排列。 Float浮动,往往是用于图像,但它的布局一样非常有效。 元素如何浮动 元素的水平方向…...

#力扣:面试题 02.03. 删除中间节点@FDDLC

面试题 02.03. 删除中间节点 - 力扣(LeetCode) 一、Java /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode(int x) { val x; }* }*/ class Solution {public void deleteNode(List…...

多线程原子性、一致性与有序性

作者:逍遥Sean 简介:一个主修Java的Web网站\游戏服务器后端开发者 主页:https://blog.csdn.net/Ureliable 觉得博主文章不错的话,可以三连支持一下~ 如有需要我的支持,请私信或评论留言! 前言: …...

读书笔记:Effective C++ 2.0 版,条款28(namespace )

条款28: 划分全局名字空间 namespace 作为前缀,防止不同名字域的类型、常量等互相污染。 没命名的名字空间一般用于限制名字空间内部元素的可见性。 namespace sdm {const double book_version 2.0;class handle { ... };handle& gethandle(); }早期用struct模…...

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介 对于社交类软件的功能,我们需要对它的功能特点进行分析: 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具: mysql:关系型数据库&am…...

2.Vue编写一个app

1.src中重要的组成 1.1main.ts // 引入createApp用于创建应用 import { createApp } from "vue"; // 引用App根组件 import App from ./App.vue;createApp(App).mount(#app)1.2 App.vue 其中要写三种标签 <template> <!--html--> </template>…...

Java 加密常用的各种算法及其选择

在数字化时代&#xff0c;数据安全至关重要&#xff0c;Java 作为广泛应用的编程语言&#xff0c;提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景&#xff0c;有助于开发者在不同的业务需求中做出正确的选择。​ 一、对称加密算法…...

Caliper 配置文件解析:config.yaml

Caliper 是一个区块链性能基准测试工具,用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构,并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析 这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件,主要包含以下几个部…...

关键领域软件测试的突围之路:如何破解安全与效率的平衡难题

在数字化浪潮席卷全球的今天&#xff0c;软件系统已成为国家关键领域的核心战斗力。不同于普通商业软件&#xff0c;这些承载着国家安全使命的软件系统面临着前所未有的质量挑战——如何在确保绝对安全的前提下&#xff0c;实现高效测试与快速迭代&#xff1f;这一命题正考验着…...

重启Eureka集群中的节点,对已经注册的服务有什么影响

先看答案&#xff0c;如果正确地操作&#xff0c;重启Eureka集群中的节点&#xff0c;对已经注册的服务影响非常小&#xff0c;甚至可以做到无感知。 但如果操作不当&#xff0c;可能会引发短暂的服务发现问题。 下面我们从Eureka的核心工作原理来详细分析这个问题。 Eureka的…...

HashMap中的put方法执行流程(流程图)

1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中&#xff0c;其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下&#xff1a; 初始判断与哈希计算&#xff1a; 首先&#xff0c;putVal 方法会检查当前的 table&#xff08;也就…...

【7色560页】职场可视化逻辑图高级数据分析PPT模版

7种色调职场工作汇报PPT&#xff0c;橙蓝、黑红、红蓝、蓝橙灰、浅蓝、浅绿、深蓝七种色调模版 【7色560页】职场可视化逻辑图高级数据分析PPT模版&#xff1a;职场可视化逻辑图分析PPT模版https://pan.quark.cn/s/78aeabbd92d1...

C++:多态机制详解

目录 一. 多态的概念 1.静态多态&#xff08;编译时多态&#xff09; 二.动态多态的定义及实现 1.多态的构成条件 2.虚函数 3.虚函数的重写/覆盖 4.虚函数重写的一些其他问题 1&#xff09;.协变 2&#xff09;.析构函数的重写 5.override 和 final关键字 1&#…...

【Nginx】使用 Nginx+Lua 实现基于 IP 的访问频率限制

使用 NginxLua 实现基于 IP 的访问频率限制 在高并发场景下&#xff0c;限制某个 IP 的访问频率是非常重要的&#xff0c;可以有效防止恶意攻击或错误配置导致的服务宕机。以下是一个详细的实现方案&#xff0c;使用 Nginx 和 Lua 脚本结合 Redis 来实现基于 IP 的访问频率限制…...