当前位置: 首页 > news >正文

CDA数据分析师一级经典错题知识点总结(5)

1、数值型缺失值用中位数补充,分类数据用众数补充。

2、偏态系数>1就是高度偏,0.5到1是中度。

3、分布和检验

在 t检验之前进行 F检验的目的是确保 t检验的方差齐性假设成立。如果 F检验结果显示方差不相等,则需要切换到调整后的 t 检验(Welch t检验),以获得更准确的分析结果。

分布类型常用检验方法适用场景
正态分布正态性检验判断数据分布形式,作为后续分析前提
卡方分布卡方检验、方差检验分析分类数据的独立性或分布拟合优度
t分布t检验小样本均值比较,数据需服从正态分布
F分布方差分析(ANOVA)、回归方程的显著性检验多组数据均值比较,数据需服从正态分布

均值:

t检验是样本均值检验,比较均值差异。

z检验用于大样本(样本量 > 30)或已知总体标准差的情况。例如,比较城市居民的平均收入是否达到全国平均水平。

方差:

F检验,比较两个样本的方差是否相等、是用于判断t检验的前提,所以F在t前。

方差分析检验,用于比较三个及以上组的均值是否相等。例如,不同城市对某商品满意度的差异。

Pearson相关性检验

  • 用于检验两个变量是否呈线性相关,适用于正态分布的数据。

Spearman秩相关性检验

  • 替代Pearson相关性检验,用于非正态分布数据或等级数据。

分布:

卡方分布检验

用于离散型数据,检验实际分布与理论分布是否一致。例如,检验某调查数据与预期比例的吻合程度。

分类:

卡方检验(Chi-square test)

  • 检验分类变量之间的独立性。例如,分析性别与购物偏好是否相关。

4、箱线图 从小到大排列

Q1代表1/4分位点,Q3代表3/4分位点,Q1<Q3。

中位数在Q1和Q3之间,Q3-Q1=1QR,其中Q1-1.5(1QR) 为下限

Q3+1.5(1QR)为上限。

5、销售一般用目标比和同环比。

6、库销比反应进销存的流转速度,进而反映资金利用率。

7、SPU和SKU

SPU:Standard Product Unit,标准产品单元,可以理解为一个产品型号,比如上面图片看到的iPhone 14 (A2884) 就是一个标准的产品单元,它属于生产制造过程的一个标准品,标准品在缺乏具体规格信息的时候是不能直接售卖的(除非这个产品系列只有一个规格)。

SKU:Stock Keeping Unit,最小库存单元,也就是对应仓库中的一件商品,这个商品的规格信息在入库的时候就已经确定了的,因此是可以直接售卖的。

SPU 和 SKU 的关系:SPU 是一个相对抽象的概念,而SKU 是具象化的 SPU,也就是在 SPU 基础上添加了一个可售卖完整的规格信息,从而能够让顾客明确知道拿到手的商品是什么样。以服装为例,服装的一个款式是一个 SPU,只有加上了尺码、颜色后才能成为一个 SKU。、

8、波士顿矩形,又称为 BCG矩阵(Boston Consulting Group Matrix)。

  • 明星(Stars)
    • 特点:高市场增长率 + 高市场份额。
    • 策略:投资支持,继续扩大市场占有率,但需大量资金投入。
    • 例子:快速增长的主流产品或市场占主导地位的创新业务。
  • 金牛(Cash Cows)
    • 特点:低市场增长率 + 高市场份额。
    • 策略:维持现状,收割利润,支持其他业务发展。
    • 例子:成熟市场中的核心盈利产品。
  • 问题(Question Marks)
    • 特点:高市场增长率 + 低市场份额。
    • 策略:选择性投资,找到有潜力的业务转化为明星,否则放弃。
    • 例子:新兴但竞争激烈的市场业务。
  • 瘦狗(Dogs)
    • 特点:低市场增长率 + 低市场份额。
    • 策略:减少投资甚至退出,避免资源浪费。
    • 例子:市场边缘产品或夕阳产业。

9、统计图表不能用维度字段作为横坐标。

10、BI报表在设计阶段是把业务转为维度和度量的过程。

11、峰度 = 0是正态分布。

12、总订单平均值,要计算非重复订单。

13、AARRR模型:获取、激活、留存、获益(提高客单价付费转化率Revenue)、传播

14、ARPU(Average Revenue Per User) 平均用户收入,总收入/活跃用户数量

、CRM(Customer Relationship Management) 客户关系管理,重点在于提升客户满意度与忠诚度,并最终实现收益增长。

、CVM(Customer Value Management) 客户价值管理,强调通过分析客户的生命周期价值(CLV Customer Lifetime Value )优化与客户的互动,主要关注客户的长期收益贡献。

15、DML语言

-- 修改字段名
ALTER TABLE table_name
RENAME COLUMN old_column_name TO new_column_name;
-- 添加字段
ALTER TABLE employees
ADD hire_date DATE;
--删除字段
ALTER TABLE table_name
DROP COLUMN column_name;
ALTER TABLE employees
DROP COLUMN hire_date;-- 修改表名
ALTER TABLE employees
RENAME TO staff;-- 添加主键
ALTER TABLE employees
ADD PRIMARY KEY (employee_id);
-- 删除主键
ALTER TABLE employees
DROP PRIMARY KEY;
-- 语句更改字段属性或位置时至少需要指定字段名+字段的数据类型
ALTER TABLE employees
MODIFY salary INT AFTER age;

16、线性相关的强度

r=协方差 / 标准差的乘积

  1. 非常强的相关性
    • r 的绝对值接近 1(即 r 在 0.8 到 1.0 或 -0.8 到 -1.0 之间)表示非常强的线性关系。
  2. 强相关性
    • r 的绝对值在 0.6 到 0.8 之间表示强的线性关系。
  3. 中等程度的相关性
    • r的绝对值在 0.3 到 0.6 之间表示中等程度的线性关系。
  4. 弱相关性
    • r的绝对值在 0.1 到 0.3 之间表示弱的线性关系。
  5. 非常弱的相关性或无相关性
    • r的绝对值小于 0.1 通常被认为是非常弱的相关性或没有线性相关。

17、浏览量PV是对店铺内所有页面的总浏览量,而访问数visit(session数)是用户到达店铺或者平台到离开的一次完整访问,跳失次数表示用户进入首页没有下一步操作就离开的次数。

UV 访客数 是独立访问数

跳失率= 跳失次数/访问数

平均访问深度= 浏览量/访问数

18、ARPU,用户平均收入,Average Revenue Per User = 总收入/总用户数。

19、CAC,用户获取成本,Customer Acquisition Cost 。

20、费用支付核算方式

  1. CPM Mille 千次曝光
  2. CPS Sales 实际销售
  3. CPC Click 点击收费

21、表格结构数据的函数组成部分:操作符、函数表达式、参数、返回值。

22、空值是空白值的简称。

23、漏斗模型需要关注体型、流速、体量。

24、数据驱动业务:以经验为主,经验比数据更加可信。

25、BI报表和业务分析报告的区别主要是:

  1. 侧重业务面的完整叙述
  2. 动态信息
  3. 以表格图表为主
  4. 基于多源数据

相关文章:

CDA数据分析师一级经典错题知识点总结(5)

1、数值型缺失值用中位数补充&#xff0c;分类数据用众数补充。 2、偏态系数>1就是高度偏&#xff0c;0.5到1是中度。 3、分布和检验 在 t检验之前进行 F检验的目的是确保 t检验的方差齐性假设成立。如果 F检验结果显示方差不相等&#xff0c;则需要切换到调整后的 t 检验…...

服务器、电脑和移动手机操作系统

一、服务器操作系统 1、Windows Server 开发商是微软公司。友好的用户界面、与微软生态系统的高度集成、提供了广泛的企业级功能&#xff08;如Active Directory、DNS、DHCP服务等&#xff09;。适合需要大量运行Microsoft应用和服务的企业环境&#xff0c;如SQL Server等。经…...

深入解析 Flink 与 Spark 的性能差异

&#x1f496; 欢迎来到我的博客&#xff01; 非常高兴能在这里与您相遇。在这里&#xff0c;您不仅能获得有趣的技术分享&#xff0c;还能感受到轻松愉快的氛围。无论您是编程新手&#xff0c;还是资深开发者&#xff0c;都能在这里找到属于您的知识宝藏&#xff0c;学习和成长…...

如何在 Linux、MacOS 以及 Windows 中打开控制面板

控制面板不仅仅是一系列图标和菜单的集合&#xff1b;它是通往优化个人计算体验的大门。通过它&#xff0c;用户可以轻松调整从外观到性能的各种参数&#xff0c;确保他们的电脑能够完美地适应自己的需求。无论是想要提升系统安全性、管理硬件设备&#xff0c;还是简单地改变桌…...

微信小程序中 隐藏scroll-view 滚动条 网页中隐藏滚动条

在微信小程序中隐藏scroll-view的滚动条可以通过以下几种方法实现&#xff1a; 方法一&#xff1a;使用CSS隐藏滚动条 在小程序的样式文件中&#xff08;如app.wxss或页面的.wxss文件&#xff09;&#xff0c;添加以下CSS代码来隐藏滚动条&#xff1a; scroll-view ::-webkit…...

Java 实现 Elasticsearch 查询当前索引全部数据

Java 实现 Elasticsearch 查询当前索引全部数据 需求背景通常情况Java 实现查询 Elasticsearch 全部数据写在最后 需求背景 通常情况下&#xff0c;Elasticsearch 为了提高查询效率&#xff0c;对于不指定分页查询条数的查询语句&#xff0c;默认会返回10条数据。那么这就会有…...

android刷机

android ota和img包下载地址&#xff1a; https://developers.google.com/android/images?hlzh-cn android启动过程 线刷 格式&#xff1a;ota格式 模式&#xff1a;recovery 优点&#xff1a;方便、简单&#xff0c;刷机方法通用&#xff0c;不会破坏手机底层数据&#xff0…...

【25考研】西南交通大学计算机复试重点及经验分享!

一、复试内容 上机考试&#xff1a;考试题型为编程上机考试&#xff0c;使用 C 语言&#xff0c;考试时长包括 15 分钟模拟考试和 120 分钟正式考试&#xff0c;考试内容涵盖顺序结构、选择结构、循环结构、数组、指针、字符串处理、函数、递归、结构体、动态存储、链表等知识点…...

OpenCV相机标定与3D重建(49)将视差图(disparity map)重投影到三维空间中函数reprojectImageTo3D()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 将视差图像重投影到3D空间。 cv::reprojectImageTo3D 是 OpenCV 库中的一个函数&#xff0c;用于将视差图&#xff08;disparity map&#xff09…...

学习HTTP Range

HTTP Range 请求 一种通过指定文件字节范围加载部分数据的技术&#xff0c;广泛用于断点续传、流媒体播放、分布式文件系统的数据分片加载等场景。 请求格式-在请求头中使用 Range 字段指定所需的字节范围 Range: bytes0-1023// bytes0-1023&#xff1a;表示请求文件的第 0 …...

大语言模型训练的数据集从哪里来?

继续上篇文章的内容说说大语言模型预训练的数据集从哪里来以及为什么互联网上的数据已经被耗尽这个说法并不专业&#xff0c;再谈谈大语言模型预训练数据集的优化思路。 1. GPT2使用的数据集是WebText&#xff0c;该数据集大概40GB&#xff0c;由OpenAI创建&#xff0c;主要内…...

Webpack和Vite的区别

一、构建速度方面 webpack默认是将所有模块都统一打包成一个js文件&#xff0c;每次修改都会重写构建整个项目&#xff0c;自上而下串行执行&#xff0c;所以会随着项目规模的增大&#xff0c;导致其构建打包速度会越来越慢 vite只会对修改过的模块进行重构&#xff0c;构建速…...

【再谈设计模式】模板方法模式 - 算法骨架的构建者

一、引言 在软件工程、软件开发过程中&#xff0c;我们经常会遇到一些算法或者业务逻辑具有固定的流程步骤&#xff0c;但其中个别步骤的实现可能会因具体情况而有所不同的情况。模板方法设计模式&#xff08;Template Method Design Pattern&#xff09;就为解决这类问题提供了…...

Bytebase 3.1.1 - 可定制的快捷访问首页

&#x1f680; 新功能 可定制的快捷访问首页。 支持查询 Redis 集群中所有节点。 赋予项目角色时&#xff0c;过期时间可以定义精确到秒级的时间点。 &#x1f514; 重大变更 移除 Database 消息里的实例角色信息。调用 GetInstance 或 ListInstanceRoles 以获取实例角色信息…...

Java阶段四04

第4章-第4节 一、知识点 CSRF、token、JWT 二、目标 理解什么是CSRF攻击以及如何防范 理解什么是token 理解什么是JWT 理解session验证和JWT验证的区别 学会使用JWT 三、内容分析 重点 理解什么是CSRF攻击以及如何防范 理解什么是token 理解什么是JWT 理解session验…...

B2C API安全警示:爬虫之外,潜藏更大风险挑战

在数字化时代&#xff0c;B2C&#xff08;Business-to-Consumer&#xff09;电子商务模式已成为企业连接消费者、推动业务增长的重要桥梁。而B2C API&#xff08;应用程序编程接口&#xff09;作为企业与消费者之间数据交互的桥梁&#xff0c;其安全性更是至关重要。然而&#…...

OCR文字识别—基于PP-OCR模型实现ONNX C++推理部署

概述 PaddleOCR 是一款基于 PaddlePaddle 深度学习平台的开源 OCR 工具。PP-OCR是PaddleOCR自研的实用的超轻量OCR系统。它是一个两阶段的OCR系统&#xff0c;其中文本检测算法选用DB&#xff0c;文本识别算法选用CRNN&#xff0c;并在检测和识别模块之间添加文本方向分类器&a…...

如何播放视频文件

文章目录 1. 概念介绍2. 使用方法2.1 实现步骤2.2 具体细节3. 示例代码4. 内容总结我们在上一章回中介绍了"如何获取文件类型"相关的内容,本章回中将介绍如何播放视频.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 播放视频是我们常用的功能,不过Flutter官方…...

MySQL -- 约束

1. 数据库约束 数据库约束时关系型数据库的一个重要功能,主要的作用是保证数据的有效性,也可以理解为数据的正确性(数据本身是否正确,关联关系是否正确) 人工检查数据的完整性工作量非常大,在数据库中定义一些约束,那么数据在写入数据库的时候,就会帮我们做一些校验.并且约束一…...

php 使用simplexml_load_string转换xml数据格式失败

本文介绍如何使用php函数解析xml数据为数组。 <?php$a <xml><ToUserName><![CDATA[ww8b77afac71336111]]></ToUserName><FromUserName><![CDATA[sys]]></FromUserName><CreateTime>1736328669</CreateTime><Ms…...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…...

(十)学生端搭建

本次旨在将之前的已完成的部分功能进行拼装到学生端&#xff0c;同时完善学生端的构建。本次工作主要包括&#xff1a; 1.学生端整体界面布局 2.模拟考场与部分个人画像流程的串联 3.整体学生端逻辑 一、学生端 在主界面可以选择自己的用户角色 选择学生则进入学生登录界面…...

线程同步:确保多线程程序的安全与高效!

全文目录&#xff1a; 开篇语前序前言第一部分&#xff1a;线程同步的概念与问题1.1 线程同步的概念1.2 线程同步的问题1.3 线程同步的解决方案 第二部分&#xff1a;synchronized关键字的使用2.1 使用 synchronized修饰方法2.2 使用 synchronized修饰代码块 第三部分&#xff…...

【决胜公务员考试】求职OMG——见面课测验1

2025最新版&#xff01;&#xff01;&#xff01;6.8截至答题&#xff0c;大家注意呀&#xff01; 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:&#xff08; B &#xff09; A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...

微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据

微软PowerBI考试 PL300-在 Power BI 中清理、转换和加载数据 Power Query 具有大量专门帮助您清理和准备数据以供分析的功能。 您将了解如何简化复杂模型、更改数据类型、重命名对象和透视数据。 您还将了解如何分析列&#xff0c;以便知晓哪些列包含有价值的数据&#xff0c;…...

#Uniapp篇:chrome调试unapp适配

chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器&#xff1a;Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...

代码随想录刷题day30

1、零钱兑换II 给你一个整数数组 coins 表示不同面额的硬币&#xff0c;另给一个整数 amount 表示总金额。 请你计算并返回可以凑成总金额的硬币组合数。如果任何硬币组合都无法凑出总金额&#xff0c;返回 0 。 假设每一种面额的硬币有无限个。 题目数据保证结果符合 32 位带…...

深度学习水论文:mamba+图像增强

&#x1f9c0;当前视觉领域对高效长序列建模需求激增&#xff0c;对Mamba图像增强这方向的研究自然也逐渐火热。原因在于其高效长程建模&#xff0c;以及动态计算优势&#xff0c;在图像质量提升和细节恢复方面有难以替代的作用。 &#x1f9c0;因此短时间内&#xff0c;就有不…...

Python+ZeroMQ实战:智能车辆状态监控与模拟模式自动切换

目录 关键点 技术实现1 技术实现2 摘要&#xff1a; 本文将介绍如何利用Python和ZeroMQ消息队列构建一个智能车辆状态监控系统。系统能够根据时间策略自动切换驾驶模式&#xff08;自动驾驶、人工驾驶、远程驾驶、主动安全&#xff09;&#xff0c;并通过实时消息推送更新车…...

Rust 开发环境搭建

环境搭建 1、开发工具RustRover 或者vs code 2、Cygwin64 安装 https://cygwin.com/install.html 在工具终端执行&#xff1a; rustup toolchain install stable-x86_64-pc-windows-gnu rustup default stable-x86_64-pc-windows-gnu ​ 2、Hello World fn main() { println…...