CDA-LevelⅡ【考题整理-带答案】
- 关于相关分析中应注意的问题,下面说法错误的是:B 如果两变量间的相关系数为0,则说明二者独立 。解释:只能说明两者不存在线性相关关系
- 现通过参数估计得到一个一元线性回归模型为y=3x+4,在回归系数检验中下列说法错误的是: B 原假设B1= 3 。 解释:应该是0
- 关于一元线性回归的求解过程说法正确的是: A 一元线性回归只需要求解出两个系数即可
- 回归模型知识根据已有数据总结出了其中包含的线性关系,然后对于新样本进行预测,但是预测值与真实值之间是可能存在差异的
- 一元线性回归模型的基本形式一般是包含常数项的
- 回归模型中的估计系数是对应真实系数的无偏差估计
- 根据最小二乘法拟合直线回归方程是使:B 离差平方和最小的参数 。解释:离差就是真实值与预测值的偏差
- 在给定的显著性水平下,某一特性的X水平上,总体Y分布的离散度越大,则: A 预测区间越宽,精度越低
- 关于单因素方差分析,下列说法不正确的是 : A 组间平方和只包含随机误差 。解释:组件误差包括间差异和随机误差。
- 为了比较两个总体方差,我们通常可以检验两个总体的: B 方差比 。解释:通常采用检验两个总体方差比的F检验;
- 方差分析中:组内误差平方和+组件误差平方和= 总误差平方和;组内自由度+组间自由度= 总自由度;f值= 组间均方误/组内均方误
- 方差分析是统计学中常用知识,下列关于方差分析的说法不正确的是: A 方差分析是一种检验若干个正太分布的均值和方差是否相等的一种统计方法 ;解释:方差分析是一种检验若干个独立正态总体均值是否相等的一种统计方法,不能用于检测方差是否相等。
- 在假设检验问题中,原假设为H0,给定显著水平为a,则正确的是 C: p(拒绝H0|H0正确) = a 。解释:显著水平就是标识原假设为真时,拒绝原假设的概率
- 在样本量给定的条件下,假设检验 中当第一类错误减小时,第二类错误怎么变化? A 必然增大 。
- 在列联表分析中,下列不能用卡方检验的是: C 多个均值的比较 。解释:卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,在分类资料推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比较的卡方检验。两个及两个以上样本均值的比较是用方差分析。
- 在假设检验问题中,原假设为H0,给定显著水平为a,则关于假设检验的原理说法正确的是 B 小概率事件 。解释:假设检验的基本思想:假设样本是从原总体中抽取的,在此假设下构造一个小概率事件。若假设成立,则小概率事件一般是不会发生的,但在一次抽样中,如果小概率事件发生了,则拒绝接收这个假设。
- 置信区间是统计学中常用的概念,一个95%的置信区间的含义是: D 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。
- 一个手机电池制造商声称,其生产的电池一次充电后正常条件下使用时长为20小时,对一个由15个电池组成的随机样本做了实验,测得平均值使用时长服从正太分布,则检验该电池与厂商声称的标准是否相符,我们应该选择: A 双侧t检验 。解释:这是一个假设检验的问题。电池使用时长服从正态分布,待检验的原因假设H0;m=20,说明是双向检测问题;又由于总体方差s是未知的,故采用t检测。
- 抽样是统计分析中常用的技术手段,现有一抽样的描述:“将总体的所有单位(抽样单位)按照一定顺序排列,在规定的范围i内随机抽取一个单位,这种抽样的方法称为”:D 系统抽样。
- X为服从正太分布的随机变量N(2,9),如果P(X>c) = P(X<c),则c的值为 B 2.解释:正态分布密度曲线关于均值m对称,m是正态分布的中心,也就是说:均值两侧发生的概率相等。
- 若x1、x2、x3取自某总体的样本,当期望a已知,方差c未知时,则以下不是统计量的是: D (x1+x2+x3)/c 解释:统计量是不含任何未知参数的
- ABtest是运维人员、产品经历等经常使用的工具,下面关于AB实验中最小样本量的描述正确的是:A 在其他条件一定时,预期提升比例越大,最小样本量越小 。解释:AB实验室为了检验某方案是否有效,即检验方案实施后的总体B是否相对实施前的总体A有显著提升。预期提升比例越大越说明B比A有显著差异,则只需越少的样本就能得出显著的结论。
- 用户画像室互联网企业常用的技术手段,通过对用户进行画像实现精准营销等商业活动,下面关于用户画像的说法错误的是:C 用户标签必须描述客观的事实。 解释:用户画像本质上是将用户的数据标签化。用户画像是具有动态性和时效性的,同一个用户不同的阶段、不同的时间标签是不一样的。比如是否购买过某商品的标签会因为用户消费行为产生变化。有些用户标签是基于业务经验打上的,有很强的主观性,不一定是客观事实。
- RFM是很传统的数据分析模型,下面关于RFM模型的描述错误的是:C 数据中只需含有用户ID、消费金额、消费日期三个字段即可使用RFM模型进行用户分层,无需考虑用户ID是否统一。
- 数据标签化是企业数据分析的基础工作,关于企业对数据进行标签化的目的错误的是:D 减少数据占用的存储空间。解释:企业数据标签化主要是为了后期业务系统能快速的应用数据,例如在精细化运营、用户画像分析(用户分析)、精准营销等方面,而不是为了减少数据占用的存储空间。
- 数据分析师在工作中常常会遇到两个概念:标签、指标,下列关于标签与指标的描述正确的是:A 指标通常可以量化,但是标签一般是不可量化的。解释:指标与标签概念不同,指标是用来定义、评价和描述特定事务的一种标准或方法;比如,新增用户数、累计用户数、用户活跃率等是衡量用户发展情况的指标。
- 标签系统又许多分类,从实现规则上可以为三类:基于统计类的、基于规则类的、基于挖掘技术类的,下面对于标签的分类错误的是:A APP的使用时长属于基于规则的标签。g
- 基于统计类的标签:这类标签是可以从用户注册、用户访问、消费类数据中统计得出,是最为基础的标签类型。例如:性别、城市、App使用时长、周均启用次数、月均消费金额等
- 基于规则类的标签:该类标签基于用户行为及确定的规则产生,在实际开发标签过程中,该类标签的规则由运营人员和数据人员共同协商确定;
- 基于挖掘类的标签:该类标签为概率模型,概率介于0-1之间的数值,需要通过算法挖掘产生。
- 企业数据仓库里面的数据一般是由业务数据经过ETL技术处理后来的,以下关于ETL的说法错误的是:A ETL过程中主要环节是数据抽取、数据转换和加工、数据流转
- 下面关于第三范式关系必然符合的条件,说法错误的是:C 其他关系的属性需要依赖于主键
- 企业数据分为:元数据、主数据、参考数据等分类,下面属于参考数据的是: A 客户等级分为A,B,C 。解释:A、B、C是数据取值的范围,属于参考数据
- 业务系统往往因为系统故障、设备故障、人为失误等原因导致数据中存在异常数据,下列哪一项方法对于发现异常值有帮助 A 计算均值加减三倍标准差的范围
- 业务数据中因为某些原因可能存在异常值,先要通过可视化的方式查找某些字段数据中的异常值,优先使用: A 箱型图
相关文章:
CDA-LevelⅡ【考题整理-带答案】
关于相关分析中应注意的问题,下面说法错误的是:B 如果两变量间的相关系数为0,则说明二者独立 。解释:只能说明两者不存在线性相关关系现通过参数估计得到一个一元线性回归模型为y3x4,在回归系数检验中下列说法错误的是…...

20240304 json可以包含复杂数组(数组里面套数组)
欣赏一下我的思维,它会以漫画,表格,文字。。。各种各样的形式呈现 对于问题1问题2 JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成。JSON本质上是一种文本…...

算法50:动态规划专练(力扣514题:自由之路-----4种写法)
题目: 力扣514 : 自由之路 . - 力扣(LeetCode) 题目的详细描述,直接打开力扣看就是了,下面说一下我对题目的理解: 事例1: 输入: ring "godding", key "gd" 输出: 4. 1. ring的第…...

重学SpringBoot3-集成Thymeleaf
更多SpringBoot3内容请关注我的专栏:《SpringBoot3》 期待您的点赞👍收藏⭐评论✍ 重学SpringBoot3-集成Thymeleaf 1. 添加Thymeleaf依赖2. 配置Thymeleaf属性(可选)3. 创建Thymeleaf模板4. 创建一个Controller5. 运行应用并访问页…...

【数据可视化】Echarts最常用图表
个人主页 : zxctscl 如有转载请先通知 文章目录 1. 前言2. 准备工作3. 柱状图3.1 绘制堆积柱状图3.2 绘制标准条形图3.3 绘制瀑布图 4. 折线图4.1 绘制堆积面积图和堆积折线图4.2 绘制阶梯图 5. 饼图5.1 绘制标准饼图5.2 绘制圆环图5.2 绘制嵌套饼图5.3 绘制南丁格尔…...
flink:通过table api把文件中读取的数据写入MySQL
当写入数据到外部数据库时,Flink 会使用 DDL 中定义的主键。如果定义了主键,则连接器将以 upsert 模式工作,否则连接器将以 append 模式工作 package cn.edu.tju.demo2;import org.apache.flink.streaming.api.environment.StreamExecutionE…...
【Java 多线程 哈希表】 HashTable, HashMap, ConcurrentHashMap 之间的区别
HashTable、HashMap和ConcurrentHashMap都是Java中用于存储键值对的集合框架的一部分,但它们之间存在一些重要的联系和区别。 联系 键值对存储:它们都用于存储键值对,并允许你根据键来检索值。基于哈希:它们内部都使用了哈希表来…...
有趣之matlab-烟花
待整合1 2 3 动态 有趣编程之11 静态 逼真 3 .m文件路径下放back1.jpg back4.jpg…背景照片 点击screen 就会有小白点升起,爆炸 function yanhuamoban()clear all;%定义全局变量global ah ;%坐标轴句柄global styleNum ;%爆炸图案样式global multiColor; %多颜色变换…...

C语言指针与数组(不适合初学者版):一篇文章带你深入了解指针与数组!
🎈个人主页:JAMES别扣了 💕在校大学生一枚。对IT有着极其浓厚的兴趣 ✨系列专栏目前为C语言初阶、后续会更新c语言的学习方法以及c题目分享. 😍希望我的文章对大家有着不一样的帮助,欢迎大家关注我,我也会回…...
springboot Mongo大数据查询优化方案
前言 因为项目需要把传感器的数据保存起来,当时设计的时是mongo来存储,后期需要从mongo DB里查询传感器的数据记录。由于传感器每秒都会像mongo数据库存500条左右的数据,1天就有4320万条数据,要想按照时间条件去查询,…...

Ollama管理本地开源大模型,用Open WebUI访问Ollama接口
现在开源大模型一个接一个的,而且各个都说自己的性能非常厉害,但是对于我们这些使用者,用起来就比较尴尬了。因为一个模型一个调用的方式,先得下载模型,下完模型,写加载代码,麻烦得很。 对于程…...

Linux--基本知识入门
一.几个基本知识 终端: CtrlAltT 或者桌面/文件夹右键,打开终端切换为管理员: sudo su 退出:exit查看内核版本号: uname -a内核版本号含义: 5 代表主版本号;13代表次版本号;0代表修订版本号;30代表修订版本的第几次微调;数字越大表示内核越新. 二.目录…...

基于springboot+vue实现的大学计算机课程管理平台的设计与实现(全套资料)
一、系统架构 前端:vue | antv 后端:springboot | mybatis-plus 环境:jdk17 | mysql | maven | node | redis 二、代码及数据库 三、功能介绍 01. 登录页 02. 首页 03. 系统基础模块-用户管理 04. 系统基础模块-部门…...

LeetCode2115. 从给定原材料中找到所有可以做出的菜
拓扑排序 题面 题目链接:2115. 从给定原材料中找到所有可以做出的菜 - 力扣(LeetCode) 你有 n 道不同菜的信息。给你一个字符串数组 recipes 和一个二维字符串数组 ingredients 。第 i 道菜的名字为 recipes[i] ,如果你有它 所有…...

项目性能优化—性能优化的指标、目标
项目性能优化—性能优化的指标、目标 性能优化的终极目标是什么 性能优化的目标实际上是为了更好的用户体验: 一般我们认为用户体验是下面的公式: 用户体验 产品设计(非技术) 系统性能 ≈ 系统性能 快 那什么样的体验叫快呢…...
蓝桥杯刷题(三)
一、P8752 [蓝桥杯 2021 省 B2] 特殊年份(洛谷) 题目描述 今年是 2021 年,2021 这个数字非常特殊, 它的千位和十位相等, 个位比百位大 1,我们称满足这样条件的年份为特殊年份。 输入 5 个年份,请计算这里面有多少个…...
20240312-算法复习打卡day21||● 530.二叉搜索树的最小绝对差 ● 501.二叉搜索树中的众数 ● 236. 二叉树的最近公共祖先
530.二叉搜索树的最小绝对差 1.中序遍历得到升序数组 class Solution { private:vector<int> vec;void traversal(TreeNode* root) {if (root NULL) return;if (root->left) traversal(root->left);vec.push_back(root->val);if (root->right) traversal(r…...

今天我们来学习一下关于MySQL数据库
目录 前言: 1.MySQL定义: 1.1基础概念: 1.1.1数据库(Database): 1.1.2表(Table): 1.1.3记录(Record)与字段(Field): …...

长期护理保险可改善老年人心理健康 | CHARLS CLHLS CFPS 公共数据库周报(3.6)...
欢迎报名2024年“真实世界临床研究”课程! 本周郑老师开讲:“真实世界临床研究”培训班,3月16-17日两天,欢迎报名! CHARLS公共数据库 CHARLS数据库简介中国健康与养老追踪调查(China Health and Retirement Longitud…...

49、C++/友元、常成员函数和常对象、运算符重载学习20240314
一、封装类 用其成员函数实现(对该类的)数学运算符的重载(加法),并封装一个全局函数实现(对该类的)数学运算符的重载(减法)。 代码: #include <iostream…...

地震勘探——干扰波识别、井中地震时距曲线特点
目录 干扰波识别反射波地震勘探的干扰波 井中地震时距曲线特点 干扰波识别 有效波:可以用来解决所提出的地质任务的波;干扰波:所有妨碍辨认、追踪有效波的其他波。 地震勘探中,有效波和干扰波是相对的。例如,在反射波…...
rknn优化教程(二)
文章目录 1. 前述2. 三方库的封装2.1 xrepo中的库2.2 xrepo之外的库2.2.1 opencv2.2.2 rknnrt2.2.3 spdlog 3. rknn_engine库 1. 前述 OK,开始写第二篇的内容了。这篇博客主要能写一下: 如何给一些三方库按照xmake方式进行封装,供调用如何按…...

python/java环境配置
环境变量放一起 python: 1.首先下载Python Python下载地址:Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个,然后自定义,全选 可以把前4个选上 3.环境配置 1)搜高级系统设置 2…...

【JVM】- 内存结构
引言 JVM:Java Virtual Machine 定义:Java虚拟机,Java二进制字节码的运行环境好处: 一次编写,到处运行自动内存管理,垃圾回收的功能数组下标越界检查(会抛异常,不会覆盖到其他代码…...
条件运算符
C中的三目运算符(也称条件运算符,英文:ternary operator)是一种简洁的条件选择语句,语法如下: 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true,则整个表达式的结果为“表达式1”…...

最新SpringBoot+SpringCloud+Nacos微服务框架分享
文章目录 前言一、服务规划二、架构核心1.cloud的pom2.gateway的异常handler3.gateway的filter4、admin的pom5、admin的登录核心 三、code-helper分享总结 前言 最近有个活蛮赶的,根据Excel列的需求预估的工时直接打骨折,不要问我为什么,主要…...
基于数字孪生的水厂可视化平台建设:架构与实践
分享大纲: 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年,数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段,基于数字孪生的水厂可视化平台的…...

DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
C# SqlSugar:依赖注入与仓储模式实践
C# SqlSugar:依赖注入与仓储模式实践 在 C# 的应用开发中,数据库操作是必不可少的环节。为了让数据访问层更加简洁、高效且易于维护,许多开发者会选择成熟的 ORM(对象关系映射)框架,SqlSugar 就是其中备受…...

网络编程(UDP编程)
思维导图 UDP基础编程(单播) 1.流程图 服务器:短信的接收方 创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...