当前位置: 首页 > news >正文

一份热乎的数据分析(数仓)面试题 | 每天一点点,收获不止一点

目录

1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

2. 设计数据仓库的保单表(⾃⾏命名)

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

6.2 异常值检测问题 

6.3  无效搜索问题 | 百度面试题

 6.4 区间分布问题

6.5 用户购买行为分析

 6.6 滴滴呼叫订单问题

 6.7 蚂蚁森林低碳生活数据分析

 6.8 快手直播间人员在线分析

6.9 京东电商购物漏斗分析 

6.10 Soul 用户活跃、留存和粘性分析

​6.11 微信-情人节红包流向探索分析

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!


1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

根据数据仓库命名规范给用户维度表命名
字段名字段类型描述
customeridstring用户唯一标识
agebigint用户年龄
age_descstring用户年龄分层(21岁到60岁,每5岁为一个间隔,例如21-25、26-30)
1.1 create :创建⽤⼾维度表(hive)
要求1,建表
要求2,保留最近7⽇分区
1.2 insert :将ods表导⼊建好的⽤⼾维度表

2. 设计数据仓库的保单表(⾃⾏命名)

(保单表)数据范围2024年8月1日至今的新短期付费保险单
字段名字段类型描述
用户唯一标识
产品ID
保单号
保费
投保日期
其他能想到的维度自行补充

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

参考数据如下:Mike是在1/6,John是在1/8,Lisa是在1/4
用户唯一标识保费投保日期
Mike20002024-01-01
Mike20002024-01-02
John30002024-01-02
Lisa50002024-01-04
Mike60002024-01-06
John20002024-01-08
Lisa10002024-01-08

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

推荐人被推荐人推荐层级
AB1
BC1
AD1
DE1
DF1
CH1

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

 数据分析面试题:客户投保问题分析-CSDN博客

6.2 异常值检测问题 

 数据分析面试题:如何分析基于绝对中位差的异常值检测问题?-CSDN博客

6.3  无效搜索问题 | 百度面试题

数据分析面试题:无效搜索问题 | 百度面试题-CSDN博客

 

 6.4 区间分布问题

数据分析面试题:如何分析区间上用户分布情况 | 基于快递单量区间划分的用户分布情况 | 基于TOPN商品区间划分用户浏览情况分析-CSDN博客

6.5 用户购买行为分析

数据分析面试题:用户购买行为及订单统计分析【巴别时代】-CSDN博客

 

 6.6 滴滴呼叫订单问题

数据分析面试题:滴滴-订单呼叫完答率分析_滴滴应答率怎么解决数据分析-CSDN博客

 

 6.7 蚂蚁森林低碳生活数据分析

数据分析面试题:蚂蚁森林低碳生活数据分析_关于低碳生活 数据分析表-CSDN博客 

 

 6.8 快手直播间人员在线分析

数据分析面试题:快手直播间人员在线分析_c# 快手直播间在线人数-CSDN博客

6.9 京东电商购物漏斗分析 

数据分析面试题:京东电商购物漏斗分析-CSDN博客

6.10 Soul 用户活跃、留存和粘性分析

数据分析面试题:Soul 用户活跃、留存和粘性分析_soul留存数据-CSDN博客 

 6.11 微信-情人节红包流向探索分析

数据分析面试题:微信-情人节红包流向探索分析_红包发送方用户的基本信息缺失率有多高?(即有多少红包发送方用户无法在用户基本信-CSDN博客

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!

当然,本文只是展示了数据分析面试题部分内容,其余的内容均在我的数字化建设通关指南专栏里,该专栏不局限于数据分析面试题,也有实战技巧的总结,和数仓建模经验的总结,具体参考如下专栏:

数字化建设通关指南_莫叫石榴姐的博客-CSDN博客

 

 

相关文章:

一份热乎的数据分析(数仓)面试题 | 每天一点点,收获不止一点

目录 1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下: 2. 设计数据仓库的保单表(⾃⾏命名) 3. 根据上述两表,查询2024年8⽉份,每⽇&#xff0c…...

3 html5之css新选择器和属性

要说css的变化那是发展比较快的,新增的选择器也很多,而且还有很多都是比较实用的。这里举出一些案例,看看你平时都是否用过。 1 新增的一些写法: 1.1 导入css 这个是非常好的一个变化。这样可以让我们将css拆分成公共部分或者多…...

【Kubernetes】K8s 的鉴权管理(一):基于角色的访问控制(RBAC 鉴权)

K8s 的鉴权管理(一):基于角色的访问控制(RBAC 鉴权) 1.Kubernetes 的鉴权管理1.1 审查客户端请求的属性1.2 确定请求的操作 2.基于角色的访问控制(RBAC 鉴权)2.1 基于角色的访问控制中的概念2.1…...

保研 比赛 利器: 用AI比赛助手降维打击数学建模

数学建模作为一个热门但又具有挑战性的赛道,在保研、学分加分、简历增色等方面具有独特优势。近年来,随着AI技术的发展,特别是像GPT-4模型的应用,数学建模的比赛变得不再那么“艰深”。通过利用AI比赛助手,不仅可以大大…...

秋招校招,在线性格测评应该如何应对

秋招校招,如果遇到在线测评,如何应对? 这里写个总结稿,希望对大家有些帮助。在线测评是企业深入了解求职人的渠道,如果是性格测试,会要求测试者能够快速答出,以便于反应实际情况(时间…...

chrome 插件开发入门

1. 介绍 Chrome 插件可用于在谷歌浏览器上控制当前页面的一些操作,可自主控制网页,提升效率。 平常我们可在谷歌应用商店中下载谷歌插件来增强浏览器功能,作为开发者,我们也可以自己开发一个浏览器插件来配合我们的日常学习工作…...

揭开面纱--机器学习

一、人工智能三大概念 1.1 AI、ML、DL 1.1.1 什么是人工智能? AI:Artificial Intelligence 人工智能 AI is the field that studies the synthesis and analysis of computational agents that act intelligently AI is to use computers to analog and instead…...

Python中的私有属性与方法:解锁面向对象编程的秘密

在Python的广阔世界里,面向对象编程(OOP)是一种强大而灵活的方法论,它帮助我们更好地组织代码、管理状态,并构建可复用的软件组件。而在这个框架内,私有属性与方法则是实现封装的关键机制之一。它们不仅有助…...

开篇_____何谓安卓机型“工程固件” 与其他固件的区别 作用

此系列博文将分析安卓系列机型与一些车机 wifi板子等工程固件的一些常识。从早期安卓1.0起始到目前的安卓15,一些厂家发布新机型的常规流程都是从工程机到量产的过程。在其中就需要调试各种参数以便后续的量产参数可以固定到最佳,工程固件由此诞生。 后…...

DBeaver 连接 MySQL 报错 Public Key Retrieval is not allowed

DBeaver 连接 MySQL 报错 Public Key Retrieval is not allowed 文章目录 DBeaver 连接 MySQL 报错 Public Key Retrieval is not allowed问题解决办法 问题 使用 DBeaver 连接 MySQL 数据库的时候, 一直报错下面的错误 Public Key Retrieval is not allowed详细…...

三个月涨粉两万,只因为知道了这个AI神器

大家好,我是凡人,最近midjourney的账号到期了,正准备充值时,被一个国内AI图片的生成神器给震惊了,不说废话,先上图看看生成效果。 怎么样还不错吧,是我非常喜欢的国风画,哈哈&#x…...

vulhub GhostScript 沙箱绕过(CVE-2018-16509)

1.搭建环境 2.进入网站 3.下载包含payload的png文件 vulhub/ghostscript/CVE-2018-16509/poc.png at master vulhub/vulhub GitHub 4.上传poc.png图片 5.查看创建的文件...

李宏毅机器学习笔记——反向传播算法

反向传播算法 反向传播(Backpropagation)是一种用于训练人工神经网络的算法,它通过计算损失函数相对于网络中每个参数的梯度来更新这些参数,从而最小化损失函数。反向传播是深度学习中最重要的算法之一,通常与梯度下降…...

内推|京东|后端开发|运维|算法...|北京 更多岗位扫内推码了解,直接投递,跟踪进度

热招岗位 更多岗位欢迎扫描末尾二维码,小程序直接提交简历等面试。实时帮你查询面试进程。 安全运营中心研发工程师 岗位要求 1、本科及以上学历,3年以上的安全相关工作经验; 2、熟悉c/c、go编程语言之一、熟悉linux网络编程和系统编程 3、…...

编写Dockerfile第二版

目标 更快的构建速度 更小的Docker镜像大小 更少的Docker镜像层 充分利用镜像缓存 增加Dockerfile可读性 让Docker容器使用起来更简单 总结 编写.dockerignore文件 容器只运行单个应用 将多个RUN指令合并为一个 基础镜像的标签不要用latest 每个RUN指令后删除多余文…...

校验码:奇偶校验,CRC循环冗余校验,海明校验码

文章目录 奇偶校验码CRC循环冗余校验码海明校验码 奇偶校验码 码距:任何一种编码都由许多码字构成,任意两个码字之间最少变化的二进制位数就称为数据检验码的码距。 奇偶校验码的编码方法是:由若干位有效信息(如一个字节),再加上…...

增维思考,减维问题,避免焦虑!

什么是嵌入式软件开发的核心技能? 1. 编程语言 熟练掌握C/C:C语言是嵌入式领域最重要也是最主要的编程语言,用于实现系统功能和性能优化。C在需要面向对象编程的场合也是重要的选择。了解汇编语言:在某些需要直接与硬件交互或优…...

自动化抢票 12306

自动化抢票 12306 1. 明确需求 明确采集的网站以及数据内容 网址: https://kyfw.12306.cn/otn/leftTicket/init数据: 车次相关信息 2. 抓包分析 通过浏览器开发者工具分析对应的数据位置 打开开发者工具 F12 或鼠标右键点击检查 刷新网页 点击下一页/下滑网页页面/点击搜…...

海外云服务器安装 MariaDB10.6.X (Ubuntu 18.04 记录篇二)

本文首发于 秋码记录 MariaDB 的由来(历史) 谈起新秀MariaDB,或许很多人都会感到陌生吧,但若聊起享誉开源界、业界知名的关系型数据库——Mysql,想必混迹于互联网的人们(coder)无不知晓。 其…...

Mybatis_基础

文章目录 第一章 Mybatis简介1.1 Mybatis特性1.2 和其它持久化层技术对比 第二章 Mybatis的增删改查第三章 Mybatis的增删改查 第一章 Mybatis简介 1.1 Mybatis特性 MyBatis 是支持定制化 SQL、存储过程以及高级映射的优秀的持久层框架。MyBatis 避免了几乎所有的 JDBC 代码和…...

手游刚开服就被攻击怎么办?如何防御DDoS?

开服初期是手游最脆弱的阶段,极易成为DDoS攻击的目标。一旦遭遇攻击,可能导致服务器瘫痪、玩家流失,甚至造成巨大经济损失。本文为开发者提供一套简洁有效的应急与防御方案,帮助快速应对并构建长期防护体系。 一、遭遇攻击的紧急应…...

Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...

数据链路层的主要功能是什么

数据链路层(OSI模型第2层)的核心功能是在相邻网络节点(如交换机、主机)间提供可靠的数据帧传输服务,主要职责包括: 🔑 核心功能详解: 帧封装与解封装 封装: 将网络层下发…...

如何为服务器生成TLS证书

TLS(Transport Layer Security)证书是确保网络通信安全的重要手段,它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书,可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...

【Web 进阶篇】优雅的接口设计:统一响应、全局异常处理与参数校验

系列回顾: 在上一篇中,我们成功地为应用集成了数据库,并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了!但是,如果你仔细审视那些 API,会发现它们还很“粗糙”:有…...

Springboot社区养老保险系统小程序

一、前言 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,社区养老保险系统小程序被用户普遍使用,为方…...

Spring是如何解决Bean的循环依赖:三级缓存机制

1、什么是 Bean 的循环依赖 在 Spring框架中,Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌,形成闭环依赖关系的现象。 多个 Bean 的依赖关系构成环形链路,例如: 双向依赖:Bean A 依赖 Bean B,同时 Bean B 也依赖 Bean A(A↔B)。链条循环: Bean A → Bean…...

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA

浪潮交换机track配置 项目背景高速网络拓扑网络情况分析通信线路收费网络路由 收费汇聚交换机相应配置收费汇聚track配置 项目背景 在实施省内一条高速公路时遇到的需求,本次涉及的主要是收费汇聚交换机的配置,浪潮网络设备在高速项目很少,通…...

iview框架主题色的应用

1.下载 less要使用3.0.0以下的版本 npm install less2.7.3 npm install less-loader4.0.52./src/config/theme.js文件 module.exports {yellow: {theme-color: #FDCE04},blue: {theme-color: #547CE7} }在sass中使用theme配置的颜色主题,无需引入,直接可…...

C++中vector类型的介绍和使用

文章目录 一、vector 类型的简介1.1 基本介绍1.2 常见用法示例1.3 常见成员函数简表 二、vector 数据的插入2.1 push_back() —— 在尾部插入一个元素2.2 emplace_back() —— 在尾部“就地”构造对象2.3 insert() —— 在任意位置插入一个或多个元素2.4 emplace() —— 在任意…...