大数据面试核心101问【大厂超级喜欢这些题】
之前出过《史上最全的大数据开发八股文》这篇文章,同学们都觉得还不错,但是有些同学觉得那个背起来还是有些吃力,于是我再次回顾了自己之前面试所有大厂的一些面试题以及牛客上面的一些面经,然后总结了频率问的最高的101问,包括了大数据、java、计算机网络、操作系统、数据库、HQL、场景题等内容
注意:以下顺序就是按照科目来进行划分的,重要性不分先后
- HDFS的架构 7
- HDFS的读写流程 7
- 小文件过多有什么危害,你知道的解决办法有哪些 8
- join原理 9
- yarn 的任务提交流程是怎样的 10
- 简述什么是CAP理论,zookeeper满足CAP的哪两个 11
- 简述flume基础架构 13
- 请说一下你提到的几种source的不同点 14
- kafka是如何保证数据不丢失和数据不重复 16
- kafka中的数据是有序的吗,如何保证有序的呢 18
- HBase和hive的区别 21
- HBase在写过程中的region的split时机 22
- 说一下HBase 的 rowkey 设计原则 23
- hive的join底层实现 25
- Order By和Sort By的区别 26
- 行转列和列转行函数 26
- Hive优化 29
- 简述hadoop 和 spark 的不同点(为什么spark更快) 31
- 简述spark的shuffle过程 31
- spark的作业运行流程是怎么样的 33
- 你知道Application、Job、Stage、Task他们之间的关系吗 34
- Spark常见的算子介绍一下(10个以上) 34
- 简述groupByKey和reduceByKey的区别 35
- 宽依赖和窄依赖之间的区别 35
- 简单介绍一下Flink 39
- Flink和SparkStreaming区别 39
- 简述Flink运行流程(基于Yarn) 40
- Connect算子和Union算子的区别 40
- Flink的时间语义有哪几种 * 40
- Flink 是如何保证 Exactly-once 语义的 42
- java的深拷贝和浅拷贝的区别 43
- java中==和equals的区别 44
- String和StringBuffer、StringBuilder的区别 44
- 简述面向对象三大特征 45
- java中方法重载和重写的区别 46
- HashMap底层实现 47
- HashMap扩容过程 48
- ConcurrentHashMap原理 48
- java反射机制 49
- 异常体系 49
- JVM垃圾收集器 55
- java实现多线程有几种方式 59
- 线程池相关内容 60
- TCP是如何做到可靠传输的 63
- TCP和UDP的区别 63
- 浏览器输入URL到显示页面的过程 64
- 进程和线程的区别 64
- 简述事务 66
- 数据库事务并发会引发哪些问题 66
- 事务的四个隔离级别有哪些 67
- MVCC讲一下(怎么实现) 67
- 为什么要对数据仓库分层 67
- 维度建模中表的类型 68
- 事实表的设计过程 69
- 留存问题 71
- 数据倾斜 72
相关文章:
大数据面试核心101问【大厂超级喜欢这些题】
之前出过《史上最全的大数据开发八股文》这篇文章,同学们都觉得还不错,但是有些同学觉得那个背起来还是有些吃力,于是我再次回顾了自己之前面试所有大厂的一些面试题以及牛客上面的一些面经,然后总结了频率问的最高的101问&#x…...
代码随想录算法训练营第四十八天 | leetcode 121. 买卖股票的最佳时机,122.买卖股票的最佳时机II
代码随想录算法训练营第四十八天 | leetcode 121. 买卖股票的最佳时机,122.买卖股票的最佳时机II121. 买卖股票的最佳时机122.买卖股票的最佳时机II121. 买卖股票的最佳时机 题目: 给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支…...
RAD 11.3 delphi和C++改进后新增、废弃及优化的功能
RAD 11.3 delphi和C改进后新增和废弃的功能 目录 RAD 11.3 delphi和C改进后新增和废弃的功能 一、版本RAD 11.3 delphi和C改进后新增功能 1、官方视频位置: 2、官方文档的链接位置: 二、版本RAD 11.3 delphi和C改进后废弃的功能 2.1、编译器不再使…...
【C++】引用
🏖️作者:malloc不出对象 ⛺专栏:C的学习之路 👦个人简介:一名双非本科院校大二在读的科班编程菜鸟,努力编程只为赶上各位大佬的步伐🙈🙈 目录前言一、引用1.1 引用概念1.2 引用特性…...
LPNet for Image Derain
Lightweight Pyramid Networks for Image Deraining前置知识高斯-拉普拉斯金字塔图像中的高频信息和低频信息为什么高斯-拉普拉斯金字塔可以实现去雨?可能性分析网络结构整体结构:子网结构:递归块结构:后续补充代码 前置知识 这…...
【NLP相关】基于现有的预训练模型使用领域语料二次预训练
❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…...
使用git进行项目管理--git使用及其常用命令
使用git进行项目管理 文章目录 使用git进行项目管理git使用1.添加用户名字2.添加用户邮箱3.git初始化4.add5.commit6.添加到gitee仓库7.推送到gitee8.切换版本git常用命令git add把指定的文件添加到暂存区中添加所有修改、已删除的文件到暂存区中添加所有修改、已删除、新增的文…...
Mybatis_CRUD使用
目录1 Mybatis简介环境说明:预备知识:1.1 定义1.2 持久化为什么需要持久化服务呢?1.3 持久层1.4 为什么需要Mybatis2 依赖配置3 CRUDnamespaceselect (查询用户数据)※传值方式:于方法中传值使用Map传值insert (插入用…...
JVM的过程内分析和过程间分析有什么区别?
问: 目前所有常见的Java虚拟机对过程间分析的支持都相 当有限,要么借助大规模的方法内联来打通方法间的隔阂,以过程内分析(Intra-Procedural Analysis, 只考虑过程内部语句,不考虑过程调用的分析ÿ…...
LearnDash测验报告如何帮助改进您的课程
某一个场景。Pennywell 大学有一门课程“Introduction to Linear Algebra”。上学期进行了两次测验。20% 的学生在第一次测验中不及格,而 80% 在第二次测验中不及格。在进一步评估中,观察到第一次测验不及格的学生在第二次测验中也不及格。在第二次测验中…...
如何通过Java将Word转换为PDF
Word是我们日常编辑文档内容时十分常用的一种文档格式。但相比之下,PDF文档的格式、布局更为固定,不易被更改。在保存或传输较为重要的文档内容时,PDF文档格式也时很多人的不二选择。很多时候我们都会遇到需要将Word转换为PDF的情况。下面我就…...
DOM型XSS
DOM型XSSDOM是什么DOM型XSSDOM型XSS实操DOM是什么 DOM就是Document。 文档是由节点构成的集合,在DOM里存在许多不同类型的节点,主要有:元素节点、文本节点,属性节点。 元素节点:好比< body >< p >< h …...
04-项目立项:项目方案、可行性分析、产品规划、立项评审
文章目录4.1 项目方案立项阶段4.2 可行性分析4.3 产品规划4.4 立项评审4.4.1 立项说明书的主要内容4.4.2 立项评审流程章节总结4.1 项目方案 学习目标: 能够输出产品项目方案 项目开发设计流程的主要阶段: 立项阶段 → 设计阶段 → 开发阶段 → 测试阶…...
数据分享|NPP VIIRS夜间灯光数据(2012-2020逐月)
2011年10月美国的“索米”国家极轨卫星伙伴卫星(Suomi National Polar-orbiting Partnership or Suomi NPP)发射,它搭载的VIIRS传感器上有一个称为DNB(Day Night Band)的波段能够在500米分辨率(比原来的OLS提高6倍)的尺度上对地表开展每天覆盖全球一次的高灵敏度(比OLS提…...
网络概论笔记
概论 网络研究的是节点和边 移动互联到物联网时代,只有有互联网,网络就不会落伍 协议:对等层面的实体固定的通信规则 协议包括:语法,语义,格式,次序,动作 网络是任意连接的 服务…...
软工2023个人作业二——软件案例分析
项目内容这个作业属于哪个课程2023年北航敏捷软件工程这个作业的要求在哪里个人作业-软件案例分析我在这个课程的目标是学习并掌握现代软件开发和项目管理技术,体验敏捷开发工作流程这个作业在哪个具体方面帮助我实现目标从软件工程角度分析比较我们所熟悉的软件&am…...
python数据分析表格文档Excel数据分析器统计源码
wx供重浩:创享软件 对话框发送:python表格 获取完整源码源文件说明文档可执行文件等 在PyCharm中运行《Excel数据分析师》即可进入如图1所示的系统主界面。在该界面中,通过顶部的工具栏可以选择所要进行的操作。 具体的操作步骤如下ÿ…...
Istio Sidecar启动顺序 - 导致的应用容器网络不通
目录一、问题二、Istio 1.7及其之后版本的解决方案2.1 方式1:安装Istio时全局设置2.2 方式2:在应用Deployment通过annotation设置2.3 holdApplicationUntilProxyStarts启用效果三、Istio 1.7之前的解决方案一、问题 线上应用集成了Spring Cloud K8S Con…...
3696. 构造有向无环图
Powered by:NEFU AB-IN Link 文章目录3696. 构造有向无环图题意思路代码3696. 构造有向无环图 题意 Codeforces Round 656 (Div. 3) E 给定一个由 n个点和 m条边构成的图。 不保证给定的图是连通的。 图中的一部分边的方向已经确定,你不能改变它们的方向。 剩下的边…...
RuoYi-Flowable-Plus(代码生成)
RuoYi-Flowable-Plus搭建 若依所有扩展项目的代码生成功能都是一样的,RuoYi-Flowable-Plus为例来演示。 模块创建 1.创建新模块ruoyi-student2.编辑RuoYi-Flowable-Plus\pom.xml <dependency><groupId>com.ruoyi</groupId><artifactId>ruoy…...
突破硬件壁垒:开源驱动技术如何解锁跨系统硬件潜能
突破硬件壁垒:开源驱动技术如何解锁跨系统硬件潜能 【免费下载链接】DFRDisplayKm Windows infrastructure support for Apple DFR (Touch Bar) 项目地址: https://gitcode.com/gh_mirrors/df/DFRDisplayKm 副标题:从驱动开发到功能实现——让专属…...
小白也能玩转零售AI:Ostrakon-VL-8B快速上手,实测效果超预期
小白也能玩转零售AI:Ostrakon-VL-8B快速上手,实测效果超预期 1. 零售AI新选择:Ostrakon-VL-8B简介 1.1 什么是Ostrakon-VL-8B? Ostrakon-VL-8B是一款专为零售和餐饮行业设计的智能视觉理解系统。简单来说,它就像是一…...
嵌入式系统的组成和模式深入分析
嵌入式系统的组成和模式深入分析 嵌入式系统是一个软硬件紧密结合的专用计算机系统。下面从组成结构和工作模式两个维度进行深入分析。 第一部分:嵌入式系统的组成结构 一、总体架构图 text ┌─────────────────────────────────────…...
GitHub中文界面插件:3步告别英文困扰,让中文开发者效率翻倍
GitHub中文界面插件:3步告别英文困扰,让中文开发者效率翻倍 【免费下载链接】github-chinese GitHub 汉化插件,GitHub 中文化界面。 (GitHub Translation To Chinese) 项目地址: https://gitcode.com/gh_mirrors/gi/github-chinese 你…...
macOS极简部署:OpenClaw与Qwen3-14B镜像云端联调指南
macOS极简部署:OpenClaw与Qwen3-14B镜像云端联调指南 1. 为什么选择云端联调 去年冬天,当我第一次尝试在本地MacBook Pro上部署OpenClaw时,整整两天时间都耗在了环境配置上。从Homebrew版本冲突到Node.js权限问题,再到CUDA驱动不…...
DeepSeek-OCR-2算力优化部署:支持多GPU并行解析提升吞吐量方案
DeepSeek-OCR-2算力优化部署:支持多GPU并行解析提升吞吐量方案 1. 为什么需要多GPU并行解析? 如果你用过单张显卡跑DeepSeek-OCR-2,可能会遇到这样的场景:公司财务部门一次性发来50张发票扫描件,行政部需要处理100页…...
深入解析Xilinx PCIe IP核示例工程的仿真与调试技巧
1. Xilinx PCIe IP核示例工程快速入门 第一次接触Xilinx PCIe IP核时,我完全被复杂的文件结构和专业术语搞懵了。后来发现,只要掌握几个关键点,就能快速上手这个强大的高速串行通信接口。PCIe(Peripheral Component Interconnect …...
Swagger Client 完整教程:从零开始构建强大的 API 集成应用
Swagger Client 完整教程:从零开始构建强大的 API 集成应用 【免费下载链接】swagger-js Javascript library to connect to swagger-enabled APIs via browser or nodejs 项目地址: https://gitcode.com/gh_mirrors/sw/swagger-js Swagger Client 是一款功能…...
搞懂 Python 本地安装:`pip install .` 与 `pip install -e .` 的本质区别
在 Python 项目开发中,当你编写了一个自己的包(包含 setup.py 或 pyproject.toml),并希望将其安装到当前的虚拟环境以便调用时,通常会在项目根目录执行安装命令。 最常见的两个命令是 pip install . 和 pip install -e…...
开源模型性价比之选:Gemma-3-12b-it在OpenClaw中的实战表现
开源模型性价比之选:Gemma-3-12b-it在OpenClaw中的实战表现 1. 为什么选择Gemma-3-12b-it作为OpenClaw的推理引擎 上个月在优化个人自动化工作流时,我面临一个关键决策:该为OpenClaw选择什么样的大模型作为"大脑"?经过…...
