大数据校招学员实习面试分享
本文实习面试总结来自一位非科班(机械专业)出身的在校生。
作为一个大数据领域的校招实习生,我在这里想分享一下我的经验和教训,希望对大家有所帮助。
1 简历投递准备
在准备简历时,首先需要准确地把握自己的技能和优势,突出自己的特点。大数据领域需要的技能很多,除了基本的编程语言(如Java、Python)和数据分析工具(如Hadoop、Spark)外,还需要了解一些数据挖掘、机器学习和深度学习等领域的算法和模型。
在简历中,我详细列出了自己的技能和经历,包括所学课程、参加过的项目和实践经验等。同时,我也注重突出自己的个人特点,如独立思考能力、团队协作能力等。此外,需要准备一份精美的简历模板,以增加自己的竞争力。
在此分享一个免费制作简历模板的网站
https://www.wondercv.com/jianlimoban/ek29D5Q.html
接下来,非常重要的环节就是如何准备个人实习简历?
当然在这里,我既咨询了涤生老师,也在网上查阅了一些资料,总结来说有以下几点:
1.简历格式清晰简洁:这是简历整体的细节部分,字体大小、间隔、错别字等需要格外注意。
2.个人信息:在简历的顶部包括全名、联系方式、电子邮件地址和个人网站(如果有的话)。
3.要让招聘HR明确你的意图,比如在简历开头表明自己正在寻找大数据开发相关的岗位,或者数仓开发(这里切记不要用目标大数据开发的简历投递数仓、ETL工程师等,最好修改一下)
4.学历背景(很重要):列出你的教育背景,包括学校名称、就读时间和学位。如果在学术方面取得了杰出成绩,或者在校做过的项目,都可以在这里提及。最好写明预计毕业时间。
5.技能和工具:在简历中列出掌握的技能和工具,包括编程语言(如Python、Java等)、数据库(如MySQL、MongoDB、Redis等)、大数据技术(如Hadoop、Hive、Spark、Kafka等)以及数据分析工具(如SQL、Tableau等)。
6.竞赛、证书以及奖学金:如果参加过与大数据开发相关的竞赛或获得了相关的证书,可以在简历中提及。这些可以突出专业能力和对大数据开发的研究经历。把自己大学期间获得的一些知名荣誉都写上。
7.实习和项目经历:如果有实习经历就陈列一番,包括实习职位、公司名称、实习时间和主要职责。重点突出与大数据开发相关的经验和技能。如果没有实习,但是在校有一些个人小项目实践的都可以突出下,但切记要自己做的,没有就不写。
8.自我评价:简历最后可以写一段简短的自我评价,强调你的动力、团队合作能力和解决问题的能力。
涤生建议:一份优秀的简历内容都是内容饱满丰富的,但是不要为了凑内容而写一些与岗位不相关的内容,这样反而让招聘者觉得你与这个职位的匹配度非常低,很容易没有反馈。
如果大学期间确实没有参加社团实践、项目经历、竞赛奖状或者奖学金,那就可能要深度挖掘自己的过往经历了,兴趣爱好什么的展开说一说吧,打游戏有时候也不失为一种彰显自身优势的经历,但是要能总结到位哈。

2 面试过程
在面试过程中,最重要的是表现出自己的专业知识和能力。对于大数据领域的面试,一般会涉及到一些基本的算法和数据结构,如哈希表、二叉树等。同时,根据不同的职位和公司,还可能会考察一些具体的工具和技术。因此,需要提前了解和准备相关的知识。
另外,面试过程中还需要注意表达清晰、思路清晰、逻辑严密。面试官通常会关注你的思考过程和解决问题的方法,因此需要注重语言表达和思考能力的训练。以下分享一些我的面试内容:
2.1 自我介绍环节
问题方向大概有计算机项目经历、转计算机方向的原因(转专业)以及对岗位要求的理解等。
2.2 根据项目内容问技术栈的基本知识
1.hadoop包括基本概念,架构组成mapreduce、读写文件流程、容错机制等。
2.hive包括对hive的理解、join方案、数据倾斜优化等。
3.spark包括与mapreduce的区别、spark shuffle、优化等。
2.3 重点(数仓搭建理论及项目细节)
数据仓库分层的优点。
数据搭建的过程。
介绍数仓的每一层。
维度建模的过程,有哪些维度模型。
事实表有哪些类型。
介绍一个业务流程。
缓慢变化维的处理方式。
ADS层能否直接调用ODS层…。
总的来说首先需要熟悉基本的数仓理论知识,其次需要熟悉自己负责的模块数仓搭建流程和对应的业务流程,可以熟悉一些业务流程如何进行数据抽取和处理,包括其中的难点,另外需要注意一些建模的基本规范,像是ADS层不能直接调用ODS层,需要保存为视图进行取用。
2.4 基础计算机知识
1.操作系统的进程线程、进程间通信方式、用户态内核态的切换等。
2.计算机网络TCP/UDP、TCP拥塞控制机制、TCP三次握手四次挥手等。
3.java创建对象过程,垃圾回收机制,类加载机制等等。
2.5 行为性格,做事处理方式
项目中有没有难点,如何解决
与他人合作不同意见怎么处理
自身的一些优势
2.6 手撕算法题与SQL相关题目
#算法题目
美团 三数之和 找零钱
米哈游 最长重复字串#SQL题目
类似以下截图的题目

涤生建议:作为公司的实际面试官来说,对一个完全不认识的人进行筛选,如何沟通可以最高效、最快了解到这个人是否适合这个岗位呢?答案就是从他的自我介绍、简历上面来尽可能的挖掘该候选人的性格、技能掌握以及技能掌握的程度。HR面、一轮面、二轮面、主管面以及总裁面等等,每一轮都有其考察的重点在里面,技术、人品、性格、为人处事以及表达能力,这些都会涉及。
对于平时表达较少或者表述不好的同学,一定要多加练习哈,不然在面试中真会十分吃亏
3 遇到的问题和总结
在投递大数据领域的校招实习时,我遇到了一些问题和困难。首先是竞争激烈,许多大厂和知名公司都有大数据领域的实习岗位,因此需要有足够的竞争力才能脱颖而出。其次是面试难度较大,需要有足够的准备和技巧才能通过面试。
每一次面试的内容都需要总结,从简单的个人介绍、到基本的开发八股文、技术栈架构、原理;场景问题思考、简历项目内容、比赛经历的深挖,都建议有一个简单的回顾和总结。
为什么总结?复习巩固当前掌握不好的八股文、大数据技术栈原理,重新理顺之前或者正在做的项目细节、比赛经历,提升面试过程中的表达能力。
当然,我也拿到了实习Offer,只是因为一些其他原因不能离校实习。作为马上秋招的应届生来说,能实习就去实习吧!!
相关文章:
大数据校招学员实习面试分享
本文实习面试总结来自一位非科班(机械专业)出身的在校生。 作为一个大数据领域的校招实习生,我在这里想分享一下我的经验和教训,希望对大家有所帮助。 1 简历投递准备 在准备简历时,首先需要准确地把握自己的技能和…...
用于弥散加权MRI的关节各向异性维纳滤光片研究(Matlab代码实现)
💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...
谷粒商城第十一天-品牌管理中关联分类
目录 一、总述 二、前端部分 1. 调整查询调用 2. 关联分类 三、后端部分 四、总结 一、总述 之前是在商品的分类管理中直接使用的若依的逆向代码 有下面的几个问题: 1. 表格上面的参数填写之后,都是按照完全匹配进行搜索,没有模糊匹配…...
Selenium自动化测试实战之自动化测试基础
自动化测试概念 是把以人为驱动的测试转化为机器执行的一种过程,它是一种以程序测试程序的过程。 自动化只是测试方式,跟测试阶段无关。 可以把任何测试工作写一个程序自动化实现都可以称为自动化测试。 selenium自动化测试:2023最新的Sele…...
vue3+vite中使用postcss-px-to-viewport适配问题
适配方案postcss-px-to-viewport使用过程中出现以下问题: postcss-px-to-viewport 不适配最新版本的postcss8 ⚠️报错: postcss-px-to-viewport: postcss.plugin was deprecated. Migration guide: https://evilmartians.com/chronicles/postcss-8-plugin-migrati…...
web测试与app测试的区别
web测试与app测试的区别 首先从系统架构来看的话: web项目,一般都是b/s架构,基于浏览器的,而app则是c/s的,必须要有客户端。那么在系统测试测试的时候就会产生区别了。 web测试只要更新了服务器端,客户端…...
深入理解高并发编程 - 分析创建线程池究竟有哪些方式
1、使用Executors工厂方法: 使用Executors工厂方法创建线程池是一种简单快捷的方式,适用于一些常见的线程池需求。以下是几个示例,演示如何使用Executors工厂方法创建不同类型的线程池: 固定大小线程池 (newFixedThreadPool)&am…...
Kafka第一课概述与安装
生产经验 面试重点 Broker面试重点 代码,开发重点 67 章了解 如何记录行为数据 1. Kafka概述 1.产生原因 前端 传到日志 日志传到Flume 传到HADOOP 但是如果数据特比大,HADOOP就承受不住了 2.Kafka解决问题 控流消峰 Flume传给Kafka 存到Kafka Hadoop 从Kafka…...
Linux MQTT智能家居项目(智能家居界面布局)
文章目录 前言一、创建工程项目二、界面布局准备工作三、正式界面布局总结 前言 一、创建工程项目 1.选择工程名称和项目保存路径 2.选择QWidget 3.添加保存图片的资源文件: 在工程目录下添加Icon文件夹保存图片: 将文件放入目录中: …...
【Vue3】Vue3 UI 框架 | Element Plus —— 创建并优化表单
安装 # NPM $ npm install element-plus --save // 或者(下载慢切换国内镜像) $ npm install element-plus -S// 可以选择性安装 less npm install less less-loader -D // 可以选择性配置 自动联想src目录Element Plus 的引入和注入 main.ts import…...
如何基于 ACK Serverless 快速部署 AI 推理服务
作者:元毅 随着 AI 浪潮的到来,各种 AI 应用层出不穷,众所周知 AI 应用对 GPU 资源强烈依赖,但 GPU 很昂贵,如何降低 GPU 资源使用成本成为用户首要问题。而 AI 与 Serverless 技术结合,完全可以达到按需使…...
【奥义】如何用ChatGPT写论文搞模型
目录 你是否曾经在复现科研论文的结果时感到困难重重? 引言 1 打开需要复现的目标文献 2 提取公式定义的语句 3 文章公式、图实现 (1)用python复现目标文献中的公式 (2)用python复现目标文献中的图 4 Copy代码…...
欢迎光临,博客网站
欢迎光临:YUNYE博客~https://yunyeblog.com/更多的文章,供大家参考学习!!!...
通过TightVNC远程访问MacOS
目录 一、下载 TightVNC 下载链接:https://www.tightvnc.com/ 下载后按步骤进行安装,安装完成后安装目录如下: 运行 tvnviewer.exe,输入远程 IP,点击【connect】: 输入密码,点击【OK】后即可远…...
智安网络|网络安全:危机下的创新与合作
随着信息技术的迅猛发展和互联网的普及,我们进入了一个高度网络化的社会。网络在提供便利和连接的同时,也带来了许多安全隐患和挑战。 一、网络安全的危险 **1.数据泄露和隐私侵犯:**网络上的个人和机构数据存在遭受泄露和盗取的风险&#…...
从系统角度,看智能制造|百世慧®
7月31日我们结束了智能制造专题第二期“电池智能制造质量管理应用及案例分享”的线上研讨会,有不少朋友没有来得及参加智能制造专题第一期研讨会,同时又工作繁忙。所以!今天就由我百小能为大家快速讲解第一期研讨会——“电池智能制造应用”的…...
Dubbo 与 gRPC、Spring Cloud、Istio 的关系
很多开发者经常会问到 Apache Dubbo 与 Spring Cloud、gRPC 以及一些 Service Mesh 项目如 Istio 的关系,要解释清楚它们的关系并不困难,你只需要跟随这篇文章和 Dubbo 文档做一些更深入的了解,但总的来说,它们之间有些能力是重合…...
【uniapp 中使用uni-popup阻止左滑退出程序】
在uniapp中,可以使用uni-app插件uni-popup提供的阻止左滑退出程序的功能。具体步骤如下: 安装uni-popup插件:在HBuilderX编辑器中,打开manifest.json文件,找到“dependencies”字段,在其后添加:…...
netty学习分享(一)
TCP与UDP TCP 是面向连接的、可靠的流协议,通过三次握手建立连接,通讯完成时要拆除连接。 UDP是面向无连接的通讯协议,UDP通讯时不需要接收方确认,属于不可靠的传输,可能会出现丢包现象 端口号: 端口号用…...
前端跨域问题解决方法
跨域是WEB浏览器专有的同源限制访问策略。(后台接口调用和postman等工具会出现) 跨源资源共享(CORS,或通俗地译为跨域资源共享)是一种基于 HTTP 头的机制,该机制通过允许服务器标示除了它自己以外的其他源(域、协议或端…...
STM32标准库-DMA直接存储器存取
文章目录 一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA(Direct Memory Access)直接存储器存取 DMA可以提供外设…...
Spring是如何解决Bean的循环依赖:三级缓存机制
1、什么是 Bean 的循环依赖 在 Spring框架中,Bean 的循环依赖是指多个 Bean 之间互相持有对方引用,形成闭环依赖关系的现象。 多个 Bean 的依赖关系构成环形链路,例如: 双向依赖:Bean A 依赖 Bean B,同时 Bean B 也依赖 Bean A(A↔B)。链条循环: Bean A → Bean…...
20个超级好用的 CSS 动画库
分享 20 个最佳 CSS 动画库。 它们中的大多数将生成纯 CSS 代码,而不需要任何外部库。 1.Animate.css 一个开箱即用型的跨浏览器动画库,可供你在项目中使用。 2.Magic Animations CSS3 一组简单的动画,可以包含在你的网页或应用项目中。 3.An…...
[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】
大家好,我是java1234_小锋老师,看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】,分享下哈。 项目视频演示 【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...
从 GreenPlum 到镜舟数据库:杭银消费金融湖仓一体转型实践
作者:吴岐诗,杭银消费金融大数据应用开发工程师 本文整理自杭银消费金融大数据应用开发工程师在StarRocks Summit Asia 2024的分享 引言:融合数据湖与数仓的创新之路 在数字金融时代,数据已成为金融机构的核心竞争力。杭银消费金…...
MinIO Docker 部署:仅开放一个端口
MinIO Docker 部署:仅开放一个端口 在实际的服务器部署中,出于安全和管理的考虑,我们可能只能开放一个端口。MinIO 是一个高性能的对象存储服务,支持 Docker 部署,但默认情况下它需要两个端口:一个是 API 端口(用于存储和访问数据),另一个是控制台端口(用于管理界面…...
LangFlow技术架构分析
🔧 LangFlow 的可视化技术栈 前端节点编辑器 底层框架:基于 (一个现代化的 React 节点绘图库) 功能: 拖拽式构建 LangGraph 状态机 实时连线定义节点依赖关系 可视化调试循环和分支逻辑 与 LangGraph 的深…...
从物理机到云原生:全面解析计算虚拟化技术的演进与应用
前言:我的虚拟化技术探索之旅 我最早接触"虚拟机"的概念是从Java开始的——JVM(Java Virtual Machine)让"一次编写,到处运行"成为可能。这个软件层面的虚拟化让我着迷,但直到后来接触VMware和Doc…...
Axure 下拉框联动
实现选省、选完省之后选对应省份下的市区...
JDK 17 序列化是怎么回事
如何序列化?其实很简单,就是根据每个类型,用工厂类调用。逐个完成。 没什么漂亮的代码,只有有效、稳定的代码。 代码中调用toJson toJson 代码 mapper.writeValueAsString ObjectMapper DefaultSerializerProvider 一堆实…...
