Hadoop架构、Hive相关知识点及Hive执行流程
Hadoop架构
Hadoop由三大部分组成:HDFS、MapReduce、yarn
HDFS:负责数据的存储
其中包括:
namenode:主节点,用来分配任务给从节点
secondarynamenode:副节点,辅助主节点
datanode:从节点,负责实际的存储
MapReduce:负责计算
其中Map负责分解,reduce负责合并
yarn:负责资源调度
其中包括:
resourcemanager:负责接收用户的请求,并负责集群的管理和资源调度
nodemanager:负责执行resourcemanager分配的任务
Hive相关知识点
元数据:用来描述数据的数据。
元数据包含:用Hive创建的database、table、表的字段等元信息。
元数据存储:存在关系型数据库中,如:hive内置的Derby数据库或者第三方MySQL数据库等,一般使用Mysql数据库。
Metastore:即元数据存储服务
作用是: 客户端连接metastore服务,metastore再去连接MySQL等数据库来存取元数据。
特点: 有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL等数据库的用户名和密码,只需要连接metastore 服务即可。
Hive执行流程


1.用户在用户端编写sql语句,通过hive thrift server传到hive
hive中:
2.解析器:解析sql语法
3.编译器:将sql语句编译成MapReduce程序,通过metastore在数据库中获取元数据并映射成一张表
优化器:优化MapReduce程序
4.执行器:将优化后的执MapReduce程序传给Hadoop
Hadoop来执行MapReduce程序,yarn复制资源调度,MapReduce负责计算
5.hive来监督执行情况,Hadoop会将结果存在hdfs中
6.结果返回显示
相关文章:
Hadoop架构、Hive相关知识点及Hive执行流程
Hadoop架构 Hadoop由三大部分组成:HDFS、MapReduce、yarn HDFS:负责数据的存储 其中包括: namenode:主节点,用来分配任务给从节点 secondarynamenode:副节点,辅助主节点 datanode:从节点&#x…...
P1529 [USACO2.4] 回家 Bessie Come Home 题解
文章目录 题目描述输入格式输出格式样例样例输入样例输出 提示完整代码 题目描述 现在是晚餐时间,而母牛们在外面分散的牧场中。 Farmer John 按响了电铃,所以她们开始向谷仓走去。 你的工作是要指出哪只母牛会最先到达谷仓(在给出的测试数…...
Python语法基础(条件语句 循环语句 函数 切片及索引)
目录 条件语句关键字与C对照注意 循环语句while 循环语句while else 循环语句for 循环语句range() 函数 for else 循环语句循环控制语句练习:打印乘法表 函数函数定义及调用函数值传递和引用传递多返回值参数类型位置参数默认参数关键字参数可变数量的参数可变数量的…...
Debian 9 Stretch APT问题
Debian 9 Stretch APT问题 flyfish 操作系统 Debian 9 Stretch 错误提示 使用sudo apt update错误提示 Ign:1 http://mirrors.aliyun.com/debian stretch InRelease Ign:2 http://mirrors.aliyun.com/debian-security stretch/updates InRelease Ign:3 http://mirrors.al…...
遍历List集合和Map进行修改和删除报java.util.ConcurrentModificationException错误详解
一、异常产生 当我们使用foreach迭代一个ArrayList或者HashMap时,如果尝试对集合做一些修改操作(例如删除元素或新增),可能会抛出java.util.ConcurrentModificationException的异常。 javapublic static void main(String[] args)…...
Android从一个APP跳转到另外一个APP
1、从当前APP去全新启动另外一个目标APP(非覆盖同一个进程): 启动另外一个目标APP(非覆盖原来APP的方式) 1、当前APP加入获取权限声明:(不加人权限检查,没法启动目标app࿰…...
我的创作纪念日——创作者2年
机缘 我最初使用CSDN估计是在2014年左右,当时还在读研,除了在当时比较有名的BBS例如小木虫上进行学术交流外,我发现很多问题百度后,都会转到CSDN,而且文章内容颇为专业,很多问题也都有专业的回答ÿ…...
大数据之LibrA数据库系统告警处理(ALM-12032 ommdba用户或密码即将过期)
告警解释 系统每天零点开始,每8小时检测当前系统中ommdba用户和密码是否过期,如果用户或密码即将在15天内过期,则发送告警。 当系统中ommdba用户过期的期限修改或密码重置,告警恢复。 告警属性 告警ID 告警级别 可自动清除 …...
C_3练习题
一、单项选择题(本大题共20小题,每小题2分,共40分。在每小题给出的四个备选项中,选出一个正确的答案,并将所选项前的字母填写在答题纸的相应位置上。) 1.下列叙述中正确的是()。 A.用C程序实现的算法必须要有输入和输出操作 B.用C程序实现的…...
CentOS7 安装Jenkins 2.414.3 详细教程
目录 1、前提条件硬件软件-java11安装 2、安装jenkins3、启动jenkins配置用户和用户组配置JAVA_HOME 4、配置Jenkins一直处于启动状态5、测试Jenkins是否可以访问以及配置6、访问Jenkins系统 1、前提条件 硬件 内存 4G ; 硬盘 20G 软件-java11安装 上传文件jdk-11.0.21_lin…...
chatglm3-6b记录问答对
# 打开文件,第二个参数是打开文件的模式,a代表追加,也就是说,打开这个文件之后直接定位到文件的末尾 file open(chatlog.txt, "a") # 写入数据 file.write(ask:prompt_text\n) file.write(response:response\n) # 关闭文件 fil…...
k8s ingress 代理 mysql 3306端口
helm 安装 ingress-nginx helm upgrade --install ingress-nginx ingress-nginx \--repo https://kubernetes.github.io/ingress-nginx \--namespace ingress-nginx --create-namespace执行命令 kubectl apply -f https://raw.githubusercontent.com/kubernetes/ingress-ngin…...
Informix管理共享内存
1、查看共享内存使用情况 [informixREHL4 ~]$ onstat -g seg IBM Informix Dynamic Server Version 11.50.UC4 -- On-Line -- Up 00:38:21 -- 144144 Kbytes Segment Summary: id key addr size ovhd class blkused blkfree 393226 …...
Webpack 中 Plugin 的作用是什么?常用 plugin 有哪些?
说说webpack中常见的Plugin?解决了什么问题?- 题目详情 - 前端面试题宝典 1、plugin 的作用 Plugin 是一种计算机应用程序,它和主应用程序互相交互,以提供特定的功能。 是一种遵循一定规范的应用程序接口编写出来的程序&#…...
CSRF(跨站请求伪造)攻击演示
目录 CSRF(跨站请求伪造)攻击演示CSRF 是什么CSRF 演示项目代码CSRF 演示过程服务启动演示 CSRF(跨站请求伪造)攻击演示 CSRF 是什么 CSRF(Cross-Site Request Forgery)跨站请求伪造,是一种网络安全攻击,其目标是利用被攻击者在…...
图解三傻排序 选择排序、冒泡排序、插入排序
(1)选择排序 // 交换 void swap(int arr[], int i, int j) {int tmp arr[i];arr[i] arr[j];arr[j] tmp; }// 选择排序 void selectionSort(int arr[],int len) {if (len < 2) return;for (int minIndex, i 0; i < len - 1; i) {minIndex i;f…...
【数据结构】树与二叉树(六):二叉树的链式存储
文章目录 5.1 树的基本概念5.1.1 树的定义5.1.2 森林的定义5.1.3 树的术语5.1.4 树的表示 5.2 二叉树5.2.1 二叉树1. 定义2. 特点3. 性质引理5.1:二叉树中层数为i的结点至多有 2 i 2^i 2i个,其中 i ≥ 0 i \geq 0 i≥0。引理5.2:高度为k的二叉…...
后端Java日常实习生面试(2023年11月10日)
面试岗位为:Java 后端开发实习生 面试时长:30分钟 面试时间:2023年11月10日 首先介绍一下项目吧 这里介绍时有一个失误,没有主动把屏幕共享给打开,因为我在面试之前已经在 processon 上画好了项目的流程图…...
使用iperf3在macOS上进行网络性能测试
iperf3是一个用于测量网络性能的工具,它可以帮助你了解两台服务器之间的带宽和延迟。本博客将指导你在macOS上安装iperf3,并展示如何连接服务器进行网络性能测试。 步骤1:安装Homebrew 如果你尚未安装Homebrew,可以通过以下步骤…...
09-MySQL主从复制
01-主从复制原理 MySQL主从复制是一种用于实现数据备份、读写分离和扩展性的技术。它基于二进制日志(Binary Log)来将主数据库上的更改操作同步到一个或多个从数据库。 MySQL主从复制的基本原理如下: 主服务器(Master࿰…...
告别官方Demo!用ESP32-CAM+Arduino IDE打造稳定人脸识别门禁(含SD卡存储避坑指南)
ESP32-CAM人脸识别门禁实战:从Flash崩溃到SD卡稳定存储的完整方案 当你在深夜调试ESP32-CAM人脸识别项目时,突然发现辛苦录入的20组人脸数据在重启后全部消失——这种崩溃体验我太熟悉了。官方Demo的Flash存储方案就像个定时炸弹,而本文将带你…...
Docker 27调度器源码级解读(commit #a7f2e1d):为什么你的Llama-3-70B容器总被错误kill?
第一章:Docker 27调度器架构演进与Llama-3-70B容器异常终止现象综述Docker 27 引入了重构后的容器调度器(Scheduler v2),其核心从原先基于事件轮询的同步调度模型,转向基于 CRD(Custom Resource Definition…...
告别 CentOS 后,在 Rocky Linux 8 上玩转 Docker:手把手教你数据持久化与镜像管理
Rocky Linux 8 上的 Docker 数据持久化与镜像管理实战指南 当 CentOS 逐渐退出历史舞台,Rocky Linux 8 正成为企业级 Linux 用户的新宠。作为 CentOS 的完美替代品,Rocky Linux 不仅继承了 RHEL 的稳定性,还提供了更灵活的开源生态支持。在这…...
微信支付V3批量转账接口踩坑实录:从签名验签到结果回调的完整避坑指南
微信支付V3批量转账接口深度排雷指南:从签名验签到异步回调的实战全解析 第一次对接微信支付V3批量转账接口时,我盯着控制台里那行FREQUENCY_LIMITED错误码发了半小时呆。这不是简单的频率限制提示,而是新版API给开发者设下的第一道"思…...
5大核心功能深度解析:NVIDIA Profile Inspector显卡驱动配置完全指南
5大核心功能深度解析:NVIDIA Profile Inspector显卡驱动配置完全指南 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector NVIDIA Profile Inspector是一款专业的显卡驱动配置工具,能…...
从零到一:SecureCRT在Windows嵌入式开发中的高效配置与实战应用【SSH/Telnet/Serial】
1. SecureCRT在嵌入式开发中的核心价值 第一次接触嵌入式开发时,我被各种终端工具搞得晕头转向。直到同事推荐了SecureCRT,才发现原来终端连接可以这么高效。作为一款老牌终端仿真软件,SecureCRT在Windows平台下对SSH、Telnet和Serial协议的支…...
Qwen2.5-0.5B支持29种语言?多语种调用代码实例分享
Qwen2.5-0.5B支持29种语言?多语种调用代码实例分享 “5 亿参数,1 GB 显存,能跑 32 k 长文、29 种语言、JSON/代码/数学全包圆。” 看到这句话,你是不是和我当初一样,心里打了个问号?一个只有5亿参数的“小…...
为什么你的QQ空间记忆需要GetQzonehistory来永久保存?
为什么你的QQ空间记忆需要GetQzonehistory来永久保存? 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 在数字时代,我们的记忆正以惊人的速度消失。你是否曾试图找…...
题解:洛谷 P1914 小书童——凯撒密码
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来,并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构,旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。 欢迎大家订阅我的专栏:算法…...
Laratrust项目实战:从零搭建一个完整的权限管理后台
Laratrust项目实战:从零搭建一个完整的权限管理后台 【免费下载链接】laratrust Handle roles and permissions in your Laravel application 项目地址: https://gitcode.com/gh_mirrors/la/laratrust Laratrust是一款专为Laravel应用设计的权限管理工具&…...
