MPP架构和Hadoop架构的区别
1. 架构的介绍
mpp架构是将许多数据库通过网络连接起来,相当于将一个个垂直系统横向连接,形成一个统一对外的服务的分布式数据库系统。每个节点由一个单机数据库系统独立管理和操作该物理机上的的所有资源(CPU,内存等),节点内系统的各组件间相互调用无需通过主节点。
Hadoop架构是将不同的资源管理与功能进行分层抽象设计,每层形成一类组件,实现一定的解耦,包括存储资源管理等,在每层内进行跨节点的资源统一管理或功能并行执行,层与层之间通过接口调用,相互透明,节点内不同层的组件间的相互调用需要由“控制节点”掌握或通过“控制节点”协调,即控制节点了解每个节点不同层组件间的互动过程。

2 各自的优势
2.1 水平扩展性
Hadoop架构的水平扩展性更高。Hadoop架构能够扩展到10K台机器,Mpp架构最高只能扩展到几百台。
2.2 容错
Hadoop的容错性更高,其存储与计算都是分离开来,同时存在副本。而在MPP架构下,某个节点异常之后,整个计算过程就被阻塞住。
2.3 事务支持
MPP架构对事物支持得更好,MPP架构下各个节点是单机数据库,能够很好的支持事务,只需master节点增加全局事务的逻辑,即可做到很好的事务支持。Hadoop架构下的事务支持能力很弱。
2.4 数据结构
Hadoop架构可适用于非结构化,半结构化,结构化数据(Hbase),MPP架构只适用于结构化数据。
总的来说,Hadoop架构在数据量比较低的情况下,运行速度远不及MPP架构,但数据量一旦超过某个量级,Hadoop架构的在吞吐量方面更有优势。有些大数据数据仓库产品也采用混合的架构,以融合两者的优点。例如Impala,Presto都是基于HDFS的MPP分析引擎,仅利用HDFS实现分区的容错性,放弃MapReduce计算模型,在面向OLAP场景时可实现更好的性能,降低延迟。
相关文章:
MPP架构和Hadoop架构的区别
1. 架构的介绍 mpp架构是将许多数据库通过网络连接起来,相当于将一个个垂直系统横向连接,形成一个统一对外的服务的分布式数据库系统。每个节点由一个单机数据库系统独立管理和操作该物理机上的的所有资源(CPU,内存等)…...
Java02-迭代器,数据结构,List,Set ,Map,Collections工具类
目录 什么是遍历? 一、Collection集合的遍历方式 1.迭代器遍历 方法 流程 案例 2. foreach(增强for循环)遍历 案例 3.Lamdba表达式遍历 案例 二、数据结构 数据结构介绍 常见数据结构 栈(Stack) 队列&a…...
福布斯发布2023云计算100强榜单,全球流程挖掘领导者Celonis排名17
近日,全球流程挖掘领导者Celonis入选福布斯2023 年云计算 100 强榜单,估值130亿美元,排名第17,Celonis已经是连续三年跻身榜单前20名。 本次榜单由福布斯与Bessemer Venture Partners和Salesforce Ventures联合发布,旨…...
计算机网络 MAC地址
...
Jay17 2023.8.10日报
笔记 【python反序列化】 序列化 类对象->字节流(字符串) 反序列化 字节流->对象 python反序列化没PHP这么灵活,没这么多魔术方法。 import pickle import os class ctfshow(): def init(self): self.username0 self.password0 d…...
Winform中DatagridView 表头实现一个加上一个checkBox,实现全选选项功能
实现效果 点击checkBox1或者直接在第一列列表头点击即可实现 代码实现 我的datagridview叫dgv 我在datagridview已经默认添加了一个DataGridViewCheckBoxColumn,勾选时value为1,不勾选时value为0 第一种通过可视化拖动一个checkBox来实现 拖动组…...
rust基础
这是笔者学习rust的学习笔记(如有谬误,请君轻喷) 参考视频: https://www.bilibili.com/video/BV1hp4y1k7SV参考书籍:rust程序设计语言:https://rust.bootcss.com/title-page.htmlmarkdown地址:h…...
剑指offer39.数组中出现次数超过一半的数字
这个题非常简单,解法有很多种,我用的是HashMap记录每个元素出现的次数,只要次数大于数组长度的一半就返回。下面是我的代码: class Solution {public int majorityElement(int[] nums) {int len nums.length/2;HashMap<Integ…...
spring技术栈面试题
1 Spring支持的事务管理类型有哪些?你在项目中使用哪种方式? Spring支持两种类型的事务管理: 编程式事务管理:这意味你通过编程的方式管理事务,给你带来极大的灵活性,但是难维护。声明式事务管理&#x…...
Android Glide MemorySizeCalculator计算值,Kotlin
Android Glide MemorySizeCalculator计算值,Kotlin for (i in 100..1000 step 50) {val calculator MemorySizeCalculator.Builder(this).setMemoryCacheScreens(i.toFloat()).setBitmapPoolScreens(i.toFloat()).setMaxSizeMultiplier(0.8f).setLowMemoryMaxSizeMultiplier(0…...
KEIL自带的Jlink怎么升级更换版本
问题背景 V4.20以上的keil安装包中都自带Jlink驱动包,即当你安装了KEIL后,Debug或Download就是用的安装KEIL时附带安装的Jlink版本。 那如果存在这种情况,你正在开发的芯片比较新,只有比较新的Jlink驱动软件才能支持,…...
图的遍历之 深度优先搜索和广度优先搜索
深度优先搜索的图文介绍 1. 深度优先搜索介绍 图的深度优先搜索(Depth First Search),和树的先序遍历比较类似。 它的思想:假设初始状态是图中所有顶点均未被访问,则从某个顶点v出发,首先访问该顶点,然后依次从它的各…...
Java学习笔记27——file类
File类 概述和构造方法概述构造方法 File的创建功能File类判断和获取功能File的删除功能 概述和构造方法 概述 在java.io下 具体的类 file是文件和目录路径名的抽象表示 文件和目录是可以封装成对象的对于file而言,其封装的并不是真正存在的文件(可以…...
细胞——求细胞数量 C++详解
细胞——求细胞数量 C详解 求细胞数量题目描述输入格式输出格式样例样例输入样例输出 提示数据规模与约定 解法代码 求细胞数量 题目描述 一矩形阵列由数字 0 0 0 到 9 9 9 组成,数字 1 1 1 到 9 9 9 代表细胞,细胞的定义为沿细胞数字上下左右若还…...
【计算机视觉】关于图像处理的一些基本操作
目录 图像平滑滤波处理均值滤波计算过程python实现 高斯滤波计算过程python实现 中值滤波计算过程python实现 图像的边缘检测Robert算子计算过程python实现 图像处理腐蚀算子计算过程python实现 Hog(梯度方向直方图)特征计算流程:Hog的特征维…...
Android Animation Made Easy
原文链接 Android Animation Made Easy 动画在任何一个GUI系统中都是一个非常重要的设计元素,它可以让交互变得优雅,让界面变得炫酷,让操作变得更加的舒畅,让状态过渡变得更加的顺滑,对视觉效果有极大的提升ÿ…...
56从零开始学Java之与字符串相关的正则表达式
作者:孙玉昌,昵称【一一哥】,另外【壹壹哥】也是我哦 千锋教育高级教研员、CSDN博客专家、万粉博主、阿里云专家博主、掘金优质作者 前言 在上一篇文章中,壹哥给大家介绍了String字符串及其各种常用API方法,接下来壹哥…...
STM32 定时器自动重装载寄存器ARR带来的影响,ARPE0和1区别
ARR是啥 自动重载寄存器是预装载的。对自动重载寄存器执行写入或读取操作时会访问预装载寄存器。预装载寄存器的内容既可以直接传送到影子寄存器,也可以在每次发生更新事件 (UEV) 时传送到影子寄存器,这取决于 TIMx_CR1 寄存器中的自动重载预装载使能位 …...
vue 把<style scoped lang=“less“> 单独写成less文件再导入使用
1 npm npm install less-loader --save-dev2 创建一个单独的 Less 文件,例如 app.less <style scoped lang"less"> import url(./app.less); </style>3 在 app.less 文件中,编写 Less 样式代码 .container {width: 500px;margi…...
C++ 字符串
C 字符串 一、字符串两种写法 c语言的写法,可以延用 const char* str1 "huang"; char str2[] "Hello, World!";c写法 std::string str "Hello, World!";二、字符串计算长度 c语言的计算字符串长度,需要导入库 #inc…...
Fluent Meshing实战:从几何到求解就绪网格的自动化之路
1. Fluent Meshing入门:为什么选择自动化网格生成? 第一次接触CFD仿真时,我像大多数工程师一样被网格生成折磨得够呛。记得有个汽车后视镜的案例,光是清理CAD缝隙就花了整整三天,生成的四面体网格质量差到根本没法计算…...
毕业之家20+核心功能盘点:选题、大纲、初稿、降重、查重、排版、答辩全包了
在论文写作过程中,不知如何下笔、结构混乱、查重焦虑、格式繁琐是困扰大多数毕业生的主要问题。毕业之家(biye.com)正是针对这些痛点打造的一站式AI论文写作平台,覆盖从选题到答辩的全流程-6-8。 一、核心定位:专为毕…...
SNN vs CNN vs SVM vs 随机森林:在MNIST数据集上,除了准确率我们还应该比什么?
SNN vs CNN vs SVM vs 随机森林:超越准确率的模型评估维度 当我们在MNIST数据集上对比不同机器学习模型时,准确率往往成为最显眼的指标。但作为一名在工业界摸爬滚打多年的算法工程师,我发现真实世界的模型选择远比比较测试集上的几个百分点复…...
3分钟开启AI绘画之旅:Docker化Stable Diffusion一键部署指南
3分钟开启AI绘画之旅:Docker化Stable Diffusion一键部署指南 【免费下载链接】stable-diffusion-webui-docker Easy Docker setup for Stable Diffusion with user-friendly UI 项目地址: https://gitcode.com/gh_mirrors/st/stable-diffusion-webui-docker …...
GCC源码深度分析:从设计哲学到工程实践
一、设计原理与哲学1.1 三段式架构的哲学基础GCC(GNU Compiler Collection)的设计核心是三段式架构,这一设计哲学源于编译器理论中的经典分离原则。GCC将编译过程清晰地划分为前端、中端和后端三个逻辑部分,每个部分专注于特定的任…...
2026年本地建材吨包袋批发厂家有何独特优势?快来一探究竟!
在建材行业蓬勃发展的2026年,吨包袋作为建材运输与存储的关键包装材料,其质量和供应稳定性至关重要。本地建材吨包袋批发厂家凭借多项独特优势,在市场中占据重要地位。以临沂领杰包装有限公司为例,让我们一同深入了解本地建材吨包…...
LangChain 源码剖析-消息类详解(Messages)
LangChain 源码剖析-消息类详解(Messages) 消息是包含以下内容的对象: 角色(Role)-标识消息类型(例如系统、用户) 内容(Content)-表示消息的实际内容(如文本、图像、音频、文档等) 元数据(Metadata)-可选字段,如响应信息、消息ID和令牌使用情况 LangChain提供了一种标…...
8、如何提高webpack的构建速度?
目录 一、先说本质:Webpack 为什么会慢? 二、面试开场高分回答 三、常见优化手段 1. 缩小 Loader 的作用范围 做法 为什么有效 面试亮点说法 2. 使用缓存 方案一:Webpack 5 持久化缓存 为什么有效 面试亮点 方案二:Ba…...
避坑指南:Windows/Linux下Java串口通信库RXTX与jSerialComm选型及配置详解
Java串口通信库选型实战:RXTX与jSerialComm的工业级应用对比 工业自动化领域对串口通信的需求从未减弱,尤其在RS485设备控制、传感器数据采集等场景中。作为Java开发者,面对RXTX和jSerialComm这两个主流选择时,如何根据项目特点做…...
GTE-Pro在教育领域的应用:智能题库与知识点关联
GTE-Pro在教育领域的应用:智能题库与知识点关联 1. 教育行业的痛点与机遇 你有没有遇到过这样的情况?作为一名老师,想要给学生出一套练习题,却要花好几个小时在题库里翻找合适的题目。或者作为学生,做完一套题后&…...
