大数据集群管理软件 CDH、Ambari、DataSophon 对比
文章目录
- 引言
- 工具介绍
- CDH
- Ambari
- DataSophon
- 对比分析
引言
大数据集群管理方式分为手工方式和工具方式,手工方式一般指的是手动维护平台各个组件,工具方式是靠大数据集群管理软件对集群进行管理维护。本文针对于常见的方法和工具进行比较,帮助找到合适的工具,提升效率。
工具介绍
CDH
CDH 是 Cloudera 公司提供的一种大数据平台解决方案。 CDH 的全称是 Cloudera’s Distribution including Apache Hadoop,它是一个开放源代码的大数据平台,基于 Apache Hadoop 和其他相关的开源技术构建,包括 HDFS、MapReduce、HBase、ZooKeeper、Hue、Oozie、Flume、Sqoop 等等。
CDH 提供了一个完整的大数据解决方案,包括数据管理、数据处理、数据分析和数据可视化等方面,可以帮助用户快速搭建和部署大数据平台,支持多种数据源的处理和集成,同时提供了强大的安全性和可扩展性。值得一提的是 CDH 从6.3版本之后开始收费 。
官网地址:https://www.cloudera.com/
Ambari
Apache Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目。目前最新的发布版本是 2.7.8。就 Ambari 的作用来说,就是创建、管理、监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。用一句话来说,Ambari 就是为了让 Hadoop 以及相关的大数据软件更容易使用的一个工具。Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop 和 Hcatalog 等,并且是完全开源的平台。
官网地址:https://ambari.apache.org/
DataSophon
DataSophon 是致力于自动化监控、运维、管理大数据基础组件和节点的,帮助您快速构建起稳定,高效的大数据集群服务,国产开源平台,支持完全离线部署,能支撑
官网地址:https://datasophon.github.io/datasophon-website/docs/current/%E6%A6%82%E8%A7%88

还支持 Kyuubi(统一多租户JDBC网关)、Iceberg(适用于庞大数据集分析的开放式数据表格式)、Kerberos(计算机网络认证协议)
对比分析
试想下面几个问题:
- 如果有100台服务器的集群,至少要花费多长时间搭建好 Hadoop集群?包括 Hive、Hbase、Spark、Zookeeper、Kafka、Flink 等?
- 对于以上集群进行 Hadoop 版本升级,怎么选择升级方案?至少要花费多长时间?
- 新版本的 Hadoop 与 Hvie、Hbase、Kafka、Flink 等是否兼容?
- 如何对上述集群中已经运行中的主机和组件健康状态进行监控?
手工部署:需配置太多参数,但是,好理解其原理,建议初学这样做,能学到很多。该方式啊,均得由用户执行,细节太多,切当设计多个组件时,用户须自己解决组件间版本兼容问题。
工具部署:使用工具可以说是一键操作,难点都在工具本身的部署上,但是工具也存在升级组件不受自己控制的弊端。
| 比较项 | 手工方式 | 工具方式 |
|---|---|---|
| 难易度 | 难,几乎不可能成功 | 简单,易行 |
| 兼容性 | 自己解决组件兼容性问题 | 自动安装兼容组件 |
| 组件支持数 | 支持全部组件 | 支持常用组件 |
| 监控运维 | 无,需要自建 | 支持常见组件的监控 |
| 优点 | 对组件和集群管理深刻 | 简单、容易、可行 |
| 缺点 | 太复杂,几乎不可能成功 | 屏蔽太多细节,妨碍对组件理解 |
组件之间对比:
| 工具项 | 所属机构 | 开源性 | 社区支持性 | 易用性 | 监控指标 | 可扩展性 | 原生支持组件 | 服务版本 |
|---|---|---|---|---|---|---|---|---|
| CDH | Cloudera | 商用 | 不支持 | 易 | 多 | 无 | 中 | 较老 |
| Ambari | Apache | 开源 | 支持 | 较易 | 较多 | 较强 | 较少 | 较新 |
| DataSophon | 国产 | 开源 | 支持 | 易 | 多 | 强 | 多 | 非常新 |
相关文章:
大数据集群管理软件 CDH、Ambari、DataSophon 对比
文章目录 引言工具介绍CDHAmbariDataSophon 对比分析 引言 大数据集群管理方式分为手工方式和工具方式,手工方式一般指的是手动维护平台各个组件,工具方式是靠大数据集群管理软件对集群进行管理维护。本文针对于常见的方法和工具进行比较,帮助…...
插值、逼近、拟合、光顺
插值 插值(Interpolation)是数学和计算科学中的一个重要概念,它指的是通过已知的一系列数据点,构造一个函数或曲线,并据此估计未知数据点的值。这个过程通常发生在已知数据点之间,用于预测或估算在这些已知…...
Java单元测试 - mock静态方法
文章目录 1. mock 静态方法2. 升级 maven 依赖3. 示例 1. mock 静态方法 mockito 在 3.4.0 版本之后,开始支持 mock static method。 2. 升级 maven 依赖 <dependency><groupId>org.mockito</groupId><artifactId>mockito-core</artif…...
Unity使用PlayableAPI 动态播放动画
1.初始化animator,创建Playable图,创建动画Playable private void InitAnimator(GameObject headGo) {if (headGo){_headAnimator headGo.GetComponent<Animator>();if (_headAnimator){_headAnimator.cullingMode AnimatorCullingMode.AlwaysA…...
unity使用Registry类将指定内容写入注册表
遇到一个新需求,在exe执行初期把指定内容写入注册表,Playerprefs固然可以写入,但是小白不知道怎么利用Playerprefs写入DWORD类型的数据,因此使用了Registry类 一. 对注册表中键的访问 注册表中共可分为五类 一般在操作时&#…...
Python进阶学习:Pandas--将一种的数据类型转换为另一种类型(astype())
Python进阶学习:Pandas–将一种的数据类型转换为另一种类型(astype()) 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&…...
OpenCV开发笔记(七十五):相机标定矫正中使用remap重映射进行畸变矫正
若该文为原创文章,转载请注明原文出处 本文章博客地址:https://blog.csdn.net/qq21497936/article/details/136293833 各位读者,知识无穷而人力有穷,要么改需求,要么找专业人士,要么自己研究 红胖子(红模仿…...
光伏预测 | Matlab基于CNN-SE-Attention-ITCN的多特征变量光伏预测
光伏预测 | Matlab基于CNN-SE-Attention-ITCN的多特征变量光伏预测 目录 光伏预测 | Matlab基于CNN-SE-Attention-ITCN的多特征变量光伏预测预测效果基本描述模型简介程序设计参考资料 预测效果 基本描述 Matlab基于CNN-SE-Attention-ITCN的多特征变量光伏预测 运行环境: Matla…...
k8s学习笔记-基础概念
(作者:陈玓玏) deployment特别的地方在于replica和selector,docker根据镜像起容器,pod控制容器,job、cronjob、deployment控制pod,job做离线任务,pod大多一次性的,cronj…...
C语言 变量
变量其实只不过是程序可操作的存储区的名称。C 中每个变量都有特定的类型,类型决定了变量存储的大小和布局,该范围内的值都可以存储在内存中,运算符可应用于变量上。 变量的名称可以由字母、数字和下划线字符组成。它必须以字母或下划线开头…...
2024年2月16日优雅草蜻蜓API大数据服务中心v1.1.1大更新-UI全新大改版采用最新设计ui·增加心率计算器·退休储蓄计算·贷款还款计算器等数接口
2024年2月16日优雅草蜻蜓API大数据服务中心v1.1.1大更新-UI全新大改版采用最新设计ui增加心率计算器退休储蓄计算贷款还款计算器等数接口 更新日志 前言:本次更新中途跨越了很多个版本,其次本次ui大改版-同步实时发布教程《带9.7k预算的实战项目layuiph…...
WEB漏洞 逻辑越权之支付数据篡改安全
水平越权 概述:攻击者尝试访问与他拥有相同权限的用户的资源 测试方法:能否通过A用户操作影响到B用户 案例:pikachu-本地水平垂直越权演示-漏洞成因 1)可以看到kobe很多的敏感信息 2)burp抓包,更改user…...
45、WEB攻防——通用漏洞PHP反序列化POP链构造魔术方法原生类
文章目录 序列化:将java、php等代码中的对象转化为数组或字符串等格式。代表函数serialize(),将一个对象转换成一个字符;反序列化:将数组或字符串等格式还成对象。代表函数unserialize(),将字符串还原成一个对象。 P…...
雾锁王国服务器怎么建?雾锁王国服务器搭建方法
雾锁王国Enshrouded服务器搭建怎么搭建?非常简单,阿里云计算巢雾锁王国程序,可以一键搭建雾锁王国多人联机服务器,腾讯云是基于雾锁王国镜像系统,阿里云服务网aliyunfuwuqi.com汇总雾锁王国服务器搭建,超简…...
设计模式篇---观察者模式
文章目录 概念结构实例总结 概念 观察者模式:定义对象之间的一种一对多的依赖关系,使得每当一个对象状态发生改变时,其他相关依赖对象都得到通知并被自动更新。 观察者模式是使用频率较高的一个模式,它建立了对象与对象之间的依赖…...
Docker常用命令Top20
Docker常用命令Top20 Docker是一种容器化平台,通过使用Docker,开发人员可以轻松地打包、交付和运行应用程序。以下是Docker中最常用的20个命令: docker run: 运行一个容器。 docker run <image_name>docker ps:…...
Redis的发布订阅机制及其使用场景
Redis的发布订阅(Pub/Sub)机制是一种消息通信模式,其中发送者(发布者)将消息发送到特定的频道,而订阅者则订阅其中一个或多个频道,以接收感兴趣的消息。这种模式可以用于构建实时通信系统、消息…...
计算机网络的基础知识
网络的性能指标:网络速率,bpsbit/s; 时延包括四个组成部分:发送时延、传播时延、排队时延、处理时延; 网络各个层次结构设计的基本三原则:各个层次之间是相互独立的,每一个层之间有足够的灵活…...
QT-Http post 同步请求
在 Qt 中,你可以使用 QNetworkAccessManager 对象的 sendCustomRequest 方法来发送同步的 HTTP 请求。以下是一个演示如何使用该方法发送同步 HTTP POST 请求的示例代码: #include <QCoreApplication> #include <QNetworkAccessManager> #i…...
【JVM】StringTable 字符串常量池
参考:javaGuide 字符串常量池 是 JVM 为了提升性能和减少内存消耗针对字符串(String 类)专门开辟的一块区域,主要目的是为了避免字符串的重复创建 String的不可变性 1.通过字面量的方式(区别于new)给一个…...
告别C语言硬编码!用lvglpp在ESP32上快速构建嵌入式GUI(附完整项目配置)
告别C语言硬编码!用lvglpp在ESP32上快速构建嵌入式GUI(附完整项目配置) 在嵌入式开发领域,图形用户界面(GUI)的实现一直是个令人头疼的问题。传统的C语言硬编码方式不仅效率低下,代码维护成本也居高不下。想象一下&…...
从理论到实践:Fluent流体仿真核心技术与高效操作指南
1. Fluent流体仿真基础理论 第一次接触Fluent时,我被各种专业术语搞得晕头转向。后来发现,理解流体仿真就像学做菜一样,得先认识食材和工具。粘度就是流体的"黏稠度",蜂蜜比水粘度大,这个特性直接影响流动行…...
别再只用Z-score了!用Python的statsmodels.robust.mad()做异常值检测,对离群点更鲁棒
别再只用Z-score了!用Python的statsmodels.robust.mad()做异常值检测,对离群点更鲁棒 金融风控系统中,一个微小的异常交易可能隐藏着欺诈风险;工业传感器网络中,一个突变的温度读数可能预示着设备故障。传统Z-score方法…...
Qwen2.5-VL 算法解析
Qwen2.5-VL 本质上是一个 Qwen2.5 LLM 原生动态分辨率 ViT 视觉到语言的 MLP 压缩器 面向图像/视频的时间对齐版 MRoPE 的统一多模态自回归模型。它相对 Qwen2-VL 的核心升级,不是简单“换了个更大的底座”,而是把 视觉编码效率、长视频时间建模、文档…...
从零实现:基于STM32的直流电机双闭环PID调速系统
1. 直流电机双闭环PID控制入门指南 第一次接触电机控制时,我被各种专业术语搞得晕头转向。直到亲手用STM32实现了双闭环PID调速系统,才发现原来核心原理可以这么简单理解。想象一下开车时的定速巡航:速度环就像你的右脚控制油门大小…...
别再只盯着开关电源了!聊聊LDO这颗‘定海神针’在便携设备里的那些事儿
别再只盯着开关电源了!聊聊LDO这颗‘定海神针’在便携设备里的那些事儿 当智能手表在凌晨3点精准监测到你的血氧波动,当TWS耳机在通勤地铁上隔绝了90%的环境噪音,这些看似平常的用户体验背后,都藏着一颗被低估的"定海神针&qu…...
高效处理Microsoft Access数据库的终极指南:MDB Tools深度解析
高效处理Microsoft Access数据库的终极指南:MDB Tools深度解析 【免费下载链接】mdbtools MDB Tools - Read Access databases on *nix 项目地址: https://gitcode.com/gh_mirrors/md/mdbtools 在Unix/Linux环境下无缝读取和操作Microsoft Access数据库文件&…...
MySQL 8.0.16 安装卡在最后一步?别慌,这个乱码问题90%的人都会遇到
MySQL 8.0.16安装卡在最后一步?乱码问题的深度解析与完美解决方案 当你在Windows系统上满怀期待地安装MySQL 8.0.16,眼看着进度条即将走到终点,却突然遭遇"Database initialization failed"的红色警告,那种挫败感我深有…...
别再只用微信授权了!手把手教你用小程序云开发实现账号密码登录注册(附完整源码)
突破微信授权限制:小程序云开发构建完整账号体系实战指南 每次看到小程序弹出"微信授权登录"的界面时,你有没有想过——如果用户拒绝授权,你的应用就彻底失去了这个用户?去年我们团队就遇到过这样的尴尬:一个…...
深度学习之图像分类(二十七)-- Patch Embedding:从ViT到ConvMixer的视觉表示演进
1. Patch Embedding的前世今生 第一次看到ViT论文时,最让我困惑的就是这个Patch Embedding操作。传统的CNN都是让卷积核在图像上滑动提取特征,而ViT却粗暴地把图像切成16x16的小方块。这就像把一幅油画撕成碎片再重新拼贴,当时我就纳闷&#…...
