当前位置: 首页 > article >正文

在国产OpenEuler 24.03上,手把手教你搭建Hadoop 3.3.4三节点集群(含一键管理脚本)

在国产OpenEuler 24.03上构建高可用Hadoop 3.3.4集群自动化部署与智能运维实战当企业级大数据平台遇上国产操作系统会碰撞出怎样的火花OpenEuler作为国产Linux发行版的领军者其24.03 LTS版本在稳定性与安全性上的突破使其成为构建自主可控大数据基础设施的理想选择。本文将带您深入探索如何在OpenEuler 24.03上部署生产级Hadoop 3.3.4集群并通过创新的自动化运维方案实现从手工操作到智能管理的质变飞跃。1. 环境规划与系统调优1.1 硬件资源配置策略构建高可用Hadoop集群的首要步骤是科学规划硬件资源。我们建议采用以下配置方案节点类型CPU核心数内存容量磁盘配置网络带宽Master节点8核32GB500GB SSD系统盘10Gbps2TB HDFS数据盘×2Worker节点16核64GB500GB SSD系统盘10Gbps4TB HDFS数据盘×4提示在OpenEuler环境下建议使用XFS文件系统格式化的数据盘其在大文件处理性能上优于ext41.2 OpenEuler系统深度优化OpenEuler 24.03作为专为企业级场景设计的操作系统需要进行针对性调优# 禁用不必要的服务以node1为例 sudo systemctl disable firewalld sudo systemctl stop firewalld sudo systemctl disable NetworkManager-wait-online.service # 优化内核参数 echo vm.swappiness 10 | sudo tee -a /etc/sysctl.conf echo net.ipv6.conf.all.disable_ipv6 1 | sudo tee -a /etc/sysctl.conf echo net.core.somaxconn 32768 | sudo tee -a /etc/sysctl.conf sudo sysctl -p # 调整文件描述符限制 echo hadoop - nofile 65536 | sudo tee -a /etc/security/limits.conf echo hadoop - nproc 32768 | sudo tee -a /etc/security/limits.conf1.3 集群拓扑设计与服务分布我们采用三节点黄金架构实现服务高可用与负载均衡节点规划 - node1 (10.90.100.101): • NameNode • JournalNode • ZKFC • DataNode • NodeManager - node2 (10.90.100.102): • ResourceManager • NameNode (Standby) • JournalNode • ZKFC • DataNode • NodeManager - node3 (10.90.100.103): • JournalNode • DataNode • NodeManager • HistoryServer这种设计确保了关键服务(NameNode, ResourceManager)的HA特性同时通过JournalNode实现元数据同步避免单点故障。2. 基础环境自动化配置2.1 智能主机初始化脚本传统的手工配置方式效率低下且容易出错我们开发了全自动初始化脚本init_env.sh#!/bin/bash # 定义集群节点IP和主机名 declare -A NODES( [node1]10.90.100.101 [node2]10.90.100.102 [node3]10.90.100.103 ) # 基础环境配置函数 function init_node { # 设置主机名 hostnamectl set-hostname $1 echo $2 $1 /etc/hosts # 配置静态IP cat /etc/sysconfig/network-scripts/ifcfg-ens33 EOF TYPEEthernet BOOTPROTOstatic NAMEens33 DEVICEens33 ONBOOTyes IPADDR$2 NETMASK255.255.255.0 GATEWAY10.90.100.1 DNS1114.114.114.114 EOF # 创建Hadoop专用用户 useradd -m -s /bin/bash hadoop echo hadoop ALL(ALL) NOPASSWD:ALL /etc/sudoers # 安装基础工具 dnf install -y rsync net-tools lrzsz telnet vim } # 主执行逻辑 current_node$(hostname -s) init_node $current_node ${NODES[$current_node]} systemctl restart network2.2 免密登录的进阶实现传统的ssh-copy-id方式在集群规模大时效率低下我们采用更高效的密钥分发方案# 在node1上生成密钥对 su - hadoop ssh-keygen -t rsa -P -f ~/.ssh/id_rsa # 编写分布式密钥分发脚本 cat ~/distribute_key.sh EOF #!/bin/bash for node in node1 node2 node3; do ssh $node mkdir -p ~/.ssh chmod 700 ~/.ssh scp ~/.ssh/id_rsa.pub hadoop$node:~/.ssh/authorized_keys ssh $node chmod 600 ~/.ssh/authorized_keys done EOF # 执行分发 chmod x ~/distribute_key.sh ./distribute_key.sh2.3 增强版文件分发系统基于rsync的智能分发脚本xsync增加了断点续传和增量同步功能#!/bin/bash # 参数校验 if [ $# -lt 1 ]; then echo Usage: $0 file_or_dir [nodes] exit 1 fi # 默认集群节点 NODES${2:-node1 node2 node3} # 获取绝对路径 FILE$(readlink -f $1) DIR$(dirname $FILE) BASE$(basename $FILE) # 多节点并行分发 for host in $NODES; do echo Syncing to $host rsync -avz --partial --progress --delete \ -e ssh -o StrictHostKeyCheckingno \ $FILE hadoop$host:$DIR/ done wait echo All files synchronized successfully3. Hadoop集群高级部署3.1 JDK与Hadoop自动化安装我们采用源码编译方式获取针对OpenEuler优化的JDK和Hadoop# JDK11自动安装脚本 JDK_URLhttps://repo.huaweicloud.com/openjdk/11.0.2/openjdk-11.0.2_linux-x64_bin.tar.gz wget -O /tmp/jdk11.tar.gz $JDK_URL tar -xzf /tmp/jdk11.tar.gz -C /opt ln -s /opt/jdk-11.0.2 /opt/jdk # 配置环境变量 cat /etc/profile EOF export JAVA_HOME/opt/jdk export PATH\$JAVA_HOME/bin:\$PATH EOF source /etc/profile # Hadoop编译安装针对OpenEuler优化 HADOOP_SRC_URLhttps://archive.apache.org/dist/hadoop/core/hadoop-3.3.4/hadoop-3.3.4-src.tar.gz wget -O /tmp/hadoop-src.tar.gz $HADOOP_SRC_URL tar -xzf /tmp/hadoop-src.tar.gz -C /opt cd /opt/hadoop-3.3.4-src # 安装编译依赖 dnf install -y gcc-c cmake autoconf automake libtool zlib-devel openssl-devel # 开始编译 mvn package -Pdist,native -DskipTests -Dtar3.2 高可用配置模板Hadoop高可用配置是生产环境的核心我们提供经过验证的配置模板core-site.xml关键配置configuration property namefs.defaultFS/name valuehdfs://mycluster/value /property property nameha.zookeeper.quorum/name valuenode1:2181,node2:2181,node3:2181/value /property property namehadoop.tmp.dir/name value/data/hadoop/tmp/value /property /configurationhdfs-site.xml高可用配置property namedfs.nameservices/name valuemycluster/value /property property namedfs.ha.namenodes.mycluster/name valuenn1,nn2/value /property property namedfs.namenode.rpc-address.mycluster.nn1/name valuenode1:8020/value /property property namedfs.namenode.http-address.mycluster.nn1/name valuenode1:9870/value /property property namedfs.namenode.shared.edits.dir/name valueqjournal://node1:8485;node2:8485;node3:8485/mycluster/value /property3.3 智能资源管理配置YARN资源管理需要根据实际硬件进行精细化调整!-- yarn-site.xml优化配置 -- property nameyarn.nodemanager.resource.memory-mb/name value57344/value !-- 56GB of 64GB -- /property property nameyarn.scheduler.maximum-allocation-mb/name value57344/value /property property nameyarn.nodemanager.resource.cpu-vcores/name value14/value !-- 16 cores - 2 for system -- /property property nameyarn.scheduler.maximum-allocation-vcores/name value14/value /property property nameyarn.nodemanager.vmem-check-enabled/name valuefalse/value /property4. 智能运维与监控体系4.1 全能集群管理脚本我们开发的hdp_manager.sh脚本集成了集群管理、日志收集、性能监控等多项功能#!/bin/bash # 定义颜色代码 RED\033[0;31m GREEN\033[0;32m NC\033[0m # No Color # 集群节点定义 NODES(node1 node2 node3) MASTER_NODEnode1 RESOURCE_NODEnode2 case $1 in start) echo -e ${GREEN}Starting Hadoop Cluster...${NC} # 启动Zookeeper集群 for node in ${NODES[]}; do ssh $node /opt/zookeeper/bin/zkServer.sh start done # 启动JournalNode for node in ${NODES[]}; do ssh $node /opt/hadoop/bin/hdfs --daemon start journalnode done # 格式化ZKFC并启动NameNode ssh $MASTER_NODE /opt/hadoop/bin/hdfs zkfc -formatZK ssh $MASTER_NODE /opt/hadoop/sbin/start-dfs.sh ssh $RESOURCE_NODE /opt/hadoop/sbin/start-yarn.sh ;; stop) echo -e ${RED}Stopping Hadoop Cluster...${NC} ssh $RESOURCE_NODE /opt/hadoop/sbin/stop-yarn.sh ssh $MASTER_NODE /opt/hadoop/sbin/stop-dfs.sh # 停止JournalNode for node in ${NODES[]}; do ssh $node /opt/hadoop/bin/hdfs --daemon stop journalnode done # 停止Zookeeper for node in ${NODES[]}; do ssh $node /opt/zookeeper/bin/zkServer.sh stop done ;; status) echo -e ${GREEN}Cluster Status:${NC} # 检查Zookeeper状态 for node in ${NODES[]}; do echo -n Zookeeper$node: ssh $node /opt/zookeeper/bin/zkServer.sh status | grep Mode done # 检查HDFS服务 echo -e \nHDFS Services: for node in ${NODES[]}; do echo $node: ssh $node jps | grep -E NameNode|DataNode|JournalNode|DFSZKFailoverController done # 检查YARN服务 echo -e \nYARN Services: for node in ${NODES[]}; do echo $node: ssh $node jps | grep -E ResourceManager|NodeManager done ;; *) echo Usage: $0 {start|stop|status} exit 1 ;; esac4.2 实时监控告警系统集成PrometheusGrafana的监控方案配置# 在所有节点安装Node Exporter for node in node1 node2 node3; do ssh $node wget https://github.com/prometheus/node_exporter/releases/download/v1.3.1/node_exporter-1.3.1.linux-amd64.tar.gz ssh $node tar xzf node_exporter-*.tar.gz cd node_exporter-* nohup ./node_exporter done # 配置Prometheus抓取规则 cat prometheus.yml EOF global: scrape_interval: 15s scrape_configs: - job_name: hadoop static_configs: - targets: [node1:9100, node2:9100, node3:9100] - job_name: hdfs static_configs: - targets: [node1:9870, node2:9870] - job_name: yarn static_configs: - targets: [node2:8088] EOF4.3 日志智能分析方案ELK日志收集系统的快速部署# 在日志分析节点(node3)上部署ELK sudo dnf install -y java-11-openjdk wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.0-linux-x86_64.tar.gz tar xzf elasticsearch-*.tar.gz cd elasticsearch-*/bin ./elasticsearch -d # 安装Logstash wget https://artifacts.elastic.co/downloads/logstash/logstash-7.17.0-linux-x86_64.tar.gz tar xzf logstash-*.tar.gz # 配置Hadoop日志收集 cat logstash-hadoop.conf EOF input { file { path /opt/hadoop/logs/*.log start_position beginning } } filter { grok { match { message %{TIMESTAMP_ISO8601:timestamp} %{LOGLEVEL:level} %{DATA:component}: %{GREEDYDATA:message} } } } output { elasticsearch { hosts [localhost:9200] index hadoop-logs-%{YYYY.MM.dd} } } EOF # 启动Logstash nohup ./logstash -f logstash-hadoop.conf

相关文章:

在国产OpenEuler 24.03上,手把手教你搭建Hadoop 3.3.4三节点集群(含一键管理脚本)

在国产OpenEuler 24.03上构建高可用Hadoop 3.3.4集群:自动化部署与智能运维实战 当企业级大数据平台遇上国产操作系统,会碰撞出怎样的火花?OpenEuler作为国产Linux发行版的领军者,其24.03 LTS版本在稳定性与安全性上的突破&#x…...

16QAM星座图映射与MATLAB误码率仿真分析

1. 16QAM调制技术基础 第一次接触16QAM时,我被那些散落在坐标系上的小点深深吸引。这就像夜空中的星座,每个光点都承载着独特的信息。16QAM(16进制正交幅度调制)是现代通信系统中非常实用的一种调制方式,它巧妙地将幅度…...

AgentCPM处理C语言代码注释:自动生成函数模块的技术说明文档

AgentCPM处理C语言代码注释:自动生成函数模块的技术说明文档 最近在整理一个老旧的C语言项目,里面有不少设备驱动的代码,注释要么没有,要么就是十年前写的,和现在的实现完全对不上。手动补注释和文档,想想…...

USB_CAN_Tool实战:如何精准捕获并解析CAN总线心跳报文

1. 为什么需要捕获CAN总线心跳报文 在汽车电子和工业控制领域,CAN总线就像设备的神经系统,而心跳报文就是各个设备发出的"生命信号"。想象一下,当你在医院做体检时,医生通过心电图监测你的心跳来判断健康状况。同样道理…...

Nunchaku FLUX.1-dev在ComfyUI中的使用技巧:如何调整参数让AI画作更符合预期

Nunchaku FLUX.1-dev在ComfyUI中的使用技巧:如何调整参数让AI画作更符合预期 1. 理解Nunchaku FLUX.1-dev的核心能力 Nunchaku FLUX.1-dev是基于FLUX.1-dev模型优化的文生图工具,通过ComfyUI插件形式提供更便捷的使用体验。在开始调整参数前&#xff0…...

Janus-Pro-7B助力学术研究:LaTeX论文写作与公式处理助手

Janus-Pro-7B助力学术研究:LaTeX论文写作与公式处理助手 每次打开LaTeX编辑器,面对那些复杂的语法和令人头疼的公式代码,你是不是也感到一阵头大?从论文初稿的撰写,到公式的精确排版,再到参考文献的规范管…...

STM32是哈佛结构还是冯·诺依曼结构?

1. STM32架构归属问题的技术辨析在嵌入式系统开发实践中,关于STM32微控制器究竟属于哈佛结构还是冯诺依曼结构的讨论长期存在。这一问题看似属于计算机体系结构的理论范畴,实则直接影响开发者对指令预取、缓存行为、内存映射及调试机制的理解。许多工程师…...

Arduino模块化开发框架:设备抽象与控制分离实践

1. 项目概述“TongHopThuVien”(越南语,意为“综合库”)是 Makerlab.vn 团队维护的一套面向 Arduino 生态的嵌入式软件集合。其项目摘要明确指出核心目标:“Makerlab.vn Collection. Make your programs run together.”——即构建…...

避坑指南:SNAP处理Sentinel-2 L2A数据时,重采样与镶嵌的正确打开方式

SNAP处理Sentinel-2 L2A数据:重采样与镶嵌的进阶实践指南 当你在SNAP中尝试将两幅看似相同的Sentinel-2 L2A影像进行镶嵌时,系统却报错拒绝操作,这种挫败感我深有体会。去年在亚马逊雨林监测项目中,我花了整整两天时间才弄明白这个…...

GLM-OCR零基础教程:从安装到使用,完整流程一次讲清楚

GLM-OCR零基础教程:从安装到使用,完整流程一次讲清楚 1. 为什么选择GLM-OCR? 如果你经常需要从图片或扫描文档中提取文字内容,传统OCR工具可能让你又爱又恨——识别率不稳定、格式处理麻烦、专业内容(如公式表格&…...

钉钉通义Fun-ASR常见问题解决:识别慢、准确率低、CUDA错误的处理方法

钉钉通义Fun-ASR常见问题解决:识别慢、准确率低、CUDA错误的处理方法 1. 问题概述与快速诊断 Fun-ASR作为钉钉与通义联合推出的语音识别系统,在实际部署中可能遇到三类典型问题: 识别速度慢:处理音频时间长于预期准确率不理想&…...

揭秘全球九大高含金量项目管理认证,PMP为何独占鳌头?

1. 项目管理认证的江湖地位 在当今竞争激烈的职场环境中,项目管理认证已经成为职业发展的"硬通货"。根据全球人力资源机构的最新调研,拥有专业项目管理认证的从业者,平均薪资比无认证同行高出30%以上。而在众多认证中,…...

Phi-3-vision-128k-instruct 赋能智能运维:日志分析与故障预测

Phi-3-vision-128k-instruct 赋能智能运维:日志分析与故障预测 1. 运维工程师的新助手 深夜两点,运维工程师小王被刺耳的告警铃声惊醒。服务器集群出现异常,他必须立即排查数百条日志记录和监控图表。这种场景对运维团队来说再熟悉不过——…...

OWL ADVENTURE场景应用:将AI视觉能力轻松集成到你的项目中

OWL ADVENTURE场景应用:将AI视觉能力轻松集成到你的项目中 如果你正在开发一个需要“看懂”图片的应用,比如做一个智能相册、一个商品识别工具,或者一个辅助内容审核的系统,你可能会觉得头疼。传统的方案要么需要自己收集海量数据…...

nomic-embed-text-v2-moe实战教程:嵌入服务健康检查与延迟监控指标设计

nomic-embed-text-v2-moe实战教程:嵌入服务健康检查与延迟监控指标设计 1. 环境准备与快速部署 在开始使用nomic-embed-text-v2-moe嵌入模型之前,我们需要先完成环境的搭建和部署。这个模型支持多语言文本嵌入,特别适合需要处理多种语言检索…...

D435i多传感器标定实战:RGB摄像头精准标定全流程解析

1. 为什么需要标定D435i的RGB摄像头? 刚拿到D435i相机的朋友可能会问:出厂时厂家不是已经标定好了吗?为什么还要自己折腾?这个问题我当初也困惑过。实际使用中发现,厂家标定是"平均值",而每个镜头…...

CH582/CH592/CH584硬件SPI驱动OLED屏实战:从引脚配置到显示优化全流程

CH582/CH592/CH584硬件SPI驱动OLED屏全流程实战指南 在嵌入式开发中,SPI接口因其高速、全双工的特性,成为驱动OLED显示屏的首选方案。WCH的CH582、CH592和CH584三款芯片在物联网和嵌入式领域应用广泛,但开发者在使用其SPI接口驱动OLED时&…...

MedGemma 1.5部署教程:Air-gapped离线环境中通过USB载入模型权重与依赖包

MedGemma 1.5部署教程:Air-gapped离线环境中通过USB载入模型权重与依赖包 1. 项目概述 MedGemma 1.5是一款基于Google Gemma架构的本地医疗AI问答系统,专门设计用于医学咨询、病理分析和医学术语解释。这个系统最大的特点是能够在完全离线的环境中运行…...

手把手教你用lora-scripts:无需代码,快速训练Stable Diffusion风格LoRA

手把手教你用lora-scripts:无需代码,快速训练Stable Diffusion风格LoRA 1. 工具介绍与准备工作 1.1 lora-scripts是什么? lora-scripts是一款开箱即用的LoRA训练自动化工具,它封装了从数据预处理到模型训练的全流程。对于想要定…...

数值模拟中的耗散与色散:如何选择算法提升计算精度(附MATLAB/Python代码示例)

数值模拟中的耗散与色散:如何选择算法提升计算精度(附MATLAB/Python代码示例) 在计算流体力学(CFD)和有限元分析(FEA)领域,数值模拟的精度直接影响工程决策的可靠性。当我们用计算机求解Navier-Stokes方程或波动方程时&#xff0c…...

Dlopt XY Plot功能详解:从导入CSV到绘制专业图表,一篇搞定

Dlopt XY Plot功能实战指南:从数据导入到高级分析全流程解析 在科研与工程领域,数据可视化是洞察信息的关键步骤。Dlopt作为一款专业的数据处理工具,其XY Plot模块能够将枯燥的CSV数据转化为直观的图表,帮助用户快速发现数据规律。…...

ESP32驱动MBI5043 LED驱动芯片的高精度时序实现指南

1. MBI5043 ESP32 驱动库技术解析与工程实践指南MBI5043 是聚积科技(Macroblock)推出的高性能恒流LED驱动芯片,广泛应用于高刷新率、高灰度等级的LED显示屏模组中。其核心特性包括16通道恒流输出、内置PWM灰度控制、级联数据传输能力以及支持…...

Cesium项目实战:免Key调用高德地图的三种服务(矢量/影像/注记)完整代码分享

Cesium项目实战:免Key调用高德地图的三种服务(矢量/影像/注记)完整代码分享 在WebGIS开发领域,Cesium作为一款强大的三维地理可视化引擎,常需要与各类地图服务结合使用。高德地图作为国内主流的地图服务提供商&#xf…...

PID调参避坑指南:从LabVIEW温度控制案例看积分饱和的破解之道

PID调参避坑指南:从LabVIEW温度控制案例看积分饱和的破解之道 在工业控制领域,PID算法就像一位经验丰富的"老司机",能够精准地驾驭各种复杂系统。但这位"老司机"也有自己的软肋——积分饱和问题。想象一下,当…...

PaddleOCR 表格识别结果的行对齐优化实践

1. 为什么表格识别需要行对齐优化 第一次用PaddleOCR识别医学检验报告时,我遇到了一个典型问题:明明是人眼一看就懂的整齐表格,OCR输出的结果却像被打乱的拼图。比如"CRP 24 mg/L"这三个关键信息,可能被拆成三个毫不相干…...

VSCode与IntelliJ IDEA快捷键无缝衔接:提升开发效率的终极方案

VSCode与IntelliJ IDEA快捷键无缝衔接:提升开发效率的终极方案 【免费下载链接】vscode-intellij-idea-keybindings Port of IntelliJ IDEA key bindings for VS Code. 项目地址: https://gitcode.com/gh_mirrors/vs/vscode-intellij-idea-keybindings 作为开…...

常用 BLE Profile 汇总

根据蓝牙 SIG 规范整理的常见 BLE Profile 及其用途: Profileuuid名称主要用途适用场景HOGPHID over GATT Profile通过 GATT 传输 HID 设备数据蓝牙键盘、鼠标、游戏控制器HFPHands-Free Profile免提通话控制车载免提、蓝牙耳机A2DPAdvanced Audio Distribution Pr…...

Typora与Markdown:优雅撰写MogFace-large技术文档与实验笔记

Typora与Markdown:优雅撰写MogFace-large技术文档与实验笔记 1. 引言 你有没有遇到过这种情况:花了好几天跑完一个复杂的MogFace-large实验,结果要写报告时,面对一堆杂乱的截图、代码片段和实验数据,完全不知道从哪里开…...

2024版UniApp集成支付宝支付:从密钥配置到回调验证的全链路解析

1. UniApp与支付宝支付集成概述 在移动应用开发中,支付功能是电商类App的核心模块。作为跨平台开发框架,UniApp为开发者提供了统一的支付API - uni.requestPayment,极大简化了客户端支付接入的复杂度。2024年最新版的支付宝支付接口在安全性和…...

YOLOv8多语言文档本地化指南:手把手教你贡献中文文档

YOLOv8多语言文档本地化实战:从翻译到贡献的全流程解析 在开源社区蓬勃发展的今天,国际化协作已成为技术项目成功的关键因素。作为计算机视觉领域的标杆项目,YOLOv8通过完善的文档体系支持着全球开发者,而中文文档的本地化质量直接…...