Hadoop安装与配置
一、Hadoop安装与配置
1、解压Hadoop安装包
找到hadoop-2.6.0.tar.gz,将其复到master0节点的”/home/csu”目录内,解压hadoop
[csu@master0 ~]$ tar -zxvf ~/hadoop-2.6.0.tar.gz
解压成成功后自动在csu目录下创建hadoop-2.6.0子目录,可以用cd hadoop-2.6.0命令进入这个目录,并用ls -l 命令查看里面的文件。

2、配置hadoop环境变量
如果通过代码无法打开文件,就点击HOME目录,找到computer目录然后按照这个路径去找到各个文件夹“/home/csu/hadoop-2.6.0/etc/hadoop/hadoop-env.sh”
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/hadoop-env.sh
在文件的前面找到“export JAVA_HOME={JAVA_HOME}”将其修改为实际的JDK安装路径,即输入”export JAVA_HOME=/usr/java/jdk1.7.0_71/” 编辑完毕保存退出即可
![]()
3、配置Yarn环境变量文件
配置Yarn环境变量文件是yarn-env.sh,也位于“~/hadoop-2.6.0/etc/hadoop”目录下
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/yarn-env.sh
在文件的前面部份找到“# export JAVA_HOME=/home/y/libexec/jdk1.6.0/ ”
将其改为“export JAVA_HOME=/usr/java/jdk1.7.0_71/”编辑完毕保存退出即可
![]()
4、配置核心组件文件
hadoop的核心组件文件是core-site.xml,也位于“~/hadoop-2.6.0/etc/hadoop”目录下
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/core-site.xml
需要将下面的配置代码放在文件的<configuration>和</configuration>之间
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master0:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/csu/hadoopdata</value>
</property>
</configuration>
编辑完毕保存退出即可

(事先要在/home/csu下建一个hadoopdata目录)

5、配置文件系统
Hadoop的文件系统配置文件是hdfs-site.xml,也位于“~/hadoop-2.6.0/etc/hadoop”子目录下。
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/hdfs-site.xml
需要将下面的代码填充到文件的<configuration>和</configuration>之间
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
编辑完毕保存退出即可

dfs.replicationd是HDFS数据块的副本数,<value>1</value>
中的值是1就表示是一个副本,默认值为3.
6、配置yarn-site.xml文件
yarn-site.xml文件也位于“~/hadoop-2.6.0/etc/hadoop”子目录下
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/yarn-site.xml
将下面的代码填充到文件的<configuration>和</configuration>之间
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master0:18040</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master0:18030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master0:18025</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master0:18141</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master0:18088</value>
</property>
编辑完毕保存退出即可

7、配置MapReduce计算框架文件
在~/hadoop-2.6.0/etc/hadoop目录下系统已经有一个mapred-site.xml.template文件,将其复制并改名,位置不变。
[csu@master0 ~]$ cp /home/csu/hadoop-2.6.0/etc/hadoop/mapred-site.xml.template
/home/csu/hadoop-2.6.0/etc/hadoop/mapred-site.xml

![]()
![]()
然后编辑这个文件
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/mapred-site.xml
将下面代码填充到文件的<configuration>和</configuration>之间
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
编辑完毕保存退出即可

8、配置master的slaves文件
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/slaves
根据自己搭建的实际情况进行编辑,现在只安装一个从节点slave0,就在里面输入内容
slave0
编辑完毕保存退出即可

9、复制master上的Hadoop到Slave节点
有几个从节点就要复制几次,现在只有一个slave0从节点,就复制一次
[csu@master0 ~]$ scp -r /home/csu/hadoop-2.6.0 csu@slave0:~/
(由于我们前面已经配置了免密钥登陆,因此这里不会有密码输入认证)
至此,就完成了Hadoop集群的安装与配置.

二、Hadoop的启动
1、配置操作系统环境变量
配置Linux系统的环境变量
[csu@master0 ~]$ gedit ~/.bash_profile
Or
[csu@master0 ~]nano ~/.bash_profile
在这个文件的尾部追加下面的代码:
#HADOOP
export HADOOP_HOME=/home/csu/hadoop-2.6.0
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
保存退出后执行“source ~/.bash_profile”命令,使修改后的配置生效。
(同时也要在其他节点进行上述配置)


2、创建Hadoop数据目录
Mkdir /home/csu/hadoopdata
注意,这里的数据目录名“hadoopdata”与前面核心组件文件core-site.xml的配置
<name>hadoop.tmp.dir</name>
<value>/home/csu/hadoopdata</value>要一致

3、格式化文件系统
[csu@master0 ~]$ hdfs namenode -format(主节点)

- 启动和关闭hadoop
[csu@master0 ~]$ cd ~/hadoop-2.6.0
[csu@master0 hadoop-2.6.0]$ sbin/start-all.sh (启动)

[csu@master0 hadoop-2.6.0]$ sbin/stop-all.sh (关闭)
5、验证Hadoop是否启动成功
[csu@master0 hadoop-2.6.0]$ jps
执行jps查看进程,如果有四个进程:
SecondaryNameNode、ResourceManager、NameNode和Jps
则表明主节点启动成功

从节点上执行jps,看到有NodeManager、Jps和DataNode
三个进程表示从节点也安装成功
在firefox浏览器中( 在命令状下直接输入firefox就可以启动firefox浏览器):

在地址栏输入http://master0:50070/可以查看Hadoop运行状态

在地址栏输入http://master0:18088/可以查看Yarn运行状态

————学习笔记
相关文章:
Hadoop安装与配置
一、Hadoop安装与配置 1、解压Hadoop安装包 找到hadoop-2.6.0.tar.gz,将其复到master0节点的”/home/csu”目录内,解压hadoop [csumaster0 ~]$ tar -zxvf ~/hadoop-2.6.0.tar.gz 解压成成功后自动在csu目录下创建hadoop-2.6.0子目录,可以用cd hadoo…...
一个自制的比较low的刷题软件
一个自制的比较low的刷题软件 一、背景 工作中往往涉及一些考试,比如阿里云ACP认证,华为GAUSS认证、软考等,应对这些考试的时候,我们往往是先看书后刷题(当然也有直接刷题的大神,毕竟考试,懂的…...
【Java 集合】List接口 —— ArrayList 与 LinkedList 详解
List接口继承自Collection接口,是单列集合的一个重要分支。 在List集合中允许出现重复的元素,所有的元素是以一种线性方式进行存储的,在程序中可以通过索引(类似于数组中的元素角标)来访问集合中的指定元素。另外&…...
通信工程学习:什么是PNF物理网络功能
PNF:物理网络功能 PNF(Physical Network Function)即物理网络功能,是指支持网络功能的物理设备。以下是关于PNF的详细解释: 一、定义与特点 定义: PNF是网络设备厂商(如Cisco、华为、H3C等)通过专用硬件实体提供软件功能的设备。这些设备直接在物理服务器上运…...
Unity的Text组件中实现输入内容的渐变色效果
要在Unity的Text组件中实现输入内容的渐变色效果,默认的Text组件不直接支持渐变色。但是,你可以通过以下几种方式实现: ### 1. **使用Shader**来实现渐变效果 通过自定义Shader为Text组件创建一个渐变效果。这是一个常用的做法࿰…...
network-scripts目录下没有ens33文件的问题
作者:程序那点事儿 日期:2023/11/09 06:52 systemctl start NetworkManager #开启网络管理器nmcli con show #查看ens33网卡对应的是ifcfg-Wired_connection_3这个文件(网络管理器要开启,不然报错),或者根据…...
OpenHarmony(鸿蒙南向)——平台驱动指南【DAC】
往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 持续更新中…… 概述 功能简介 DAC(Digital to Analog Converter&…...
10.Lab Nine —— file system-下
Symbolic links 添加符号链接 1.添加有关symlink系统调用的定义声明,包括kernel/syscall.h, kernel/syscall.c, user/usys.pl 和 user/user.h. 2.添加新的文件类型T_SYMLINK到kernel/stat.h中,添加新的文件标识位O_NOFOLLOW到kernel/fcntl.h中 3.在ken…...
低代码中实现数据映射的必要性与方案
在数字化转型的浪潮中,低代码平台因其快速开发和灵活性而受到越来越多企业的青睐。然而,随着业务需求的复杂化,单纯依赖低代码工具往往难以满足企业在数据处理和业务逻辑上的要求。数据映射作为连接不同数据源和业务逻辑的桥梁,显…...
SpringBoot集成阿里easyexcel(一)基础导入导出
easyexcel主要用于excel文件的读写,可使用model实体类来定义文件读写的模板,对开发人员来说实现简单Excel文件的读写很便捷。可参考官方文档 https://github.com/alibaba/easyexcel 一、引入依赖 <!-- 阿里开源EXCEL --><dependency><gr…...
四元组问题
目录 问题描述 输入格式 输出格式 样例输入 样例输出 说明 评测数据规模 运行限制 原题链接 代码思路 问题描述 从小学开始,小明就是一个非常喜欢数学的孩子。他喜欢用数学的方式解决各种问题。在他的高中时期,他遇到了一个非常有趣的问题&…...
如何用Prometheus监控禁用了Actuator的SpringBoot?
需求来源 prometheus监控微服务一般都是使用micrometer结合actuator来做: 添加依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId> </dependency> <d…...
使用TensorFlow实现一个简单的神经网络:从入门到精通
使用TensorFlow实现一个简单的神经网络:从入门到精通 在现代数据科学和机器学习领域,神经网络是一个非常重要的工具。TensorFlow 是一个开源的深度学习框架,由 Google 开发和维护,它使得构建和训练神经网络变得更加容易。本文将详细介绍如何使用 TensorFlow 实现一个简单的…...
应用DFX能力介绍
一、HarmonyOS生态DFX能力范围 围绕开发者,构建三方应用和设备从开发到维护全生命周期所必需、有竞争力、有特色的调试调优、定位、维护能力。 二、HarmonyOS DFX能力全集 三、DFX设计主要范围 1、HiLog 日志分类 日志常用命令 日志级别 日志规则 2、HiAppEvent 完…...
第三篇 第20章工程计价数字化与智能化
第三篇 工程计价 第20章 工程计价数字化与智能化 20.1 BIM在工程计价中的应用 20.1.1 BIM概述 1.定义 在建设工程及设施全生命周期内,对其物理特征和功能特征信息进行数字化表达,依次设计、施工、运营的过程和结果的总称。应由核心层、共享层、专业领域层、资源层四个概念层…...
成语700词(46~65组)
目录 46.熟悉、了解、知晓相关(15 个)47.很常见不奇怪(6 个)48.看法一致与否(10 个)49.从细节看全貌(10 个)50.看事情透彻(11 个)51.对事情的态度与评价(7 个)52.数量多与少(11 个)53.建筑相关(6 个)54.相同与不同(17 个)55.技艺精湛(10 个)56.与观看欣赏相…...
linux如何配置静态IP
文章目录 使用ip命令(临时配置)Debian/Ubuntu系统(使用netplan)CentOS/RHEL系统(使用nmcli或nmtui)使用nmcli(命令行界面)使用nmtui(文本用户界面)通过图形界…...
Dependency Check:一款针对应用程序依赖组件的安全检测工具
关于Dependency Check Dependency-Check 是一款软件组合分析 (SCA) 工具,可尝试检测项目依赖项中包含的公开披露的漏洞。它通过确定给定依赖项是否存在通用平台枚举 (CPE) 标识符来实现此目的。如果找到,它…...
Python 从入门到实战28(文件的读操作)
我们的目标是:通过这一套资料学习下来,通过熟练掌握python基础,然后结合经典实例、实践相结合,使我们完全掌握python,并做到独立完成项目开发的能力。 上篇文章我们讨论了文件的打开、创建、关闭的相关知识。今天我们将…...
[leetcode刷题]面试经典150题之7同构字符串(简单)
这个题虽然是简单题,但是看了半天还是没啥好思路,最后看了解题学到了不少知识点 1.index() 函数查找序列中首次出现的元素索引 2.zip函数:用于将可迭代的对象(如列表、元组、字典等)作为参数,将对象中对应…...
开源KMS激活神器:3分钟搞定Windows和Office永久激活难题
开源KMS激活神器:3分钟搞定Windows和Office永久激活难题 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows和Office的激活问题烦恼吗?KMS_VL_ALL_AIO是一款开…...
2025最权威的AI辅助写作助手推荐榜单
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek AI辅助写作工具正深刻改变着学术研究的传统范式,这是随着人工智能技术飞快发展而…...
手把手教你学Simulink——基于 PWM 加相移混合控制的双向 DC-DC 变换器仿真
目录 手把手教你学Simulink——基于 PWM 加相移混合控制的双向 DC-DC 变换器仿真 摘要 Abstract 1. 引言 1.1 研究背景 1.2 本文目标 2. 混合控制机理 2.1 拓扑选择:双有源桥(DAB) 2.2 混合控制自由度 3. Simulink 主电路建模 3.1…...
开发者专属提示词库:提升AI协作效率的实战指南
1. 项目概述:一个为开发者量身定制的提示词宝库如果你是一名开发者,无论是前端、后端、运维还是算法工程师,我相信你都或多或少地接触过像 ChatGPT 这类大型语言模型。它们能写代码、解 Bug、解释概念,甚至帮你设计架构。但很多时…...
从PUMA560到你的项目:手把手教你将经典DH建模流程迁移到自定义机械臂
从PUMA560到自定义机械臂:DH建模实战迁移指南 当机械臂从教科书案例走向真实项目时,最令人头疼的莫过于面对一个全新构型却不知如何下手。本文将以工业界经典的PUMA560为跳板,拆解一套可迁移的DH建模方法论,带您跨越从理论到实践的…...
5大优势解析:如何高效使用免费离线OCR工具
5大优势解析:如何高效使用免费离线OCR工具 【免费下载链接】Umi-OCR OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。 项目…...
手把手教你用三菱FX3U PLC的RS指令和RS2指令与电脑串口调试助手‘对话’
三菱FX3U PLC串口通信实战:从零搭建RS485数据收发系统 第一次接触工业控制系统的串口通信时,我被那些密密麻麻的接线和晦涩的协议参数弄得晕头转向。直到在自动化生产线上亲眼看到PLC通过两根电线与十几台设备稳定通信,才意识到串口技术的精妙…...
如何快速免费管理游戏DLSS版本?DLSS Swapper终极指南
如何快速免费管理游戏DLSS版本?DLSS Swapper终极指南 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper DLSS Swapper是一款革命性的开源工具,专为PC游戏玩家设计,能够智能管理、下载和…...
OpenSpire:开源贡献者协作平台的设计理念与实战指南
1. 项目概述:一个面向开源贡献者的协作平台最近在和一些刚接触开源的朋友交流时,发现一个挺普遍的现象:很多人对参与开源项目充满热情,但第一步“如何找到合适的项目并上手”就卡住了。GitHub上项目浩如烟海,一个新手面…...
MySQL-MVCC核心原理-版本链ReadView与可见性判断
MVCC 全称是 Multi-Version Concurrency Control,也就是多版本并发控制。它的核心思想是:为同一行数据维护多个版本,让读写在很多情况下不用互相阻塞。 没有 MVCC 时,读写冲突通常要大量依赖锁。MVCC 让普通 select 可以读一个可见…...
