Hadoop安装与配置
一、Hadoop安装与配置
1、解压Hadoop安装包
找到hadoop-2.6.0.tar.gz,将其复到master0节点的”/home/csu”目录内,解压hadoop
[csu@master0 ~]$ tar -zxvf ~/hadoop-2.6.0.tar.gz
解压成成功后自动在csu目录下创建hadoop-2.6.0子目录,可以用cd hadoop-2.6.0命令进入这个目录,并用ls -l 命令查看里面的文件。
2、配置hadoop环境变量
如果通过代码无法打开文件,就点击HOME目录,找到computer目录然后按照这个路径去找到各个文件夹“/home/csu/hadoop-2.6.0/etc/hadoop/hadoop-env.sh”
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/hadoop-env.sh
在文件的前面找到“export JAVA_HOME={JAVA_HOME}”将其修改为实际的JDK安装路径,即输入”export JAVA_HOME=/usr/java/jdk1.7.0_71/” 编辑完毕保存退出即可
3、配置Yarn环境变量文件
配置Yarn环境变量文件是yarn-env.sh,也位于“~/hadoop-2.6.0/etc/hadoop”目录下
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/yarn-env.sh
在文件的前面部份找到“# export JAVA_HOME=/home/y/libexec/jdk1.6.0/ ”
将其改为“export JAVA_HOME=/usr/java/jdk1.7.0_71/”编辑完毕保存退出即可
4、配置核心组件文件
hadoop的核心组件文件是core-site.xml,也位于“~/hadoop-2.6.0/etc/hadoop”目录下
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/core-site.xml
需要将下面的配置代码放在文件的<configuration>和</configuration>之间
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master0:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/csu/hadoopdata</value>
</property>
</configuration>
编辑完毕保存退出即可
(事先要在/home/csu下建一个hadoopdata目录)
5、配置文件系统
Hadoop的文件系统配置文件是hdfs-site.xml,也位于“~/hadoop-2.6.0/etc/hadoop”子目录下。
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/hdfs-site.xml
需要将下面的代码填充到文件的<configuration>和</configuration>之间
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
编辑完毕保存退出即可
dfs.replicationd是HDFS数据块的副本数,<value>1</value>
中的值是1就表示是一个副本,默认值为3.
6、配置yarn-site.xml文件
yarn-site.xml文件也位于“~/hadoop-2.6.0/etc/hadoop”子目录下
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/yarn-site.xml
将下面的代码填充到文件的<configuration>和</configuration>之间
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master0:18040</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master0:18030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master0:18025</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master0:18141</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master0:18088</value>
</property>
编辑完毕保存退出即可
7、配置MapReduce计算框架文件
在~/hadoop-2.6.0/etc/hadoop目录下系统已经有一个mapred-site.xml.template文件,将其复制并改名,位置不变。
[csu@master0 ~]$ cp /home/csu/hadoop-2.6.0/etc/hadoop/mapred-site.xml.template
/home/csu/hadoop-2.6.0/etc/hadoop/mapred-site.xml
然后编辑这个文件
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/mapred-site.xml
将下面代码填充到文件的<configuration>和</configuration>之间
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
编辑完毕保存退出即可
8、配置master的slaves文件
[csu@master0 ~]$ gedit /home/csu/hadoop-2.6.0/etc/hadoop/slaves
根据自己搭建的实际情况进行编辑,现在只安装一个从节点slave0,就在里面输入内容
slave0
编辑完毕保存退出即可
9、复制master上的Hadoop到Slave节点
有几个从节点就要复制几次,现在只有一个slave0从节点,就复制一次
[csu@master0 ~]$ scp -r /home/csu/hadoop-2.6.0 csu@slave0:~/
(由于我们前面已经配置了免密钥登陆,因此这里不会有密码输入认证)
至此,就完成了Hadoop集群的安装与配置.
二、Hadoop的启动
1、配置操作系统环境变量
配置Linux系统的环境变量
[csu@master0 ~]$ gedit ~/.bash_profile
Or
[csu@master0 ~]nano ~/.bash_profile
在这个文件的尾部追加下面的代码:
#HADOOP
export HADOOP_HOME=/home/csu/hadoop-2.6.0
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
保存退出后执行“source ~/.bash_profile”命令,使修改后的配置生效。
(同时也要在其他节点进行上述配置)
2、创建Hadoop数据目录
Mkdir /home/csu/hadoopdata
注意,这里的数据目录名“hadoopdata”与前面核心组件文件core-site.xml的配置
<name>hadoop.tmp.dir</name>
<value>/home/csu/hadoopdata</value>要一致
3、格式化文件系统
[csu@master0 ~]$ hdfs namenode -format(主节点)
- 启动和关闭hadoop
[csu@master0 ~]$ cd ~/hadoop-2.6.0
[csu@master0 hadoop-2.6.0]$ sbin/start-all.sh (启动)
[csu@master0 hadoop-2.6.0]$ sbin/stop-all.sh (关闭)
5、验证Hadoop是否启动成功
[csu@master0 hadoop-2.6.0]$ jps
执行jps查看进程,如果有四个进程:
SecondaryNameNode、ResourceManager、NameNode和Jps
则表明主节点启动成功
从节点上执行jps,看到有NodeManager、Jps和DataNode
三个进程表示从节点也安装成功
在firefox浏览器中( 在命令状下直接输入firefox就可以启动firefox浏览器):
在地址栏输入http://master0:50070/可以查看Hadoop运行状态
在地址栏输入http://master0:18088/可以查看Yarn运行状态
————学习笔记
相关文章:

Hadoop安装与配置
一、Hadoop安装与配置 1、解压Hadoop安装包 找到hadoop-2.6.0.tar.gz,将其复到master0节点的”/home/csu”目录内,解压hadoop [csumaster0 ~]$ tar -zxvf ~/hadoop-2.6.0.tar.gz 解压成成功后自动在csu目录下创建hadoop-2.6.0子目录,可以用cd hadoo…...

一个自制的比较low的刷题软件
一个自制的比较low的刷题软件 一、背景 工作中往往涉及一些考试,比如阿里云ACP认证,华为GAUSS认证、软考等,应对这些考试的时候,我们往往是先看书后刷题(当然也有直接刷题的大神,毕竟考试,懂的…...

【Java 集合】List接口 —— ArrayList 与 LinkedList 详解
List接口继承自Collection接口,是单列集合的一个重要分支。 在List集合中允许出现重复的元素,所有的元素是以一种线性方式进行存储的,在程序中可以通过索引(类似于数组中的元素角标)来访问集合中的指定元素。另外&…...

通信工程学习:什么是PNF物理网络功能
PNF:物理网络功能 PNF(Physical Network Function)即物理网络功能,是指支持网络功能的物理设备。以下是关于PNF的详细解释: 一、定义与特点 定义: PNF是网络设备厂商(如Cisco、华为、H3C等)通过专用硬件实体提供软件功能的设备。这些设备直接在物理服务器上运…...

Unity的Text组件中实现输入内容的渐变色效果
要在Unity的Text组件中实现输入内容的渐变色效果,默认的Text组件不直接支持渐变色。但是,你可以通过以下几种方式实现: ### 1. **使用Shader**来实现渐变效果 通过自定义Shader为Text组件创建一个渐变效果。这是一个常用的做法࿰…...

network-scripts目录下没有ens33文件的问题
作者:程序那点事儿 日期:2023/11/09 06:52 systemctl start NetworkManager #开启网络管理器nmcli con show #查看ens33网卡对应的是ifcfg-Wired_connection_3这个文件(网络管理器要开启,不然报错),或者根据…...

OpenHarmony(鸿蒙南向)——平台驱动指南【DAC】
往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 持续更新中…… 概述 功能简介 DAC(Digital to Analog Converter&…...

10.Lab Nine —— file system-下
Symbolic links 添加符号链接 1.添加有关symlink系统调用的定义声明,包括kernel/syscall.h, kernel/syscall.c, user/usys.pl 和 user/user.h. 2.添加新的文件类型T_SYMLINK到kernel/stat.h中,添加新的文件标识位O_NOFOLLOW到kernel/fcntl.h中 3.在ken…...

低代码中实现数据映射的必要性与方案
在数字化转型的浪潮中,低代码平台因其快速开发和灵活性而受到越来越多企业的青睐。然而,随着业务需求的复杂化,单纯依赖低代码工具往往难以满足企业在数据处理和业务逻辑上的要求。数据映射作为连接不同数据源和业务逻辑的桥梁,显…...

SpringBoot集成阿里easyexcel(一)基础导入导出
easyexcel主要用于excel文件的读写,可使用model实体类来定义文件读写的模板,对开发人员来说实现简单Excel文件的读写很便捷。可参考官方文档 https://github.com/alibaba/easyexcel 一、引入依赖 <!-- 阿里开源EXCEL --><dependency><gr…...

四元组问题
目录 问题描述 输入格式 输出格式 样例输入 样例输出 说明 评测数据规模 运行限制 原题链接 代码思路 问题描述 从小学开始,小明就是一个非常喜欢数学的孩子。他喜欢用数学的方式解决各种问题。在他的高中时期,他遇到了一个非常有趣的问题&…...

如何用Prometheus监控禁用了Actuator的SpringBoot?
需求来源 prometheus监控微服务一般都是使用micrometer结合actuator来做: 添加依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId> </dependency> <d…...

使用TensorFlow实现一个简单的神经网络:从入门到精通
使用TensorFlow实现一个简单的神经网络:从入门到精通 在现代数据科学和机器学习领域,神经网络是一个非常重要的工具。TensorFlow 是一个开源的深度学习框架,由 Google 开发和维护,它使得构建和训练神经网络变得更加容易。本文将详细介绍如何使用 TensorFlow 实现一个简单的…...

应用DFX能力介绍
一、HarmonyOS生态DFX能力范围 围绕开发者,构建三方应用和设备从开发到维护全生命周期所必需、有竞争力、有特色的调试调优、定位、维护能力。 二、HarmonyOS DFX能力全集 三、DFX设计主要范围 1、HiLog 日志分类 日志常用命令 日志级别 日志规则 2、HiAppEvent 完…...

第三篇 第20章工程计价数字化与智能化
第三篇 工程计价 第20章 工程计价数字化与智能化 20.1 BIM在工程计价中的应用 20.1.1 BIM概述 1.定义 在建设工程及设施全生命周期内,对其物理特征和功能特征信息进行数字化表达,依次设计、施工、运营的过程和结果的总称。应由核心层、共享层、专业领域层、资源层四个概念层…...

成语700词(46~65组)
目录 46.熟悉、了解、知晓相关(15 个)47.很常见不奇怪(6 个)48.看法一致与否(10 个)49.从细节看全貌(10 个)50.看事情透彻(11 个)51.对事情的态度与评价(7 个)52.数量多与少(11 个)53.建筑相关(6 个)54.相同与不同(17 个)55.技艺精湛(10 个)56.与观看欣赏相…...

linux如何配置静态IP
文章目录 使用ip命令(临时配置)Debian/Ubuntu系统(使用netplan)CentOS/RHEL系统(使用nmcli或nmtui)使用nmcli(命令行界面)使用nmtui(文本用户界面)通过图形界…...

Dependency Check:一款针对应用程序依赖组件的安全检测工具
关于Dependency Check Dependency-Check 是一款软件组合分析 (SCA) 工具,可尝试检测项目依赖项中包含的公开披露的漏洞。它通过确定给定依赖项是否存在通用平台枚举 (CPE) 标识符来实现此目的。如果找到,它…...

Python 从入门到实战28(文件的读操作)
我们的目标是:通过这一套资料学习下来,通过熟练掌握python基础,然后结合经典实例、实践相结合,使我们完全掌握python,并做到独立完成项目开发的能力。 上篇文章我们讨论了文件的打开、创建、关闭的相关知识。今天我们将…...

[leetcode刷题]面试经典150题之7同构字符串(简单)
这个题虽然是简单题,但是看了半天还是没啥好思路,最后看了解题学到了不少知识点 1.index() 函数查找序列中首次出现的元素索引 2.zip函数:用于将可迭代的对象(如列表、元组、字典等)作为参数,将对象中对应…...

【Keil5教程及技巧】耗时一周精心整理万字全网最全Keil5(MDK-ARM)功能详细介绍【建议收藏-细细品尝】
💌 所属专栏:【单片机开发软件技巧】 😀 作 者: 于晓超 🚀 个人简介:嵌入式工程师,专注嵌入式领域基础和实战分享 ,欢迎咨询! 💖 欢迎大家࿱…...

【rust】 基于rust编写wasm,实现markdown转换为html文本
文章目录 背景转换预览核心代码前置依赖rustup换源cargo换源中科大 wasm-pack安装 背景 尝试用rust编写一款markdown转html的插件,通过wasm给html使用,不得不说体积挺小,约200K, 比go的wasm起步2MB看着舒服点。 不过go的配置和换…...

Java中的反向代理与负载均衡:Nginx与Java服务的集成
Java中的反向代理与负载均衡:Nginx与Java服务的集成 大家好,我是微赚淘客返利系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!今天我们来探讨一下Java应用中的反向代理与负载均衡,以及如何通过Ngin…...

高级java每日一道面试题-2024年9月26日-运维篇[分布式篇]-如何保证每个服务器的时间都是同步的?
如果有遗漏,评论区告诉我进行补充 面试官: 如何保证每个服务器的时间都是同步的? 我回答: 确保服务器之间的时间同步对于维护分布式系统的一致性、日志记录的准确性以及安全认证的有效性非常重要。以下是几种常见的方法来保证服务器时间同步: 1. 使用NTP&#…...

探索MemGPT:AI界的新宠儿
文章目录 探索MemGPT:AI界的新宠儿1. 背景介绍2. MemGPT是什么?3. 如何安装MemGPT?4. 简单的库函数使用方法5. 场景应用场景一:创建持久聊天机器人场景二:文档分析场景三:多会话聊天互动 6. 常见Bug及解决方…...

处理RabbitMQ连接和认证问题
在使用RabbitMQ进行消息队列管理时,我们可能会遇到各种连接和认证问题。本文将介绍如何诊断和解决这些问题,并通过使用RabbitMQ的管理端进行登录验证来确保配置正确。 1. 问题概述 在最近的一次部署中,我们遇到了两个主要问题: …...

FFmpeg中结构释放小函数
用于FFmpeg一些结构内存释放问题 #pragma once #include <iostream>extern "C" { #include "libavformat/avformat.h" #include "libavcodec/avcodec.h" #include "libavutil/avutil.h" #include "libavutil/frame.h"…...

C语言中的一些小知识(三)
一、你了解printf()吗? 你知道下面代码的输出结果吗? int a123; printf("%2d \n",a); printf() 函数是 C 语言中用于格式化输出的标准函数,它允许你将数据以特定的格式输出到标准输出设备(通常是屏幕)。p…...

编译win2k3中tools目录下i386mk.inc文件的作用
编译win2k3中tools目录下i386mk.inc文件的作用 在Windows Driver Kit(WDK)的根安装目录下,这些文件存储在bin子目录中。 在这些文件中,有特定于该目标的优化规则或汇编指令。可能还需要额外的链接标志、资源编译器标志或C预处理器…...

IPSec隧道协议学习(一)
前情回顾 前面介绍的GRE隧道协议,可以字LAN之间通过Internet建立隧道,实现网络间资源共享,但是GRE隧道协议不能实现加密功能,传输的数据不受加密保护,为了实现在隧道间传输数据包收到加密保护,需要使用IPS…...