当前位置: 首页 > article >正文

【Linux】Hadoop-3.4.1的伪分布式集群的初步配置

配置步骤

一、检查环境

  • JDK
# 目前还是 JDK8 最适合 Hadoop
java -version
echo $JAVA_HOME
  • Hadoop
hadoop version
echo $HADOOP_HOME

    二、配置SSH免密登录

    Hadoop需要通过SSH管理节点(即使在伪分布式模式下)

    sudo apt install openssh-server    # 安装SSH服务(如未安装)cd ~/.ssh/ssh-keygen -t rsa    # 生成密钥对cat ./id_rsa.pub >> ./authorized_keys    # 添加公钥到授权列表ssh localhost    # 测试免密登录(首次可能需输入yes)ssh-copy-id xxx
    ssh xxx

    三、修改Hadoop核心配置文件

    进入配置文件目录:

    cd $HADOOP_HOME/etc/hadoop
    # 手动创建文件夹
    mkdir -p /opt/software/hadoop/data/tmp
    mkdir -p /opt/software/hadoop/data/logs
    mkdir -p /opt/software/hadoop/data/namenode
    mkdir -p /opt/software/hadoop/data/datanode
    • hadoop-env.sh
    vim hadoop-env.sh# 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"
    export HADOOP_CONF_DIR=/opt/software/hadoop/etc/hadoop
    export HADOOP_LOG_DIR=/opt/software/hadoop/data/logs
    export HADOOP_PID_DIR=/opt/software/hadoop/data/tmp
    • yarn-env.sh
    vim hadoop-env.sh# 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"
    • mapred-env.sh

    vim mapred-env.sh# 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"

    把环境刷新一下

    source hadoop-env.sh
    source yarn-env.sh
    source mapred-env.sh
    • core-site.xml

    <configuration><!-- 指定 NameNode 通信的地址 --><property><name>fs.defaultFS</name><value>hdfs://hadoop01:8020</value></property><!-- 指定 hadoop 运行过程中临时数据的存储目录 --><property><name>hadoop.tmp.dir</name><value>/opt/software/hadoop/data/tmp</value></property>
    </configuration>
    • hdfs-site.xml

    <configuration><!-- NameNode 存放元数据的本地目录--><property><name>dfs.namenode.name.dir</name><value>/opt/software/hadoop/data/namenode</value></property><!-- NameNode web 端访问地址--><property><name>dfs.namenode.http-address</name><value>hadoop01:9870</value></property><!-- Datanode 在本地存储 block 块的目录 --><property><name>dfs.datanode.data.dir</name><value>/opt/software/hadoop/data/datanode</value></property><!-- HDFS blocksize block 块大小 --><property><name>dfs.blocksize</name><value>134217728</value></property><!-- HDFS blocksize 也就是 block 的副本数--><property><name>dfs.replication</name><value>2</value></property>
    </configuration>
    • mapred-site.xml

    <configuration><!-- 指定 MapReduce 程序运行在 Yarn 上 --><property><name>mapreduce.framework.name</name><value>yarn</value></property>
    </configuration>
    • yarn-site.xml

    <configuration><!-- 指定 MR 走 shuffle --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><!-- 环境变量的继承 --><property><name>yarn.nodemanager.env-whitelist</name><value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value></property>
    </configuration>

    四、初始化与启动Hadoop

    • 格式化HDFS
    hdfs namenode -format# 成功标志:Storage directory ... has been successfully formatted
    • 启动HDFS和YARN
    start-dfs.sh   # 启动NameNode和DataNode
    start-yarn.sh  # 启动ResourceManager和NodeManager
    • jps 验证进程
    jps

    结束

    相关文章:

    【Linux】Hadoop-3.4.1的伪分布式集群的初步配置

    配置步骤 一、检查环境 JDK # 目前还是 JDK8 最适合 Hadoop java -version echo $JAVA_HOME Hadoop hadoop version echo $HADOOP_HOME 二、配置SSH免密登录 Hadoop需要通过SSH管理节点&#xff08;即使在伪分布式模式下&#xff09; sudo apt install openssh-server …...

    【Java】深入了解下Java Bitset

    【Java】深入了解下Java Bitset 推荐超级课程&#xff1a; 本地离线DeepSeek AI方案部署实战教程【完全版】Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战 目录 【Java】深入了解下Java Bitset引言如果Java Bitset不是布尔数组&#xff0c;那它是什么…...

    Linux CentOS7 安装 ffmpeg教程

    官网&#xff1a;FFmpeg 操作 先用uname -a 查看内核版本&#xff0c;如果是 3.2.0或者以上就可以按照此办法来安装 cd /tmp wget https://johnvansickle.com/ffmpeg/releases/ffmpeg-release-amd64-static.tar.xz# 2. 解压 tar xvf ffmpeg-release-amd64-static.tar.xz# 3. 将…...

    楼宇自控系统的结构密码:总线与分布式结构方式的差异与应用

    在现代建筑中&#xff0c;为了实现高效、智能的管理&#xff0c;楼宇自控系统变得越来越重要。它就像建筑的 智能管家&#xff0c;可自动控制照明、空调、通风等各种机电设备&#xff0c;让建筑运行更顺畅&#xff0c;还能节省能源成本。而在楼宇自控系统里&#xff0c;有两种关…...

    Fourier-Lerobot——把斯坦福人形动作策略iDP3封装进了Lerobot(含我司七月人形研发落地实践)

    前言 近期在抠lerobot源码时&#xff0c;看到其封装了ALOHA ACT、diffusion policy、π0时&#xff0c;我就在想&#xff0c;lerobot其实可以再封装下idp3 我甚至考虑是否从我联合带的那十几个具身研究生中选几个同学做下这事&#xff0c;对他们也是很好的历练然当25年3.18日…...

    系统架构设计知识体系总结

    1.技术选型 1.什么是技术选型&#xff1f; 技术选型是指评估和选择在项目或系统开发中使用的最合适的技术和工具的过程。这涉及考虑基于其能力、特性、与项目需求的兼容性、可扩展性、性能、维护和其他因素的各种可用选项。技术选型的目标是确定与项目目标相符合、能够有效解…...

    计划管理工具应该具备的能(甘特图)

    在当今快节奏的项目管理环境中&#xff0c;高效地规划和跟踪项目进度是至关重要的。甘特图&#xff0c;作为项目管理领域的经典工具&#xff0c;以其直观的时间轴和任务分配方式&#xff0c;深受项目管理者的青睐。 随着数字化时代的到来&#xff0c;甘特图线上编辑器应运而生&…...

    简单实用!百度AI + Raphael AI = 免费生图

    简单实用&#xff01;百度AI Raphael AI 免费生图 -- ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/b55eda9141d34697b05db0cd60f62b75.png#pic_center) 第一步&#xff1a;下载或截取一些好看的图片当参考图片 第二步&#xff1a;用百度AI描述你想要的图片&…...

    2 相交链表

    1 常规思路 比较两个链表的长度&#xff0c;然后让较短的链表走二者长度之差&#xff0c;此时两个链表就一样长了&#xff0c;开始用双指针遍历&#xff0c;如果有相等返回&#xff0c;没有返回null&#xff1b; 为了减少冗余代码&#xff0c;我们设置一个minCur和maxCur分别…...

    2025-03-22 学习记录--C/C++-C 库函数 - getchar()

    C 库函数 - getchar() ⭐️ C 标准库 - <stdio.h> &#xff08;一&#xff09;、函数声明 &#x1f36d; int getchar(void)从标准输入 stdin 获取一个字符&#xff08;一个无符号字符&#xff09;。 参数&#xff1a;&#x1f380; NA 返回值&#xff1a;&#x1f38…...

    APM 仿真遥控指南

    地面站开发了一段时间了&#xff0c;由于没有硬件&#xff0c;所以一直在 APM 模拟器中验证。我们已经实现了 MAVLink 消息接收和解析&#xff0c;显示无人机状态&#xff0c;给无人机发送消息&#xff0c;实现一键起飞&#xff0c;飞往指定地点&#xff0c;降落&#xff0c;返…...

    如何防止大语言模型生成有害内容?技术与非技术手段解析

    目录 如何防止大语言模型生成有害内容&#xff1f;技术与非技术手段解析 1. 技术手段 方法 1&#xff1a;使用内容过滤&#xff08;Content Filtering&#xff09; 方法 2&#xff1a;基于模型的有害内容检测&#xff08;Toxicity Classification&#xff09; 方法 3&#…...

    BBR 和 CUBIC 对长肥管道的不同反应

    有个关于 CUBIC(等一众 AIMD-based cc) 和 BBR 在长肥管道中的行为比较挺有趣&#xff0c;它们的表现竟然截然相反&#xff1a; CUBIC 流共存&#xff0c;RTT 越大&#xff0c;Goodput 越低&#xff1b;BBR 流共存&#xff0c;RTT 越大&#xff0c;Goodput 越高。 前一个被看…...

    架构师面试(十九):IM 架构

    问题 IM 系统从架构模式上包括 【介绍人模式】和 【代理人模式】。介绍人模式也叫直连模式&#xff0c;消息收发不需要服务端的参与&#xff0c;即客户端之间直连的方式&#xff1b;代理人模式也叫中转模式&#xff0c;消息收发需要服务端进行中转。 下面关于这两类模式描述的…...

    Spring框架入门指南:从Hello World到IOC容器

    第一章&#xff1a;Spring框架的介绍 1. Spring框架的概述 Spring是一个开放源代码的设计层面框架&#xff0c;它解决的是业务逻辑层和其他各层的松耦合问题&#xff0c;因此它将面向接口的编程思想贯穿整个系统应用。 Spring是于2003 年兴起的一个轻量级的Java开发框架&…...

    嵌入式电路设计软件个人安装步骤分享

    各位小伙伴大家好,今天给大家分享一个,电路设计软件的安装方法,希望对大家有所帮助。 一、下载【Multisim14.0安装包】: 链接:夸克网盘分享 提取码:kHSP 电脑安装Multisim14.0并且汉化 准备安装包以及汉化包双击“NI_Circuit_Design_Suite_14_0【海量免费资源:kebaiwan…...

    git | 回退版本 并保存当前修改到stash,在进行整合。[git checkout | git stash 等方法 ]

    目录 一些常见命令&#xff1a; git 回退版本 一、临时回退&#xff08;不会修改历史&#xff0c;可随时回到当前版本&#xff09; 方法1&#xff1a;git checkout HEAD~1 二、永久回退&#xff08;改变分支指向&#xff09; 方法2&#xff1a;git reset 1. 保留修改&am…...

    学习笔记:黑马程序员JavaWeb开发教程(2025.3.22)

    11.1 案例-员工管理-新增员工 考试完之后&#xff0c;时隔一个月再次运行项目&#xff0c;出现了报错&#xff1a; class lombok.javac.apt.LombokProcessor (in unnamed module 0x5d7f1e59) cannot access class com.sun.tools.javac.processing.JavacProcessingEnvironme…...

    Java IO性能优化:字节流与缓冲流的对比与实战分析

    引言 在Java开发中&#xff0c;文件读写和网络数据传输是高频操作。然而&#xff0c;许多开发者在使用FileInputStream、FileOutputStream等基础字节流时&#xff0c;常因忽略IO性能问题导致程序效率低下。本文将深入分析普通字节流与**缓冲字节流&#xff08;BufferedInputSt…...

    【Java SE】单例设计模式

    参考笔记&#xff1a;深入理解Java设计模式&#xff1a;单例模式及其饿汉式与懒汉式的对比,-CSDN博客 目录 1.什么是设计模式 2.经典设计模式 3.单例设计模式&#xff08;static属性/方法经典使用场景 &#xff09; 3.1 饿汉式单例模式 3.2 懒汉式单例模式 4.补充 1.什么…...

    安全守护:反光衣检测技术的革新之路

    视觉分析助力船上工人反光衣检测 在现代工业生产与作业环境中&#xff0c;安全始终是首要考虑的因素。对于水上作业&#xff0c;如船舶维护、海上施工等场景&#xff0c;工人穿戴反光衣是预防事故、提高可见性的重要措施。然而&#xff0c;传统的人工检查方式不仅效率低下&…...

    OSCP准备靶场联系-Kioptrix 1

    oscp 准备 Kioptrix 1 信息收集 ifconfig 确认自己的电脑ip&#xff0c;nmap收集通往段ip&#xff0c;确认靶机IP nmap 重点关注服务版本 nmap -sn 192.168.1.0/24 # 扫描网段内存活主机&#xff0c;不进行端口扫描[1,10](ref) nmap -sP 192.168.1.1 # 传统Ping扫描…...

    【工具变量】中国各地级市是否属于“信息惠民国家试点城市”匹配数据(2010-2024年)

    数据来源&#xff1a;国家等12部门联合发布的《关于加快实施信息惠民工程有关工作的通知》 数据说明&#xff1a;内含原始文件和匹配结果&#xff0c;当试点城市在2014年及以后&#xff0c;赋值为1&#xff1b;试点城市在2014年之前或该城市从未实施信息惠民试点工程&#x…...

    深度学习 Deep Learning 第7章 深度学习的正则化

    深度学习 第7章 深度学习的正则化 章节概述 正则化技术是深度学习中防止过拟合、提升模型泛化能力的核心手段。本章深入探讨了深度学习中的正则化技术&#xff0c;旨在解决模型在新数据上的泛化能力问题。正则化是通过在学习算法中引入额外的约束或惩罚项&#xff0c;来减少模…...

    使用DeepSeek翻译英文科技论文,以MarkDown格式输出,使用Writage 3.3.1插件转换为Word文件

    一、使用DeepSeek翻译英文科技论文&#xff0c;以MarkDown格式输出 以科技论文“Electrical Power System Sizing within the Numerical Propulsion System Simulation”为例。 关于Writage 3.3.1的进一步了解&#xff0c;可发送邮件至邮箱pyengine163.com. 首先&#xff0c;打…...

    一文了解ThreadLocal

    什么是ThreadLocal&#xff1f; ThreadLocal是每个线程私有的&#xff0c;线程可以把自己的私有数据放到ThreadLocal里面&#xff0c;不用担心其他线程访问到自己ThreadLocal。 通过set()方法将值存入ThreadLocal或者修改值&#xff0c;get()方法取出值&#xff0c;remove()方…...

    常用数据库远程连接工具全解析:从入门到高效管理

    引言 在数字化时代&#xff0c;远程连接数据库已成为开发、运维和数据分析的必备技能。无论是云端数据库还是自建服务器&#xff0c;选择合适的工具能大幅提升效率。本文将盘点主流远程连接工具&#xff0c;涵盖功能特性、适用场景及操作指南&#xff0c;助你快速找到趁手的工…...

    C语言 转义字符

    在C语言中&#xff0c;转义字符是一种特殊的字符序列&#xff0c;用于表示一些无法直接输入或具有特殊含义的字符。它以反斜杠“\”开头&#xff0c;后面跟随一个字符或一组字符&#xff0c;用来表示一个特定的字符或控制功能。 转义字符的用途 表示不可打印字符&#xff1a;…...

    【免费】2000-2019年各省地方财政印花税数据

    2000-2019年各省地方财政印花税数据 1、时间&#xff1a;2000-2019年 2、来源&#xff1a;国家统计局、统计年鉴 3、指标&#xff1a;行政区划代码、地区、年份、地方财政印花税 4、范围&#xff1a;31省 5、指标说明&#xff1a;印花税是对特定经济活动和法律行为所征收的…...

    MyBatis-Plus 的加载及初始化

    在 Spring Boot 启动过程中&#xff0c;MyBatis-Plus 的加载和初始化涉及多个阶段的工作。这些工作包括 MyBatis-Plus 自身的配置解析、Mapper 接口的扫描与注册、SQL 语句的动态注入以及底层 MyBatis 的初始化等。以下是对整个过程的详细分析&#xff1a; 1. Spring Boot 启动…...