当前位置: 首页 > news >正文

搭建hadoop集群的常见问题及解决办法

问题一: namenode -format重复初始化

出现问题的原因是重复初始化时会重新生成集群ID,而dn还是原先的集群ID,两者不匹配时无法启动相应的dn进程。
怎么查找问题原因:在logs目录下找到对应节点的.log文件,使用tail -200 文件名来查看日志信息。
解决办法1:修改data/name/路径下的version文件中的集群ID为老的集群ID,事实修改后仍然报错,初始化不只是集群ID不一致,建议使用方法2:。
解决办法2:删除hadoop文件中的data文件和logs文件。

问题二:免密登录配置出错,permission denied没有权限;拒绝访问

重新使用加密算法生成公钥私钥,并将公钥发送给相应的主机。

  1. ssh-keygen -t rsa
  2. ssh-copy-id hadoop10xxx

常用的端口号

rpc内部通信http外部web端口
namenode802050070 / 9870
mapreduce80888088
历史服务器1988819888

集群的时间同步

  • 有网络的情况
    • systemctl start ntpd:开启网络时间同步
    • systemctl status ntpd : 查看开启状态
  • 没有外部网络的情况
    • sudo vim /etc/ntp.conf:设置102作为基准服务器
    • ntpdate hadoop102: 向102发送请求同步时间
    • sudo crontab -e: 设置定时任务

HDFS文件系统

概述

全称为Hadoop distributed file system, 是一个分布式文件系统,通过目录树来定位文件。适合一次写入,多次读出的场景。一个文件经过创建、写入和关闭之后就不能改变

  1. 优点:
    • 高容错性:通过增加副本的形式,提高容错性;副本丢失后会自动补全
    • 适合处理大数据:数据规模达到PB级别,文件数量达到9亿个
    • 可以构建在廉价机器上
  2. 缺点:
    • 不适合低延时数据访问,比如毫秒级的存储数据。
    • 无法高效对大量小文件进行存储,小文件存储的寻址时间超过了读取时间
    • 不支持并发写入,文件随机修改。仅支持数据的追加,不支持随机修改

组成架构

在这里插入图片描述

  1. NameNode:主管
    • 管理HDFS的名称空间
    • 配置副本策略
    • 管理数据块映射信息
    • 处理客户端读写请求
  2. DataNode: 工人
  3. Client:客户端
    • 文件切分,上传之前就切分。
      • 如果上传后切分,有可能存不下
      • 上传后切分,有三个备份,需要多切几次。
    • 管理HDFS,如namenode格式化
  4. SecondaryNameNode:辅助NameNode,并非热备。

文件块大小

由磁盘的传输速率决定,由于目前磁盘的传输速率为100M/s,按照程序员的进制进行整数转换为2进制则为128。

根据专家的结论:寻址时间为传输时间的1%时,是最佳状态。

  1. 文件块太小会增加寻址时间
  2. 文件块太大,磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。大于1%这个最佳状态。

hdfs文件操作系统的常用命令

  • hadoop fs 等价于 hdfs dfs
  • 上传文件到hdfs文件系统
    • hadoop fs -copyFromLocal caocao.txt /sanguo : 上传
    • hadoop fs -moveFromLocal liubei.txt /sanguo:上传后删除
    • hadoop fs -put sunquan.txt /sanguo:上传
    • hadop fs appendToFIle sunquan.txt /sanguo/liubei.txt:追加文件内容
  • 从hdfs文件系统下载文件到本地
    • hadoop fs -copyToLocal /sanguo/liubei.txt ./:拷贝下载
    • hadoop fs -get /README.txt ./: 拷贝下载
    • hadoop fs moveToLocal: 剪切到本地,暂时没有实现
  • hadoop fs -ls /sanguo: 查询文件列表
  • hadoop fs -cat /sanguo/caocao.txt: 查看文件内容
  • hadoop fs -chmod 77 /sanguo/caocao.txt: 修改文件权限
  • hadoop fs -du /sanguo: 查询文件夹下的文件的大小
  • hadoop fs -setrep 10 /sanguo/caocao.txt:设置副本数量

HDFS的API操作

IDEA常用快捷键

  1. 双击shift : 搜索框
  2. ctrl + h: 查询当前类的父子关系
  3. ctrl + F12: 查询当前类的所有方法
  4. ctrl+p: 显示方法的形参列表
  5. ctrl+alt+f:快速将局部变量提升为全局变量

配置文件优先级

  1. 代码中的conf.set
  2. resources目录下的xxx-site.xml配置文件
  3. jar包中的xxx-default.xml配置文件

相关文章:

搭建hadoop集群的常见问题及解决办法

问题一: namenode -format重复初始化 出现问题的原因是重复初始化时会重新生成集群ID,而dn还是原先的集群ID,两者不匹配时无法启动相应的dn进程。 怎么查找问题原因:在logs目录下找到对应节点的.log文件,使用tail -200 文件名来查…...

virtualbox centos 使用NAT模式上网

新安装了centos7之后&#xff0c;发现无法yum&#xff0c;无法ping外网。ping 外网域名无法ping通。 virtualbox的nat 网卡已经打开了。 需要手动打开centos7的网卡&#xff08;centos7.9&#xff09; 可以通过 ip addr 命令查看网卡地址 1: lo: <LOOPBACK,UP,LOWER_UP>…...

蓝桥杯官网填空题(梅森素数)

题目描述 本题为填空题&#xff0c;只需要算出结果后&#xff0c;在代码中使用输出语句将所填结果输出即可。 如果一个数字的所有真因子之和等于自身&#xff0c;则称它为“完全数”或“完美数” 例如&#xff1a; 6 1 2 3 28 1 2 4 7 14早在公元前 300300 多年&am…...

IBM Spectrum LSF Application Center 以应用程序为中心的工作负载提交和管理

IBM Spectrum LSF Application Center 为集群用户和管理员提供了一个灵活的、以应用为中心的界面。IBM Spectrum LSF Application Center 作为 IBM Spectrum LSF 的可选附加模块提供&#xff0c;使用户能够与直观、自我记录的界面进行交互。这提高了用户满意度和生产力。通过对…...

同步FIFO的verilog实现(2)——高位扩展法

一、前言 在之前的文章中&#xff0c;我们介绍了同步FIFO的verilog的一种实现方法&#xff1a;计数法。其核心在于&#xff1a;在同步FIFO中&#xff0c;我们可以很容易的使用计数来判断FIFO中还剩下多少可读的数据&#xff0c;从而可以判断空、满。 关于计数法实现同步FIFO的详…...

数据结构与算法面试

1、链表反转 需要三个指针&#xff0c;一个pre指针指向反转的前一个节点&#xff0c;cur指向要反转的节点&#xff0c;然后设置有一个temp指针指向需要反转的下一个节点&#xff0c;用来使得cur指针移动&#xff0c;因为我们反转之后&#xff0c;无法使用next指针访问到后一个节…...

android studio cmake生成.a文件(静态库)及调用(c c++)静态库.a

第一步生成静态库.a文件: cmake 语法如何生成静态库,就不介绍了,比较简单,我下文列出的参考资料里面有详细介绍。 add_library(${CMAKE_PROJECT_NAME} STATICsrc/CalculStatic.cpp)这一步有坑,我刚开始的时候,也花了不少时间,死活都没有生成.a静态库文件。但是我多方查…...

本地部署体验LISA模型(LISA≈图像分割基础模型SAM+多模态大语言模型LLaVA)

GitHub地址&#xff1a;https://github.com/dvlab-research/LISA 该项目论文paper reading&#xff1a;https://blog.csdn.net/Transfattyacids/article/details/132254770 在GitHub上下载源文件&#xff0c;进入下载的文件夹&#xff0c;打开该地址下的命令控制台&#xff0c;…...

SpotBugs代码检查:instanceof总是返回true(BC_VACUOUS_INSTANCEOF)

https://spotbugs.readthedocs.io/en/latest/bugDescriptions.html#bc-instanceof-will-always-return-true-bc-vacuous-instanceof 使用instanceof判断的时候&#xff0c;总是返回true&#xff0c;除非被检测的结果是null。遇到这种告警&#xff0c;可能是写代码的人理解错误…...

Redis的Java客户端:Jedis入门

Jedis的优点在于方法名称和Redis命令基本一致&#xff0c;不过存在线程安全问题&#xff0c;在多线程操作时需要引入线程池。 一、引入依赖 <!--jedis--> <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifa…...

【完整代码】2023数学建模国赛C题代码--蔬菜类商品的自动定价与补货决策

C 题 蔬菜类商品的自动定价与补货决策 在生鲜商超中&#xff0c;一般蔬菜类商品的保鲜期都比较短&#xff0c;且品相随销售时间的增加而变差&#xff0c; 大部分品种如当日未售出&#xff0c;隔日就无法再售。因此&#xff0c;商超通常会根据各商品的历史销售和需 求情况每天进…...

idea:java: Compilation failed: internal java compiler error

java: Compilation failed: internal java compiler error错误 检查下面2个即可&#xff1a;...

普罗米修斯(Prometheus)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一、普罗米修斯&#xff08;Prometheus&#xff09;是什么&#xff1f;1.下载Prometheus工具&#xff08;切记和操作系统版本对应&#xff09;2.解压命令3.修改prom…...

JAVA面试题2012年版本

1、已知a10&#xff0c;b15,在不用第三方变量的情况下&#xff0c;将a、b的值调换? 2、Session容易丢值&#xff0c;cookie不安全&#xff0c;用什么可以代替它们? 3、简述多态的特征及意义 4、冒泡排序 5、已知int array[]{3,7,5,12,20};实现从大到小排序并返回数组输出…...

IED设备模型

IED设备模型 IED设备模型是指对工业电子设备进行详细描述和建模的模型。它的核心是通过设备的特性和功能来建立相应的数学模型,以便进行仿真、测试和优化等操作。 建立IED设备模型需要遵循以下步骤: 设备描述:首先需要详细描述设备的功能、特性、参数等信息,以便建立相应…...

HTTP代理如何设置

HTTP代理是一种非常重要的网络工具&#xff0c;它可以帮助我们在访问互联网时提高访问速度&#xff0c;保护用户隐私等等。在使用HTTP代理时&#xff0c;需要先进行设置。下面就来介绍一下HTTP代理如何设置。 一、了解HTTP代理 在开始设置HTTP代理之前&#xff0c;我们需要先了…...

【设计模式】单例设计模式

目录 1、前言 2、基本语法 2.1、懒汉式单例 2.2、饿汉式单例 2.3、双重检验锁单例模式 2.4、静态内部类单例模式 2.5、枚举单例模式 2.6、ThreadLocal单例模式 2.7、注册单例模式 3、使用场景 4、使用示例 5、常见问题 5、总结 1、前言 单例模式是一种设计模式&…...

SpingBoot整合Sa-Token框架(1)

一、文档参考&#xff1a;框架介绍 (sa-token.cc) 框架生态——开源项目 (sa-token.cc) 二、与SpingBoot整合 1、创建项目 在 IDE 中新建一个 SpringBoot 项目&#xff0c;例如&#xff1a;sa-token-demo-springboot&#xff08;不会的同学请自行百度或者参考&#xff1a;Sp…...

软件测试技术题目大全【含答案】

请看下面 你的测试职业发展是什么?  测试经验越多&#xff0c;测试能力越高。所以我的职业发展是需要时间积累的&#xff0c;一步步向着高级测试工程师奔去。而且我也有初步的职业规划&#xff0c;前3年积累测试经验&#xff0c;按如何做好测试工程师的要点去要求自己&#x…...

C#__线程的优先级和状态控制

线程的优先级&#xff1a; 一个CPU同一时刻只能做一件事情&#xff0c;哪个线程优先级高哪个先运行&#xff0c;优先级相同看调度算法。 在Thread类中的Priority属性&#xff08;Highest,Above,Normal,BelowNormal,Lowest&#xff09;可以影响线程的优先级 关于…...

Face Analysis WebUI在金融领域的应用:远程开户身份核验

Face Analysis WebUI在金融领域的应用&#xff1a;远程开户身份核验 1. 引言 想象一下这样的场景&#xff1a;一位偏远地区的客户想要开设银行账户&#xff0c;但最近的银行网点在100公里外。传统方式下&#xff0c;他需要亲自前往网点&#xff0c;排队等待&#xff0c;提交各…...

小米智能家居与Home Assistant完美融合:打造高效智能家居生态

小米智能家居与Home Assistant完美融合&#xff1a;打造高效智能家居生态 【免费下载链接】ha_xiaomi_home Xiaomi Home Integration for Home Assistant 项目地址: https://gitcode.com/GitHub_Trending/ha/ha_xiaomi_home 小米智能家居Home Assistant集成是由小米官方…...

vLLM-v0.17.1保姆级教程:vLLM + Weights Biases 实验跟踪实践

vLLM-v0.17.1保姆级教程&#xff1a;vLLM Weights & Biases 实验跟踪实践 1. vLLM框架简介 vLLM是一个专注于大语言模型推理和服务的开源库&#xff0c;以其出色的性能和易用性在开发者社区中广受欢迎。这个项目最初由加州大学伯克利分校的天空计算实验室发起&#xff0…...

Wan2.2-T2V-A5B开发环境配置:IntelliJ IDEA远程调试与GPU服务器连接

Wan2.2-T2V-A5B开发环境配置&#xff1a;IntelliJ IDEA远程调试与GPU服务器连接 你是不是也遇到过这种烦恼&#xff1f;本地电脑性能有限&#xff0c;跑个稍微大点的模型就卡成幻灯片&#xff0c;风扇呼呼作响&#xff0c;感觉下一秒就要起飞。但代码和模型都部署在远端的GPU服…...

大数据-253 离线数仓 - Airflow 入门与任务调度实战:DAG、Operator、Executor 部署排错指南

TL;DR 场景&#xff1a;面向离线数仓与定时任务场景&#xff0c;快速理解 Airflow 的核心概念、DAG 编排方式与基础命令。结论&#xff1a;本文内容适合作为 Airflow 入门示例&#xff0c;但代码与命令明显偏旧&#xff0c;需区分 Airflow 1.x 与 2.x 版本差异。产出&#xff…...

C++的std--ranges中的优化内联

C的std::ranges中的优化内联&#xff1a;提升性能的利器 在现代C编程中&#xff0c;std::ranges库的引入为算法和范围操作带来了更高的抽象性和灵活性。许多开发者可能忽略了其背后隐藏的性能优化潜力——尤其是通过内联机制实现的效率提升。本文将深入探讨std::ranges中的优化…...

XUnity.AutoTranslator:如何为Unity游戏构建高效的多语言本地化系统

XUnity.AutoTranslator&#xff1a;如何为Unity游戏构建高效的多语言本地化系统 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator XUnity.AutoTranslator是一个专为Unity游戏设计的自动翻译插件&#xff0c…...

事件驱动RTOS EventOS的创新设计与应用实践

1. 事件驱动型RTOS的创新设计 在嵌入式系统开发领域&#xff0c;实时操作系统(RTOS)一直是关键基础设施。传统RTOS如FreeRTOS、uC/OS等大多采用基于时间片轮转的任务调度机制&#xff0c;而EventOS则开创性地采用了事件驱动架构&#xff0c;这在资源受限的嵌入式环境中具有独特…...

从脑电波到股票K线:EMD经验模态分解在5个真实场景下的避坑指南

从脑电波到股票K线&#xff1a;EMD经验模态分解在5个真实场景下的避坑指南 当你第一次看到脑电波信号与股票K线图被放在同一个分析框架下讨论时&#xff0c;可能会觉得这是两个毫不相关的领域。但事实上&#xff0c;无论是神经科学家的EEG数据&#xff0c;还是量化交易员的股价…...

3种方案解锁Unity游戏潜力:MelonLoader全平台模组加载器实战指南

3种方案解锁Unity游戏潜力&#xff1a;MelonLoader全平台模组加载器实战指南 【免费下载链接】MelonLoader The Worlds First Universal Mod Loader for Unity Games compatible with both Il2Cpp and Mono 项目地址: https://gitcode.com/gh_mirrors/me/MelonLoader 一…...