大数据开发环境的安装,配置(Hadoop)
1. 三台linux服务器的安装
1. 安装VMware
-
VMware虚拟机软件是一个“虚拟PC”软件,它使你可以在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。与“多启动”系统相比,VMWare采用了完全不同的概念。
-
我们可以通过VMware来安装我们的linux虚拟机,然后通过linux虚拟机来进行集群的安装,VMware的安装双击之后,一路下一步即可,尽量不要装在操作系统盘里面了,VMware的安装步骤省略
2. 通过Vmware安装第一台linux机器(种子机)
-
我们通过Vmware可以安装第一台我们的linux机器,接下来我们来看如何通过VMWare创建linux虚拟机,并给我们的虚拟机挂载操作系统
1:双击Vmware打开之后,点击创建新的虚拟机
2:选择自定义安装配置
3:选择稍后安装操作系统
4:选择稍后安装操作系统
5:选择安装路径,==尽量不要放在系统盘(默认是C盘),并且所在盘符的剩余空间尽量大些==
6:CPU核数,默认即可
7:虚拟机内存根据自身windows电脑进行调整
例如如果windows是8GB内存,那么每台虚拟机内存给2048M内存,如果windows是16GB没存,那么每台虚拟机可以给3072M内存即可
8:网络配置一定要选择NAT
9:磁盘大小尽量给40GB
注意:千万==不要==勾选“立即分配所有磁盘空间”
10:完成
3. 为我们创建的linux虚拟机挂载操作系统
-
我们现在已经有了一台虚拟电脑了,就类似我们刚刚买了一台电脑回来,只不过不同的是我们这台虚拟电脑还没有操作系统我们需要为这台电脑挂在操作系统出来
1:通过设置来挂载操作系统
2:直接回车开始安装
用键盘的方向键,选中“Install CentOS 7”,然后按回车,开始安装
再按回车键
3:设置键盘为英文键盘
4:接下来配置这三项
(1)设置①时区为Asia/Shanghai
(2)设置②INSTALATION DESTINATION
(3)设置③NETWORK & HOST NAME
5:设置root用户密码
6:安装完成之后重启reboot即可
此过程稍长,耐心等待
4. 为我们的linux虚拟机设置网络配置
-
我们的linux虚拟机已经创建并挂载好了操作系统,接下来我们可以为我们的第一台虚拟机来设置网络地址了,设置网络地址比较麻烦,尽量一步步的操作
1:设置虚拟机的网段
2:查看==NAT模式==的网关,子网IP以及子网掩码
3:设置window当中的VMNet8网络地址
4:设置linux当中的网络
编辑配置文件
vi /etc/sysconfig/network-scripts/ifcfg-ens33
添加联网四要素
IPADDR=192.168.51.100
NETMASK=255.255.255.0
GATEWAY=192.168.51.1
DNS1=8.8.8.8
具体参考下图
更改完成配置,重启网络服务
systemctl restart network
安装一些常用的软件
yum -y install vim
yum -y install net-tools
关机
init 0
5. 克隆第一台机器--->种子机要处于关机状态
-
现在我们已经有了种子机器了,我们可以通过种子机器进行复制或者克隆出三台机器
-
关闭linux种子机器,然后准备进行克隆
选择创建完整克隆
6. 更改克隆机器的IP地址(跟咱们的网关,子网IP,ip地址,种子机IP,前三位保持一致,最后一位,各不相同)
-
三台机器的ip地址分别是
192.168.51.100、192.168.51.110、192.168.51.120
-
克隆出来的机器IP地址与种子的ip地址一样,我们将第二台机器的IP地址更改为192.168.51.110即可
-
启动虚拟机,并通过root用户,密码123456来进行登录,然后来更改linux机器的IP地址
vi /etc/sysconfig/network-scripts/ifcfg-ens33
IPADDR=192.168.51.110
NETMASK=255.255.255.0
GATEWAY=192.168.51.1
DNS1=8.8.8.8
-
依照上面步骤,接着克隆第三台机器,并将第三台机器的IP地址设置为
192.168.51.120
建议:三台机器准备好后,打个快照,便于出错后恢复
systemctl restart network
2. 安装大数据集群前的环境准备
1. 三台虚拟机关闭防火墙
三台机器执行以下命令(root用户来执行)
systemctl stop firewalld
systemctl disable firewalld
systemctl status firewalld
2. 三台机器关闭selinux
三台机器执行以下命令关闭selinux
vi /etc/sysconfig/selinux
SELINUX=disabled
3. 三台机器更改主机名
三台机器执行以下命令更改主机名
vi /etc/hostname
第一台机器更改内容
node01.itheima.com
第二台机器更改内容
node02.itheima.com
第三台机器更改内容
node03.itheima.com
4. 三台机器做主机名与IP地址的映射
三台机器执行以下命令更改主机名与IP地址的映射
vi /etc/hosts
192.168.51.100 node01.itheima.com node01
192.168.51.110 node02.itheima.com node02
192.168.51.120 node03.itheima.com node03
==注意:根据自己的实际情况,修改ip地址==
5. 三台机器时钟同步
第一种同步方式:通过网络进行时钟同步
通过网络连接外网进行时钟同步,必须保证虚拟机连上外网
三台机器都安装ntpdate
yum -y install ntpdate
阿里云时钟同步服务器
ntpdate ntp4.aliyun.com
三台机器定时任务
crontab -e
添加如下内容
*/1 * * * * /usr/sbin/ntpdate ntp4.aliyun.com;
第二种同步方式:内网某机器作为时钟同步服务器(推荐)
以下操作都在root用户下面执行,通过su root切换到root用户
以192.168.51.100这台服务器的时间为准进行时钟同步
第一步:三台机器确定是否安装了ntpd的服务
三台机器确认是否安装ntpdate时钟同步工具
rpm -qa | grep ntpdate
如果没有安装,三台机器执行以下命令可以进行在线安装
yum -y install ntpdate
node01安装ntp
yum -y install ntp
三台机器,执行以下命令,设置时区为中国上海时区
timedatectl set-timezone Asia/Shanghai
第二步:node01启动ntpd服务
我们需要启动node01的ntpd服务,作为服务端,对外提供同步时间的服务
启动ntpd的服务
#启动ntpd服务
systemctl start ntpd#设置ntpd服务开机启动
systemctl enable ntpd
第三步:修改node01服务器配置
修改node01这台服务器的时钟同步配置,允许对外提供服务
vim /etc/ntp.conf
添加以下两行内容
# 同意192.168.51.0网段(修改成自己的网段)的所有机器与node01同步时间
restrict 192.168.237.0 mask 255.255.255.0 nomodify notrap
server 127.127.1.0
注释掉以下这四行内容
#server 0.centos.pool.ntp.org iburst
#server 1.centos.pool.ntp.org iburst
#server 2.centos.pool.ntp.org iburst
#server 3.centos.pool.ntp.org iburst
修改完成之后,重启node01的ntpd服务
systemctl restart ntpd
至此,ntpd的服务端已经安装配置完成,接下来配置客户端与服务端进行同步
第四步:配置node02与node03同步node01的时间
客户端node02与node03设置时区与node01保持一致Asia/Shanghai
node02与node03修改配置文件,保证每次时间写入硬件时钟
vim /etc/sysconfig/ntpdate
SYNC_HWCLOCK=yes
node02与node03修改定时任务,定时与node01同步时间
[root@node03 hadoop]# crontab -e
增加如下内容
*/1 * * * * /usr/sbin/ntpdate node01
6. 三台机器添加普通用户
三台linux服务器统一添加普通用户hadoop,并给以sudo权限,用于以后所有的大数据软件的安装
并统一设置普通用户的密码为 ==123456==
useradd hadoop
passwd hadoop
普通用户的密码设置为123456
三台机器为普通用户添加sudo权限
visudo
增加如下内容
## Allow root to run any commands anywherehadoop ALL=(ALL) ALL
7. 三台定义统一目录
定义三台linux服务器软件压缩包存放目录,以及解压后安装目录,三台机器执行以下命令,创建两个文件夹,一个用于存放软件压缩包目录,一个用于存放解压后目录
mkdir -p /itheima/soft # 软件压缩包存放目录
mkdir -p /itheima/install # 软件解压后存放目录
chown -R hadoop:hadoop /itheima # 将文件夹权限更改为hadoop用户
权限高的用户完全可以操作权限低的用户所拥有的的目录或者文件
创建hadoop用户之后,我们三台机器都通过hadoop用户来进行操作,以后再也不需要使用root用户来操作了
三台机器通过 su hadoop命令来切换到hadoop用户
su hadoop
8. 三台机器hadoop用户免密码登录
重启下3个linux虚拟机,让主机名生效
重启命令:reboot -h now
第一步:三台机器在相同用户下执行以下命令生成公钥与私钥
ssh-keygen -t rsa
执行上述命令之后,按三次Enter键即可生成了
第二步:三台机器在相同用户下,执行命令拷贝公钥到node01,node02,node03服务器
ssh-copy-id node01
ssh-copy-id node02
ssh-copy-id node03
第三步:验证;从任意节点是否能免秘钥登陆其他节点;如node01免密登陆node02
ssh node02
注意:如果免密登录失败,三台机器:(1)root用户下,cd /root/.ssh (2)hadoop用户下,进入到 cd /home/hadoop/.ssh/,删除.ssh目录下的所有文件,重新生成公钥私钥,重新分发公钥
9. 三台机器关机重启
三台机器在hadoop用户下执行以下命令,实现关机重启
sudo reboot -h now
su root
10. 三台机器安装jdk
-
使用hadoop用户来重新连接三台机器,然后使用hadoop用户来安装jdk软件
-
上传压缩包到第一台服务器的/itheima/soft下面,然后进行解压,配置环境变量即可,三台机器都依次安装即可
-
上传下载rz sz安装:yum -y install lrzsz 压缩包大于40G的话,可能没法用rz上传。
cd /itheima/soft/
tar -zxvf jdk-8u141-linux-x64.tar.gz -C /itheima/install/
sudo vim /etc/profile
#添加以下配置内容,配置jdk环境变量
export JAVA_HOME=/itheima/install/jdk1.8.0_141
export PATH=$PATH:$JAVA_HOME/bin
让修改马上生效
source /etc/profile
建议:三台机器准备好后,打个快照,便于出错后恢复
相关文章:

大数据开发环境的安装,配置(Hadoop)
1. 三台linux服务器的安装 1. 安装VMware VMware虚拟机软件是一个“虚拟PC”软件,它使你可以在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。与“多启动”系统相比,VMWare采用了完全不同的概念。 我们可以通过VMware来安装我们的linux虚拟机…...
【GCC bug】libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found
在 conda 环境安装 gcc/gxx 之后,运行开始遇到了以下的报错 File "/mnt/data/home/xxxx/miniforge3/envs/GAGAvatar/lib/python3.12/site-packages/google/protobuf/internal/wire_format.py", line 13, in <module>from google.protobuf import de…...
Android killPackageProcessesLSP 源码分析
该方法用于终止指定包名/用户ID/应用ID下符合条件的应用进程,涉及多进程管理、资源冻结、进程清理及优先级更新等操作。核心流程分为进程筛选、资源冻结、进程终止与资源恢复三个阶段。 /*** 从已排序的进程列表中,提取从指定起始索引 startIdx 开始的连…...

驱动开发硬核特训 · Day 16:字符设备驱动模型与实战注册流程
🎥 视频教程请关注 B 站:“嵌入式 Jerry” 一、为什么要学习字符设备驱动? 在 Linux 驱动开发中,字符设备(Character Device)驱动 是最基础也是最常见的一类驱动类型。很多设备(如 LED、按键、…...
CDN加速http请求
一、CDN加速定义 CDN(Content Delivery Network,内容分发网络)是通过全球分布式节点服务器缓存网站内容,使用户就近获取数据的技术。其核心目标是缩短用户与内容之间的物理距离,解决网络拥塞、带宽不足等问题ÿ…...
SpringCloud微服务架构设计与实践 - 面试实战
SpringCloud微服务架构设计与实践 - 面试实战 第一轮提问 面试官:马架构,请问在SpringCloud微服务架构中,如何实现服务注册与发现? 马架构:在SpringCloud中,Eureka是常用的服务注册与发现组件。服务提供…...
关于位运算的一些小记
目录 1.判断一个整数是不是2的幂 2.判断一个整数是不是3的幂 3.大于n的最小的2次幂的数 4.交换两个数 5.找到1-n中缺失的数字 6.判断数组中2个出现次数为奇数的数 6.求给定范围内所有数字&的结果 7. 求出现次数少于m的数 1.判断一个整数是不是2的幂 提取出二进制里最…...

Virtuoso ADE采用Spectre仿真中出现MOS管最小长宽比满足要求依然报错的情况解决方法
在ADE仿真中错误问题如下: ERROR (CMI-2440): "xxx.scs" 46338: I2.M1: The length, width, or area of the instance does not fit the given lmax-lmin, wmax-wmin, or areamax-areamin range for any model in the I2.M3.nch_hvt group. The channel w…...
图论---朴素Prim(稠密图)
O( n ^2 ) 题目通常会提示数据范围: 若 V ≤ 500,两种方法均可(朴素Prim更稳)。 若 V ≤ 1e5,必须用优先队列Prim vector 存图。 // 最小生成树 —朴素Prim #include<cstring> #include<iostream> #i…...
Java知识日常巩固(四)
什么是 Java 中的自动装箱和拆箱? 在Java中,自动装箱(Autoboxing)和拆箱(Unboxing)是Java 5引入的特性,它们允许基本数据类型(如 int、double 等)和它们对应的包装类(如 Integer、Double 等)之间进行自动转换。 自动装箱是指将基本数据类型的值自动…...
go.mod介绍
在 Go 项目中,.mod 文件(全称 go.mod)是 Go 语言模块(Module)系统的核心配置文件,用于定义和管理项目的依赖关系、模块名称及兼容性规则。以下是其核心作用与结构的详细说明: 一、go.mod 文件的…...

大模型应用开发之LLM入门
一、大模型概述 1、大模型概念 LLM是指用有大量参数的大型预训练语言模型,在解决各种自然语言处理任务方面表现出强大的能力,甚至可以展现出一些小规模语言模型所不具备的特殊能力 2、语言模型language model 语言建模旨在对词序列的生成概率进行建模…...
算法之回溯法
回溯法 回溯法定义与概念核心思想回溯法的一般框架伪代码表示C语言实现框架 回溯法的优化技巧剪枝策略实现剪枝的C语言示例记忆化搜索 案例分析N皇后问题子集和问题全排列问题寻路问题 回溯法的可视化理解决策树状态空间树回溯过程 回溯法与其他算法的比较回溯法与动态规划的区…...

武汉昊衡科技OLI光纤微裂纹检测仪:高密度光器件的精准守护者
随着AI技术应用越来越广,算力需求激增,光通信系统正加速向小型化、高密度、多通道方向演进。硅光芯片、高速光模块等核心器件内部的光纤通道数量成倍增加,波导结构愈发精细,传统检测手段因分辨率不足、效率低下,难以精…...

SQL 函数进行左边自动补位fnPadLeft和FORMAT
目录 1.问题 2.解决 方式1 方式2 3.结果 1.问题 例如在SQL存储过程中,将1 或10 或 100 长度不足的时候,自动补足长度。 例如 1 → 001 10→ 010 100→100 2.解决 方式1 SELECT FORMAT (1, 000) AS FormattedNum; SELECT FORMAT(12, 000) AS Form…...

Tailwind CSS实战:快速构建定制化UI的新思路
引言 在当今快节奏的前端开发环境中,开发者不断寻找能够提高效率并保持灵活性的工具。Tailwind CSS作为一个功能型优先的CSS框架,正在改变开发者构建用户界面的方式。与Bootstrap和Material UI等传统组件库不同,Tailwind不提供预设组件&…...

【数据可视化-25】时尚零售销售数据集的机器学习可视化分析
🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者,提供AI相关的技术咨询、项目开发和个…...

UML 活动图深度解析:以在线购物系统为例
目录 一、UML 活动图的基本构成要素 二、题目原型 三、在线购物系统用户购物活动图详细剖析 (一)概述 (二)节点分析 三、注意事项 四、活动图绘画 五、UML 活动图在软件开发中的关键价值 六、总结 在软件开发与系统设计领…...
利用车联网中的 V2V 通信技术传播公平的紧急信息
与移动自组织网络 (MANET) 相比,车载自组织网络 (VANET) 的节点移动速度更快。网络连接的节点可以在自身内部或其他基础设施之间交换安全或非安全消息,例如车对车 (V2V) 或车对万物 (V2X)。在车载通信中,紧急消息对于安全至关重要,必须分发给所有节点,以提醒它们注意潜在问…...
文件的读取操作
#import time # 导入time 库 # 打开文件 fileopen("E:\Dasktape/python_test.txt","r",encoding"UTF-8")# 读取文件 print(f"读取文件的所有内容内容:{file.read()}\n") #\n是换行字符 print(f"读取10个字节的文件内容:{file.re…...
数学基础 -- 欧拉恒等式的魅力:让复数旋转起来!
公式推导: e i π − 1 e^{i\pi} -1 eiπ−1 被誉为数学中最美的公式之一,它连接了五个数学中最重要的常数: e i π 1 0 (欧拉恒等式) e^{i\pi} 1 0 \tag{欧拉恒等式} eiπ10(欧拉恒等式) 这不仅是巧合,而是复数与三角函数…...
【android bluetooth 协议分析 06】【l2cap详解 6】【L2CA_Register函数解析】
L2CA_Register() 函数的实现,它的作用是: 注册一个 L2CAP 服务(基于 PSM)并设置回调函数、MTU、安全等级、传输模式等信息,供 L2CAP 层用于处理连接、配置、数据、断开等事件。 1. L2CA_Register2/L2CA_Register 参数…...

【MFC】 VS2022打开低版本的MFC,双击.rc文件,DIalog加载失败,页面弹窗fatal error RC***:cannot open*****
打开以前的MFC示例报错,打开VS2019的实例以及更早VS版本的实例都一样,打不开,还报错; 错误 MSB8041 此项目需要 MFC 库。从 Visual Studio 安装程序(单个组件选项卡)为正在使用的任何工具集和体系结构安装它们。 GxCameraEvents_VS2015 C:\P…...

Centos9 安装 nginx 及配置
1. 安装nginx 安装依赖软件,安装之前可以看一下是否已经安装过以下软件,dnf list installed | grep zlib dnf install gcc-c dnf install zlib dnf install pcre pcre-devel dnf install openssl openssl-devel下载nginx,这里是下载到opt文…...

使用Handsontable实现动态表格和下载表格
1.效果 2.实现代码 首先要加载Handsontable,在示例中我是cdn的方式引入的,vue的话需要下载插件 let hot null;var exportPlugin null;function showHandsontable(param) {const container document.getElementById("hot-container");// 如果…...

Action:Update your application‘s configuration
在使用Maven项目时,有一个报错信息是:Update your applications configuration 这类问题,就是我们的application.yml文件 或者 application.properties文件 内容哪里写错了 最有可能就是对齐方式有问题...

【计算机网络】IP地址
IPv4 五类地址 1.0.0.0 ~ 126.255.255.255A类子网8位,主机24位128.0.0.0 ~ 191.255.255.255B类子网16位,主机16位192.0.0.0 ~ 223.255.255.255C类子网24位,主机8位224.0.0.0 ~ 239.255.255.255D类不分网络地址和主机地址,作为组播…...

Rundeck 介绍及安装:自动化调度与执行工具
Rundeck介绍 概述:Rundeck 是什么? Rundeck 是一款开源的自动化调度和任务执行工具,专为运维场景设计,帮助工程师通过统一的平台管理和执行跨系统、跨节点的任务。它由 PagerDuty 维护(2016 年收购)&#…...

vue element使用el-table时,切换tab,table表格列项发生错位问题
展示问题 问题描述:使用el-table的fixed"right"属性后,如果切换tab时,回出现最后一列错误的问题 官网提供解决方法:doLayout 需要注意的事项:我这里是通过组件使用的table组件,涉及多层组件封装…...

第十二章 Python语言-大数据分析PySpark(终)
目录 一. PySpark前言介绍 二.基础准备 三.数据输入 四.数据计算 1.数据计算-map方法 2.数据计算-flatMap算子 3.数据计算-reduceByKey方法 4.数据计算-filter方法 5.数据计算-distinct方法 6.数据计算-sortBy方法 五.数据输出 1.输出Python对象 (1&am…...