当前位置：首页 > news >正文

Spark Standalone环境搭建及测试

news 2026/5/18 19:03:50

🥇🥇【大数据学习记录篇】-持续更新中~🥇🥇

篇一：Linux系统下配置java环境
篇二：hadoop伪分布式搭建（超详细）
篇三：hadoop完全分布式集群搭建（超详细）-大数据集群搭建
篇四：Spark Local环境搭建及测试

文章目录

- 1.Spark Standalone环境搭建介绍
- 2.搭建环境准备：
- 3.搭建步骤:

1.Spark Standalone环境搭建介绍

在这里插入图片描述

Apache Spark是目前最流行的大数据处理框架之一，可用于分布式数据处理和分析。在Standalone模式下搭建Spark集群是学习和开发Spark应用程序的良好起点。

2.搭建环境准备：

本次用到的环境有：
Java 1.8.0_191
Spark-2.2.0-bin-hadoop2.7
Hadoop 2.7.4
Oracle Linux 7.4

3.搭建步骤:

1.解压Spark压缩文件至/opt目录下

tar -zxvf  ~/experiment/file/spark-2.2.0-bin-hadoop2.7.tgz  -C  /opt

在这里插入图片描述

2.修改解压后为文件名为spark

mv /opt/spark-2.2.0-bin-hadoop2.7 /opt/spark

在这里插入图片描述

3.复制spark配置文件，首先在主节点(Master)上，进入Spark安装目录下的配置文件目录{ $SPARK_HOME/conf }，并复制spark-env.sh配置文件：

cd /opt/spark/conf
cp spark-env.sh.template spark-env.sh

在这里插入图片描述

4.Vim编辑器打开spark配置文件

vim spark-env.sh

在这里插入图片描述

5.按键Shift+g键定位到最后一行，按键 i 切换到输入模式下，添加如下代码，注意：“=”附近无空格：

export JAVA_HOME=/usr/lib/java-1.8
export SPARK_MASTER_HOST=master
export SPARK_MASTER_PORT=7077

在这里插入图片描述

按键Esc，输入:wq保存退出
6.复制一份spark的slaves配置文件

cp slaves.template slaves

在这里插入图片描述

7.修改spark的slaves配置文件

vim slaves

在这里插入图片描述

8.每一行添加工作节点(Worker)名称，按键Shift+g键定位到最后一行，按键 i 切换到输入模式下，添加如下代码

slave1
slave2

在这里插入图片描述

按键Esc，输入:wq保存退出
9.复制一份spark-defaults.conf

cp spark-defaults.conf.template spark-defaults.conf

在这里插入图片描述

10.通过远程scp指令将Master主节点的Spark安装包分发至各个从节点，即slave1和slave2节点

scp -r /opt/spark/ root@slave1:/opt/
scp -r /opt/spark/ root@slave2:/opt/

在这里插入图片描述

11.配置环境变量：分别在slave1和slave2节点上配置环境变量，修改【/etc/profile】，在文件尾部追加以下内容

vim /etc/profile

按键Shift+g键定位到最后一行，按键 i 切换到输入模式下，添加如下代码

#spark install
export SPARK_HOME=/opt/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

主节点（master）上执行截图，如下：
在这里插入图片描述

从节点1（Slave1）上执行截图，如下：
在这里插入图片描述

从节点2（Slave2）上执行截图，如下：
在这里插入图片描述

12.按键Esc，按键:wq保存退出
13.分别在Slave1和Slave2上，刷新配置文件
在这里插入图片描述

source /etc/profile

14.开启standalone集群守护进程，分别开启Standalone集群的守护进程：Master和Worker。注意：需要在主节点执行该操作！

start-master.sh     
start-slaves.sh

在这里插入图片描述

15.Spark独立集群搭建成功后，查看后台守护线程，如图所示，即Standalone模式搭建成功！！

jps

在这里插入图片描述

16.查看WebUI监控，独立集群管理器开启后，可以通过WebUI监控界面查看集群管理器的相关信息，地址为：http://master:8080 如图所示
在这里插入图片描述

17.开启spark-shell会话，向独立集群管理器提交应用，需要把spark://masternode:7070作为主节点参数传–master。指令如下

spark-shell --master spark://master:7077

在这里插入图片描述

所有配置完成，如果本篇文章对你有帮助，记得点赞关注+收藏哦~

Spark Standalone环境搭建及测试

🥇🥇【大数据学习记录篇】-持续更新中~🥇🥇 篇一：Linux系统下配置java环境篇二：hadoop伪分布式搭建（超详细） 篇三：hadoop完全分布式集群搭建（超详细&#xf…...

编程日记 2023/8/25 4:29:12

【PHP】流程控制-ifswitchforwhiledo-whilecontinuebreak

文章目录流程控制顺序结构分支结构if分支switch分支循环结构for循环while循环do-while循环continue和break 流程控制顺序结构：代码从上往下，顺序执行。（代码执行的最基本结构） 分支结构：给定一个条件，…...

编程日记 2023/8/25 4:28:11

Pytorch-day04-模型构建-checkpoint

PyTorch 模型构建 1、GPU配置2、数据预处理3、划分训练集、验证集、测试集4、选择模型5、设定损失函数&优化方法6、模型效果评估 #导入常用包 import os import numpy as np import torch from torch.utils.data import Dataset, DataLoader from torchvision.transfor…...

编程日记 2023/8/25 4:27:09

使用Xshell7控制多台服务同时安装ZK最新版集群服务

编程日记 2023/8/25 4:26:08

python numpy array dtype和astype类型转换的区别

Python3 本身对整数的支持做了提升，可以支持无限长度的整数：比如： b 0xffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffPython的模块numpy array定义的数组在windows和MACOS上默认长度是…...

编程日记 2023/8/25 4:25:07

浮动属性样式

🍓浮动属性属性名称中文注释备注float设置盒子浮动left左浮动，right右浮动，none不浮动clear清除浮动left清除左浮动，right清除右浮动，both左右浮动都清除（注意：clear清除浮动一般只有作用在块…...

编程日记 2023/8/25 4:24:06

keepalived双机热备 (四十五)

一、概述 Keepalived 是一个基于 VRRP 协议来实现的 LVS 服务高可用方案，可以解决静态路由出现的单点故障问题。原理在一个 LVS 服务集群中通常有主服务器（MASTER）和备份服务器（BACKUP）两种角色的服务器…...

编程日记 2023/8/25 4:23:05

SpringBoot整合阿里云OSS，实现图片上传

在项目中，将图片等文件资源上传到阿里云的OSS，减少服务器压力。项目中导入阿里云的SDK <dependency><groupId>com.aliyun.oss</groupId><artifactId>aliyun-sdk-oss</artifactId><version>3.10.2</version>…...

编程日记 2023/8/25 4:22:03

Dynaminc Programming相关

目录 3.1 最长回文子串（中等）：标志位 3.2 最大子数组和（中等）：动态规划 3.3 爬楼梯（简单）：动态规划 3.4 买卖股票的最佳时机（简单）&#xff1…...

编程日记 2023/8/25 4:21:01

使用 Elasticsearch 轻松进行中文文本分类

本文记录下使用 Elasticsearch 进行文本分类，当我第一次偶然发现 Elasticsearch 时，就被它的易用性、速度和配置选项所吸引。每次使用 Elasticsearch，我都能找到一种更为简单的方法来解决我一贯通过传统的自然语言处理 (NLP) 工具和技术来解决…...

编程日记 2023/8/25 4:19:55

MNN学习笔记（八）：使用MNN推理Mediapipe模型

1.项目说明最近需要用到一些mediapipe中的模型功能，于是尝试对mediapipe中的一些模型进行转换，并使用MNN进行推理；主要模型包括：图像分类、人脸检测及人脸关键点mesh、手掌检测及手势关键点、人体检测及人体关键点、图像嵌入特征…...

编程日记 2023/8/25 4:18:53

文章目录主力吸筹指标指标代码分析使用说明使用配图主力吸筹指标 VAR1:=REF(LOW,1); VAR2:=SMA(MAX(LOW-VAR1,0),3,1)/SMA(ABS(LOW-VAR1),3,1)*100; VAR3:=EMA(VAR2,3); VAR4:=LLV(LOW,34); VAR5:=HHV(VAR3,34); VAR7:=EMA(IF(LOW<=VAR4,(VAR3+VAR5*2)/2,0),3); /*底线:0,…...

编程日记 2023/8/25 4:17:51

Python高光谱遥感数据处理与高光谱遥感机器学习方法教程

详情点击链接：Python高光谱遥感数据处理与高光谱遥感机器学习方法教程第一：高光谱基础一：高光谱遥感基本 01)高光谱遥感 02)光的波长 03)光谱分辨率 04)高光谱遥感的历史和发展二：高光谱传感器与数据获取 01)高光谱遥感…...

编程日记 2023/8/25 4:16:49

【洛谷】P1678 烦恼的高考志愿

原题链接：https://www.luogu.com.cn/problem/P1678 目录 1. 题目描述 2. 思路分析 3. 代码实现 1. 题目描述 2. 思路分析将每个学校的分数线用sort()升序排序，再二分查找每个学校的分数线，通过二分找到每个同学估分附近的分数线。最后…...

编程日记 2023/8/25 4:15:47

开机自启CPU设置定频

sudo apt-get install expect sudo apt-get install cpufrequtils具体步骤如下： 安装 cpufrequtils 工具 ⚫ sudo apt-get install cpufrequtils ⚫ 需要联网下载修改配置文件 ⚫ sudo vi /etc/init.d/cpufrequtils ⚫ 将 GOVERNOR“ondemand” 改为： &g…...

编程日记 2023/8/25 4:14:46

嵌入式Linux开发实操（十二）：PWM接口开发

# 前言使用pwm实现LED点灯，可以说是嵌入式系统的一个基本案例。那么嵌入式linux系统下又如何实现pwm点led灯呢？ # PWM在嵌入式linux下的操作指令实际使用效果如下，可以通过shell指令将开发板对应的LED灯点亮。点亮3个LED，则分别使用pwm1、pwm2和pwm3。 # PWM引脚的硬…...

编程日记 2023/8/25 4:13:45

消息中间件介绍

消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能，成为异步RPC的主要手段之一。当今市面上有很多主流的消息中间件，如ActiveMQ、RabbitMQ，Kafka，还有阿里巴巴…...

编程日记 2023/8/25 4:12:44

[Unity] 基础的编程思想, 组件式开发

熟悉 C# 开发的朋友, 在刚进入 Unity 开发时, 不可避免的会有一些迷惑, 例如不清楚 Unity 自己的思想, 如何设计与架构一个应用程序之类的. 本篇文章简要的介绍一下 Unity 的基础编程思想. 独立 Unity 很少使用 C# 的标准库, 例如 C# 的网络, 事件驱动, 对象模型, 这些概念在 …...

编程日记 2023/8/25 4:10:36

SVN 项目管理笔记

SVN 项目管理笔记主要是介绍 SVN 管理项目的常用操作，方便以后查阅！！！ 一、本地项目提交到SVN流程在SVN仓库下创建和项目名同样的文件夹目录；选中本地项目文件，选择SVN->checkout,第一个是远程仓库项…...

编程日记 2023/8/25 4:09:35

Android获取手机已安装应用列表JAVA实现

最终效果: 设计实现java代码: //获取包列表private List<String> getPkgList() {List<String> packages new ArrayList<String>();try {//使用命令行方式获取包列表Process p Runtime.getRuntime().exec("pm list packages");//取得命令行输出…...

编程日记 2023/8/25 4:08:30

PostgreSQL 主从流复制完整部署指南：从零搭建到故障切换

文章目录每日一句正能量前言1.环境准备1.1 基础环境要求1.2 安装PostgreSQL2.1 修改PostgreSQL主配置文件2.2 修改客户端认证配置文件2.3 创建复制专用用户2.4 重启主库使配置生效2.5 备份主库数据（供从库初始化）3.从库配置3.1 停止从库PostgreSQL服务并…...

编程新知 2026/5/18 18:05:32

不只是优化和频率：用GaussView 5.0玩转HOMO/LUMO、电子密度与反应位点预测

不只是优化和频率：用GaussView 5.0玩转HOMO/LUMO、电子密度与反应位点预测在计算化学领域，Gaussian和GaussView的组合堪称黄金搭档。但许多研究者往往止步于基础的几何优化和频率计算，未能充分挖掘这套工具在反应机理研究和论文写作中的潜力…...

编程新知 2026/5/18 17:17:32

gomicro如何安装部暑

根据最新官方文档，以下是 go-micro（v5 最新版） 的完整安装与部署指南。目前最新稳定版本为 v5.16.0，推荐使用特定版本号安装以避免模块路径冲突。---一、环境准备要求说明 Go Go 1.21（建议最新版） …...

编程新知 2026/5/18 16:20:39

TensorBoard命令找不到？别慌，用pip install tensorboard和tensorflow两步搞定

TensorBoard命令找不到？三步彻底解决环境配置难题刚接触深度学习的新手们，第一次在终端输入tensorboard --logdirlogs时，大概率会遇到那个令人沮丧的报错："tensorboard: command not found"。这就像学开车时发现方向盘…...

编程新知 2026/5/18 15:52:58

Ubuntu 20.04远程桌面翻车记：手把手教你从LightDM救回默认GNOME桌面

Ubuntu 20.04桌面环境救援指南：从LightDM回归GNOME的完整方案那天下午，实验室的Ubuntu服务器突然变得陌生——熟悉的GNOME桌面消失了，取而代之的是一个简陋的登录界面。前一天还能流畅运行的深度学习模型，现在连Jupyter Noteboo…...

编程新知 2026/5/18 15:22:33

3分钟搞定网易云音乐NCM解密：ncmdump工具让你的音乐随处播放

3分钟搞定网易云音乐NCM解密：ncmdump工具让你的音乐随处播放【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾为网易云音乐下载的歌曲只能在特定客户端播放而烦恼？当你想要在车载音响、智能音箱或其他…...

编程新知 2026/5/18 15:06:09

别再死记硬背了！用Python的NumPy库5分钟搞定矩阵行列式计算（附代码示例）

用NumPy解放线性代数：5分钟掌握矩阵行列式的实战计算行列式计算是线性代数中的基础操作，但在实际工程和数据分析中，手动计算不仅效率低下，还容易出错。想象一下，当你面对一个44甚至更大规模的矩阵时，展开式…...

编程新知 2026/5/18 14:15:40

云原生技能图谱：构建开发者能力模型与学习路径

1. 项目概述：一个面向云原生时代的技能图谱仓库最近在整理团队内部的技术分享材料时，我偶然发现了一个在开发者社区里讨论度颇高的开源项目：prevu-cloud/skills。乍一看这个名字，你可能会觉得它只是一个普通的“技能列表”或者“学…...

编程新知 2026/5/18 12:16:35

DLSS Swapper终极指南：免费开源工具让游戏DLSS管理变得简单快速

DLSS Swapper终极指南：免费开源工具让游戏DLSS管理变得简单快速【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 如果你正在寻找一款能够智能管理游戏DLSS、FSR和XeSS文件的免费开源工具，那么DLS…...

编程新知 2026/5/18 10:04:42

WandEnhancer技术解密：如何通过本地化增强重新定义游戏修改体验

WandEnhancer技术解密：如何通过本地化增强重新定义游戏修改体验【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 你是否曾经面对游戏修改工具…...

编程新知 2026/5/18 14:12:39

Spark Standalone环境搭建及测试

文章目录

1.Spark Standalone环境搭建介绍

2.搭建环境准备：

3.搭建步骤:

相关文章：

Spark Standalone环境搭建及测试

【PHP】流程控制-ifswitchforwhiledo-whilecontinuebreak

Pytorch-day04-模型构建-checkpoint

使用Xshell7控制多台服务同时安装ZK最新版集群服务

python numpy array dtype和astype类型转换的区别

浮动属性样式

keepalived双机热备 (四十五)

SpringBoot整合阿里云OSS，实现图片上传

Dynaminc Programming相关

使用 Elasticsearch 轻松进行中文文本分类

MNN学习笔记（八）：使用MNN推理Mediapipe模型

主力吸筹指标及其分析和使用说明

Python高光谱遥感数据处理与高光谱遥感机器学习方法教程

【洛谷】P1678 烦恼的高考志愿

开机自启CPU设置定频

嵌入式Linux开发实操（十二）：PWM接口开发

消息中间件介绍

[Unity] 基础的编程思想, 组件式开发

SVN 项目管理笔记

Android获取手机已安装应用列表JAVA实现

PostgreSQL 主从流复制完整部署指南：从零搭建到故障切换

不只是优化和频率：用GaussView 5.0玩转HOMO/LUMO、电子密度与反应位点预测

gomicro如何安装部暑

TensorBoard命令找不到？别慌，用pip install tensorboard和tensorflow两步搞定

Ubuntu 20.04远程桌面翻车记：手把手教你从LightDM救回默认GNOME桌面

3分钟搞定网易云音乐NCM解密：ncmdump工具让你的音乐随处播放

别再死记硬背了！用Python的NumPy库5分钟搞定矩阵行列式计算（附代码示例）

云原生技能图谱：构建开发者能力模型与学习路径

DLSS Swapper终极指南：免费开源工具让游戏DLSS管理变得简单快速

WandEnhancer技术解密：如何通过本地化增强重新定义游戏修改体验