当前位置：首页 > news >正文

1.spark standalone环境安装

news 2026/5/18 14:24:49

概述

环境是spark 3.2.4 hadoop版本 3.2.4，所以官网下载的包为 spark-3.2.4-bin-hadoop3.2.tgz

在具体安装部署之前，需要先下载Spark的安装包，进到 spark的官网，点击download按钮
在这里插入图片描述

使用Spark的时候一般都是需要和Hadoop交互的，所以需要下载带有Hadoop依赖的安装包
这个时候就需要选择Hadoop版本对应的Spark安装包
在这里插入图片描述

机器配置

注意：需要确保这几台机器上的基础环境是OK的，防火墙、免密码登录、还有JDK
因为这几台机器之前已经使用过了，基础环境都是配置过的，所以说在这就直接使用了

linux机器配置请参考此链接

机器ip	机器名
10.32.xx.142	hadoop01
10.32.xx.143	hadoop02
10.32.xx.144	hadoop03
10.32.xx.145	hadoop04

standalone 配置

主节点

先在hadoop01上进行配置

解压

# 解压
[root@hadoop01 soft]# tar -zxvf spark-3.2.4-bin-hadoop3.2.tgz[root@hadoop01 soft]# cd  spark-3.2.4-bin-hadoop3.2
[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# cd conf/
[root@hadoop01 conf]# ls
fairscheduler.xml.template  log4j.properties.template  metrics.properties.template  spark-defaults.conf.template  spark-env.sh.template  workers.template

配置spark-env.sh及workers

spark 2.x版本从节点叫 slaves.template spark 3.x 这后叫 workers.template ，这个需要注意

# 重命名spark-env.sh.template
[root@hadoop01 conf]# mv spark-env.sh.template spark-env.sh
[root@hadoop01 conf]# vi spark-env.sh 
# 在最后加入下面两句
export JAVA_HOME=/data/soft/jdk1.8
export SPARK_MASTER_HOST=hadoop01# 重命名workers.template
[root@hadoop01 conf]# mv workers.template workers
# 修改workers
[root@hadoop01 conf]# vi workers hadoop02
hadoop03
hadoop04

分发

将修改好配置的spark安装包分发到其它worker节点，即上文所说的 hadoop02 hadoop03 hadoop04 三台机器

# 将修改好配置的spark安装包 分发到其它worker节点
[root@hadoop01 soft]#  scp -rq spark-3.2.4-bin-hadoop3.2 hadoop02:/data/soft/
[root@hadoop01 soft]#  scp -rq spark-3.2.4-bin-hadoop3.2 hadoop03:/data/soft/
[root@hadoop01 soft]#  scp -rq spark-3.2.4-bin-hadoop3.2 hadoop04:/data/soft/

启动集群

启动Spark集群

[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# ls
bin  conf  data  examples  jars  kubernetes  LICENSE  licenses  NOTICE  python  R  README.md  RELEASE  sbin  yarn
[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# sbin/start-all.sh 
starting org.apache.spark.deploy.master.Master, logging to /data/soft/spark-3.2.4-bin-hadoop3.2/logs/spark-root-org.apache.spark.deploy.master.Master-1-hadoop01.out
hadoop04: starting org.apache.spark.deploy.worker.Worker, logging to /data/soft/spark-3.2.4-bin-hadoop3.2/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-hadoop04.out
hadoop03: starting org.apache.spark.deploy.worker.Worker, logging to /data/soft/spark-3.2.4-bin-hadoop3.2/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-hadoop03.out
hadoop02: starting org.apache.spark.deploy.worker.Worker, logging to /data/soft/spark-3.2.4-bin-hadoop3.2/logs/spark-root-org.apache.spark.deploy.worker.Worker-1-hadoop02.out

验证

[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# jps
10520 Master
12254 Jps[root@hadoop02 soft]# jps
4224 Worker
7132 Jps

还可以访问主节点的8080端口来查看集群信息

在这里插入图片描述

执行任务

验证结束后，跑个 spark 任务来测试一下吧

[root@hadoop01 spark-3.2.4-bin-hadoop3.2]# bin/spark-submit  --class org.apache.spark.examples.SparkPi --master spark://hadoop01:7077 examples/jars/spark-examples_2.12-3.2.4.jar 2

在这里插入图片描述

结束

这就是Spark的独立集群

1.spark standalone环境安装

概述环境是spark 3.2.4 hadoop版本 3.2.4，所以官网下载的包为 spark-3.2.4-bin-hadoop3.2.tgz 在具体安装部署之前，需要先下载Spark的安装包，进到 spark的官网，点击download按钮使用Spark的时候一般都是需要和Hadoop交互的&a…...

编程日记 2023/11/1 4:40:32

【问题解决】 avue dicUrl 动态参数加载字典数据（已解决）

事情是这样的，用了avue-crud组件，配置了一个option。现在有一列source属性要展示为多选的下拉框 ，当然问题不在这而在于，选项是需要根据同级别属性id去拿的。也就是option.column.source 的配置中需要该行的option.col…...

编程日记 2023/11/1 4:39:30

学习一下，什么是预包装食品？

预包装食品，指预先定量包装或者制作在包装材料和容器中的食品；包括预先定量包装以及预先定量制作在包装材质和容器中并且在一定量限范围内具有统一的质量或体积标识的食品。简单说， 就是指在包装完成后即具有确定的量值，这一确定的…...

编程日记 2023/11/1 4:38:29

从零开始学习搭建量化平台笔记

从零开始学习搭建量化平台笔记本笔记由纯新手小白开发学习记录，欢迎大佬请教指点留言，有空的话还可以认识一下，来上海请您喝咖啡~~ 2023/10/30：上份工作辞职并休息了几个月后，打算开始找个关于量化投资相关的工作。面…...

编程日记 2023/11/1 4:37:25

【whisper】在python中调用whisper提取字幕或翻译字幕到文本

最近在做视频处理相关的业务。其中有需要将视频提取字幕的需求，在我们实现过程中分为两步：先将音频分离，然后就用到了whisper来进行语音识别或者翻译。本文将详细介绍一下whisper的基本使用以及在python中调用whisper的两种方式。一、whispe…...

编程日记 2023/11/1 4:36:24

git diff对比差异时指定或排除特定的文件和目录

文章目录前言git diff指定或者排除文件指定文件和目录排除文件和目录番外篇总结前言你一般什么时候会用GPT? 居然会有这种话题，答案就是作为程序员的我天天在用，虽然GPT有个胡说八道的毛病，但试试总没错的，就比如今天题目中这…...

编程日记 2023/11/1 4:34:22

数据结构介绍与时间、空间复杂度

数据结构介绍什么是数据结构？什么是算法？数据结构和算法的重要性数据结构定义数据结构是计算机科学中研究数据组织、存储和管理的一门学科。数据结构描述了数据对象之间的关系，以及对数据对象进行操作的方法和规则。常见的数据结构数…...

编程日记 2023/11/1 4:32:20

(c语言进阶)字符串函数、字符分类函数和字符转换函数

一.求字符串长度 1.strlen() (1)基本概念头文件：<string.h> (2)易错点：strlen()的返回值为无符号整形 #include<stdio.h> #include<string.h> int main() {const char* str1 "abcdef";const char* str2 "bbb&q…...

编程日记 2023/11/1 4:31:19

解决MySQL大版本升级导致.Net(C#)程序连接报错问题

数据库版本从MySQL 5.7.21 升级到 MySQL8.0.21 数据升级完成后，直接修改程序的数据库连接配置信息 <connectionStrings> <add name"myConnectionString" connectionString"server192.168.31.200;uidapp;pwdFgTDkn0q!75;databasemail;&q…...

编程日记 2023/11/1 4:30:18

Java 将对象List转为csv文件并上传远程文件服务器实现方案

问题情景： 最近项目中遇到了根据第三方系统传递过来的参数，封装为List<实体类对象>后，将该实体类转换为csv文件，然后上传到远程的sftp服务器指定目录的需求。实现思路： List<实体类对象>转为csv文件的…...

编程日记 2023/11/1 4:29:17

分享8个分布式Kafka的使用场景

Kafka 最初是为海量日志处理而构建的。它保留消息直到过期，并让消费者按照自己的节奏提取消息。与它的前辈不同，Kafka 不仅仅是一个消息队列，它还是一个适用于各种情况的开源事件流平台。 1. 日志处理与分析下图显示了典型的 ELK&#xff0…...

编程日记 2023/11/1 4:27:15

【再见了暗恋对象朋友们看完之后的一些感悟】

【再见了暗恋对象】写完之后魏野是我的第一个读者，魏野的反应是：这就是青春啊，喜欢了一个不喜欢自己的人而且男生觉得很困扰女孩子喜欢被牵引着走，但是男孩子牵引就是因为不喜欢这个女孩子，好可怜！青春就这…...

编程日记 2023/11/1 4:26:15

JSON和Protobuf序列化

文章目录一、粘包和拆包1、半包问题2、半包现象原理二、JSON协议通信1、通用类库2、JSON传输的编码器和解码器三、Protobuf协议通信1、一个简单的proto文件的实践案例2、生成POJO和Builder3、消息POJO和Builder的使用案例1）构造POJO消息对象2）序列化和…...

编程日记 2023/11/1 4:25:13

lambda表达式 - c++11

文章目录： lambda表达式概念lambda表达式语法函数对象与lambda表达式 lambda表达式概念 lambda 表达式是 c11 中引入的一种匿名函数，它可以在需要函数对象的地方使用，可以用作函数参数或返回值。lambda 表达式可以看作是一种局部定义的函数对…...

编程日记 2023/11/1 4:24:11

509. 斐波那契数

斐波那契数 （通常用 F(n) 表示）形成的序列称为斐波那契数列。该数列由 0 和 1 开始，后面的每一项数字都是前面两项数字的和。也就是： F(0) 0，F(1) 1 F(n) F(n - 1) F(n - 2)，其中 n > 1给定 n &a…...

编程日记 2023/11/1 4:23:10

四、[mysql]索引优化-1

目录前言一、场景举例1.联合索引第一个字段用范围查询不走索引(分情况）2.强制走指定索引3.覆盖索引优化4.in和or在表数据量比较大的情况会走索引，在表记录不多的情况下会选择全表扫描5.like 后% 一般情况都会走索引(索引下推) 二、Mysql如何选择合适的索…...

编程日记 2023/11/1 4:22:09

PyTorch入门学习（九）：神经网络-最大池化使用

目录一、数据准备二、创建神经网络模型三、可视化最大池化效果一、数据准备首先，需要准备一个数据集来演示最大池化层的应用。在本例中，使用了CIFAR-10数据集，这是一个包含10个不同类别图像的数据集，用于分类任务。我们使…...

编程日记 2023/11/1 4:21:08

0基础学习PyFlink——用户自定义函数之UDF

大纲标量函数入参并非表中一行（Row）入参是表中一行（Row）alias PyFlink中关于用户定义方法有： UDF：用户自定义函数。UDTF：用户自定义表值函数。UDAF：用户自定义聚合函数。UDTAF&…...

编程日记 2023/11/1 4:20:08

英语小作文模板（06求助+描述；07描述+建议）

06 求助描述： 题目背景及要求第一段第二段第三段翻译成中文 07 描述＋建议： 题目背景及要求第一段第二段...

编程日记 2023/11/1 4:19:07

为什么感觉假期有时候比上班还累？

假期比上班还累的感觉可能由以下几个原因造成： 计划过度：在假期里，人们往往会制定各种计划，如旅游、聚会、休息等，以充分利用这段时间。然而，如果这些计划过于紧张或安排得过于紧密，就会导致身…...

编程日记 2023/11/1 4:18:05

Arm CADI 2.0调试接口架构与多调试器协同实践

1. CADI接口调试架构深度解析在嵌入式系统开发领域，调试接口的设计质量直接影响着开发效率。CADI（Component Architecture Debug Interface）作为Arm推出的标准化调试接口，其2.0版本通过创新的架构设计解决了传统调试方案中的诸多痛…...

编程新知 2026/5/18 13:52:09

终极免费桌面分区工具：NoFences让你的Windows桌面告别杂乱

终极免费桌面分区工具：NoFences让你的Windows桌面告别杂乱【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 还在为Windows桌面上杂乱无章的图标而烦恼吗&#xff1…...

编程新知 2026/5/18 12:10:23

CANape实战：如何绕过CSMconfig识别问题，用VN5610A的Network模式连接ECAT ADMM模块

CANape高阶实战：绕过CSMconfig限制实现VN5610A与ECAT模块的Network模式直连当工程师面对CSMconfig无法识别VN5610A网口的报错窗口时，往往会陷入传统配置路径的思维定式。这个看似简单的识别问题背后，实际上隐藏着新旧硬件架构更迭带来的工作…...

编程新知 2026/5/18 11:32:59

mRNA疫苗序列生物信息学分析：从密码子优化到免疫原性预测

1. 项目概述：解码两大mRNA疫苗的“核心蓝图”作为一名在生物信息学和基因组学领域摸爬滚打了十多年的“老码农”，我见过太多令人兴奋的数据集，但当我第一次在GitHub上看到这个名为“Assemblies-of-putative-SARS-CoV2-spike-encoding-mRNA-se…...

编程新知 2026/5/17 10:55:31

如何用Python爬虫将知识星球内容制作成PDF电子书：完整指南

如何用Python爬虫将知识星球内容制作成PDF电子书：完整指南【免费下载链接】zsxq-spider 爬取知识星球内容，并制作 PDF 电子书。项目地址: https://gitcode.com/gh_mirrors/zs/zsxq-spider 知识星球作为优质内容社区，汇集了大量付费专…...

编程新知 2026/5/18 12:21:25

AI智能体密钥安全管理：AgentVault架构解析与实战指南

1. 项目概述：一个为AI智能体打造的“保险箱”最近在折腾AI智能体（Agent）应用开发的朋友，估计都绕不开一个核心痛点：如何安全、可靠地管理智能体运行过程中需要用到的各种密钥、凭证和敏感数据？无论是调用Op…...

编程新知 2026/5/17 10:07:48

LrcHelper：3分钟掌握网易云音乐双语歌词下载，告别歌词烦恼

LrcHelper：3分钟掌握网易云音乐双语歌词下载，告别歌词烦恼【免费下载链接】LrcHelper 从网易云音乐下载带翻译的歌词 Walkman 适配项目地址: https://gitcode.com/gh_mirrors/lr/LrcHelper 你是否曾为找不到心爱歌曲的歌词而烦恼？或…...

编程新知 2026/5/18 10:48:38

Python与ChatGPT构建智能办公自动化：从任务分解到智能体系统

1. 项目概述：用Python与ChatGPT联手，让办公自动化“开口说话”如果你每天还在重复着打开Excel、复制粘贴数据、手动写邮件、整理报告这些枯燥的活儿，那这个项目可能就是你的“数字员工”入职通知书。Sven-Bo/automate-office-tasks-using-cha…...

编程新知 2026/5/18 12:21:23

JetBrains IDE试用期重置终极指南：简单三步实现30天无限续杯

JetBrains IDE试用期重置终极指南：简单三步实现30天无限续杯【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 你是否曾经在项目开发的关键时刻，突然看到JetBrains IDE弹出"评估期已结束…...

编程新知 2026/5/18 8:39:33

开源机械爪OpenClaw：从设计到力控抓取的完整实现指南

1. 项目概述：从“OpenClaw”看开源机械爪的无限可能最近在逛GitHub的时候，发现了一个挺有意思的项目，叫“MeyerZhou/openclaw”。光看名字，你大概能猜到这是个关于机械爪的开源项目。没错，这是一个旨在提供低成本、模块…...

编程新知 2026/5/18 8:18:35

概述

机器配置

standalone 配置

主节点

解压

配置spark-env.sh及workers

分发

启动集群

验证

执行任务

结束

相关文章：