Spark---集群搭建
Standalone集群搭建与Spark on Yarn配置
1、Standalone
Standalone集群是Spark自带的资源调度框架,支持分布式搭建,这里建议搭建Standalone节点数为3台,1台master节点,2台worker节点,这虚拟机中每台节点的内存至少给2G和2个core,这样才能保证后期Spark基于Standalone的正常运行。搭建Standalone集群的步骤如下:
1)、下载安装包,解压
登录Spark官网下载Spark,官网地址:Spark官网链接

点击“Download”找到“ Spark release archives”找到对应的Spark版本下载。这里选择Spark2.3.1版本下载。
将下载好的Spark安装包上传到Spark Master节点,解压:
![]()
2)、改名
![]()
3)、进入安装包的conf目录下,修改或者复制slaves.template文件,去掉template后缀,在新的slaves文件中添加从节点。保存。
![]()
在slaves中配置worker节点:

4)、复制$SPARK_HOME/conf/spark-env.sh.template 为spark-env.sh,修改spark-env.sh内容:
SPARK_MASTER_HOST:master的ip
SPARK_MASTER_PORT:提交任务的端口,默认是7077
SPARK_WORKER_CORES:每个worker从节点能够支配的core的个数
SPARK_WORKER_MEMORY:每个worker从节点能够支配的内存数
JAVA_HOME:java的home,这里需要jdk8

5)、同步到其他节点上
![]()
![]()
6)、启动集群
进入sbin目录下,执行当前目录下的./start-all.sh
![]()
7)、搭建客户端
将spark安装包原封不动的拷贝到一个新的节点上,然后,在新的节点上提交任务即可。
注意:
- 8080是Spark WEBUI界面的端口,7077是Spark任务提交的端口。
- 修改master的WEBUI端口:
- 修改$SPARK_HOME/conf/spark-env.sh即可【建议使用】:
![]()
- 修改start-master.sh即可。

- 也可以在Master节点上导入临时环境变量,只是作用于之后的程序,重启就无效了。
![]()
删除临时环境变量:
![]()
2、yarn
Spark 也可以基于Yarn进行任务调度,这就是所谓的Spark on Yarn,Spark基于Yarn进行任务调度只需要在Spark客户端做如下配置即可:
![]()
同时这里需要在每台NodeManager节点中将每台NodeManager的虚拟内存关闭,在每台NodeManager节点的$HADOOP_HOME/etc/hadoop/yarn-site.xml中加入如下配置:
<!-- 关闭虚拟内存检查 -->
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>
二、Spark Pi任务测试
Spark PI案例:

Standalone提交命令:
./spark-submit --master spark://mynode1:7077 --class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.3.1.jar 100
Spark on YARN提交命令:
./spark-submit --master yarn --class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.3.1.jar 100
相关文章:
Spark---集群搭建
Standalone集群搭建与Spark on Yarn配置 1、Standalone Standalone集群是Spark自带的资源调度框架,支持分布式搭建,这里建议搭建Standalone节点数为3台,1台master节点,2台worker节点,这虚拟机中每台节点的内存至少给…...
Linux上通过SSL/TLS和start tls连接到LDAP服务器
一,大致流程。 1.首先在Linux上搭建一个LDAP服务器 2.在LDAP服务器上安装CA证书,服务器证书,因为SSL/TLS,start tls都属于机密通信,需要客户端和服务器都存在一个相同的证书认证双方的身份。3.安装phpldapadmin工具&am…...
【华为OD题库-034】字符串化繁为简-java
题目 给定一个输入字符串,字符串只可能由英文字母(a ~ z、A ~ Z)和左右小括号()组成。当字符里存在小括号时,小括号是成对的,可以有一个或多个小括号对,小括号对不会嵌套,小括号对内可以包含1个或多个英文字母也可以不…...
斯坦福大学引入FlashFFTConv来优化机器学习中长序列的FFT卷积
斯坦福大学的FlashFFTConv优化了扩展序列的快速傅里叶变换(FFT)卷积。该方法引入Monarch分解,在FLOP和I/O成本之间取得平衡,提高模型质量和效率。并且优于PyTorch和FlashAttention-v2。它可以处理更长的序列,并在人工智能应用程序中打开新的可…...
信息系统项目管理师-干系人管理论文提纲
快速导航 1.信息系统项目管理师-项目整合管理 2.信息系统项目管理师-项目范围管理 3.信息系统项目管理师-项目进度管理 4.信息系统项目管理师-项目成本管理 5.信息系统项目管理师-项目质量管理 6.信息系统项目管理师-项目资源管理 7.信息系统项目管理师-项目沟通管理 8.信息系…...
Windmill:最快的自托管开源工作流引擎
我们对 Windmill 进行了基准测试,认为它是 Airflow、Prefect 甚至 Temporal 中最快的自托管通用工作流引擎。对于 Airflow,有速度快了 10 倍! 工作流引擎编排工作人员的有向无环图 (DAG) 中定义的作业,同时尊重依赖性。 主要优点…...
线性代数 - 几何原理
目录 序言向量的定义线性组合、张成空间与向量基线性变换和矩阵线性复合变换与矩阵乘法三维空间的线性变换行列式矩阵的秩和逆矩阵维度变换点乘叉乘基变换特征值和特征向量抽象向量空间 序言 欢迎阅读这篇关于线性代数的文章。在这里,我们将从一个全新的角度去探索线…...
火电厂电气部分设计
摘要 本文首先根据任务书上所给系统与线路及所有负荷的参数,分析负荷发展趋势。从负荷增长方面阐明了建站的必要性,然后通过对拟建变电站的概括以及出线方向来考虑,并通过对负荷资料的分析,安全,经济及可靠性方面考虑…...
界面组件DevExpress Reporting v23.1 - Web报表设计器功能升级
DevExpress Reporting是.NET Framework下功能完善的报表平台,它附带了易于使用的Visual Studio报表设计器和丰富的报表控件集,包括数据透视表、图表,因此您可以构建无与伦比、信息清晰的报表 界面组件DevExpress Reporting v23.1已经发布一段…...
小程序Canvas 2D问题解决,如安卓drawImage不执行、动态高度设置、高度1365(或4096)限制等
我的最新版小程序想在绘制时使用自定义字体,需要将旧版canvas升级到2d新版,发现了许多问题,下面记录一下并提供解决思路,仅供参考,欢迎提供新思路。 一、开发工具和安卓上drawImage不执行,绘制出来是空白&…...
人工智能对网络安全的影响越来越大
如果问当前IT行业最热门的话题是什么,很少有人会回答除了人工智能(AI)之外的任何话题。 在不到 12 个月的时间里,人工智能已经从一项只有 IT 专业人员才能理解的技术发展成为从小学生到作家、程序员和艺术家的每个人都使用的工具…...
JavaEE(SpringMVC)期末复习
文章目录 JavaEE期末复习一、单选题: JavaEE期末复习 一、单选题: 1.Spring的核⼼技术是( A )? A依赖注入 B.JdbcTmplate C.声明式事务 D.资源访问 Spring的核心技术包括依赖注入(Dependency Injection&am…...
微服务保护 Sentinel
1.初识Sentinel 文章目录 1.初识Sentinel1.1.雪崩问题及解决方案1.1.1.雪崩问题1.1.2.超时处理1.1.3.仓壁模式1.1.4.断路器1.1.5.限流1.1.6.总结 1.2.服务保护技术对比1.3.Sentinel介绍和安装1.3.1.初识Sentinel1.3.2.安装Sentinel 1.4.微服务整合Sentinel 2.流量控制2.1.簇点链…...
【无标题】文本超过一行隐藏,鼠标经过显示提示框
创建一个组件专门用来出来文字的 <template><div class"tooltip-wrap"><el-tooltipref"tlp":content"text"effect"dark":disabled"!tooltipFlag":placement"placement"popper-class"tooltip…...
成为独立开发者有多难
首先自我介绍:我是一名前端开发工程师,7年的前端开发经验。CSDN 九段刀客_js,vue,ReactNative-CSDN博客,80多万的访问量,1万多的粉丝。 相信80%的程序员的终极梦想都是成为一名独立开发者,不用找工作有自己的产品可以有睡后收入。…...
C++ 正则表达式使用
C 11 以后有了正则表达式,对于处理字符串还是很方便的.由于我也再学习.所以下面的内容有可能描述的不准确,这些都是我自己代码中使用的,或者demo测试的. 首先使用正则表达式先要添加头文件 #include <regex> 然后编写自己的正则表达式: 例如我想匹配字符串中表示数字…...
VSCode任务tasks.json中的问题匹配器problemMatcher的问题匹配模式ProblemPattern详解
☞ ░ 前往老猿Python博客 ░ https://blog.csdn.net/LaoYuanPython 一、简介 在 VS Code 中,tasks.json 文件中的 problemMatcher 字段用于定义如何解析任务输出中的问题(错误、警告等)。 problemMatcher有三种配置方式,具体可…...
CSS 实现文本框签名
<div class"textarea-prepend"><textarea rows"6" placeholder"请输入消息内容"></textarea></div>.textarea-prepend {position: relative;}.textarea-prepend textarea {width: 300px;}.textarea-prepend::before {ba…...
Spring 定时任务如何到达某一指定时间点后,触发任务机制
在Spring框架中,可以使用Spring Task来实现定时任务。以下是使用Spring Task触发定时任务的步骤: 添加依赖:首先,在你的项目中添加Spring Task的依赖。如果使用Maven管理项目,可以在pom.xml文件中添加以下依赖项&#…...
PDF Reader Pro 3.0.1.0(pdf阅读器)
PDF Reader Pro是一款功能强大的PDF阅读、注释、填写表单&签名、转换、OCR、合并拆分PDF页面、编辑PDF等软件。 它支持多种颜色的高亮、下划线,可以按需选择,没有空白处可以进行注释,这时候便签是你最佳的选择,不点开时自动隐…...
如何永久保存微信聊天记录:WeChatMsg技术指南与数据掌控方案
如何永久保存微信聊天记录:WeChatMsg技术指南与数据掌控方案 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we…...
TFT Overlay:3分钟快速上手的终极云顶之弈智能决策辅助工具完全指南
TFT Overlay:3分钟快速上手的终极云顶之弈智能决策辅助工具完全指南 【免费下载链接】TFT-Overlay Overlay for Teamfight Tactics 项目地址: https://gitcode.com/gh_mirrors/tf/TFT-Overlay 你是否在玩《英雄联盟:云顶之弈》时经常手忙脚乱&…...
在Windows上安装Android应用:APK-Installer让跨平台应用管理变得简单
在Windows上安装Android应用:APK-Installer让跨平台应用管理变得简单 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经想过在Windows电脑上直接运…...
从熔丝到隧道效应:手把手拆解ROM家族的技术演进史(附原理图)
从熔丝到量子隧穿:ROM存储技术的物理革命与工程智慧 在计算机体系结构的浩瀚宇宙中,存储器如同沉默的基石,承载着信息文明的每一次跃迁。当我们追溯ROM技术的发展轨迹,会发现这不仅仅是一部存储介质的进化史,更凝聚着…...
别再用串口了!用STM32F7的IrDA硬件模块,轻松实现红外遥控器升级(附完整代码)
用STM32F7的IrDA硬件打造智能红外遥控器:从配置到实战 在智能家居日益普及的今天,红外遥控器仍然是控制家电的主力军。但面对家中堆积如山的各种遥控器,你是否想过打造一个万能遥控器?本文将带你利用STM32F7系列微控制器的IrDA硬件…...
什么是DSP? ESP32 有DSP吗?
DSP 是 Digital Signal Processor 的缩写,中文全称为 “数字信号处理器”。 简单来说,DSP 是一种专门为了极快地处理数学算法而设计的微处理器。如果说 CPU(中央处理器)是一个什么都能干的“全才经理”,那么 DSP 就是一个“数学天才”或“计算专家”。 以下是关于 DSP 的…...
机器学习数据准备:从清洗到特征工程的全流程解析
1. 机器学习数据准备的核心价值在机器学习项目中,数据准备环节往往占据整个流程70%以上的时间投入。这并非偶然,而是由机器学习算法的本质特性决定的。想象你是一位建筑设计师,算法就像标准化的预制构件,而原始数据则是从不同工地…...
【VS Code Copilot Next 工作流自动化终极指南】:20年IDE专家亲授从零配置到生产级落地的7大黄金法则
更多请点击: https://intelliparadigm.com 第一章:VS Code Copilot Next 自动化工作流的核心价值与演进脉络 VS Code Copilot Next 并非简单升级,而是将 AI 编程助手从“补全建议者”重塑为“上下文感知的工作流协作者”。其核心价值在于深度…...
线性代数实战:矩阵运算在AI与工程中的应用指南
1. 线性代数实战精要:拒绝空谈的矩阵思维训练手册刚接手机器学习项目时,我对着特征矩阵发懵的日子还历历在目。当时翻遍教材只看到满页的数学符号推导,却找不到"什么时候该用特征分解"、"为什么SVD能解决推荐系统冷启动"…...
AI 时代最大的谎言:你以为在学习,其实在欠债—思维决定上限的反焦虑框架
文章目录1、写在前面:我为什么不再写"AI 焦虑"2、本文速览3、AI 焦虑的真实闭环:你不是在错过 AI3.1、焦虑的来源不是机会,是怕3.2、机会从来不属于"绝大多数人"3.3、对你的实际意义4、MIT 认知负债:所有 AI …...
