Spark---基于Standalone模式提交任务
Standalone模式两种提交任务方式
一、Standalone-client提交任务方式
1、提交命令
./spark-submit --master spark://mynode1:7077
--class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.3.1.jar 100
或者
./spark-submit --master spark://mynode1:7077
--deploy-mode client
--class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.3.1.jar 100
2、执行原理图解

1)、执行流程
1、client模式提交任务后,会在客户端启动Driver进程。
2、Driver会向Master申请启动Application启动的资源
3、Master收到请求之后会在对应的Worker节点上启动Executor
4、Executor启动之后,会注册给Driver端,Driver掌握一批计算资源
5、Driver端将task发送到worker端执行。worker将task执行结果返回到Driver端。
2)、总结
client模式适用于测试调试程序。Driver进程是在客户端启动的,这里的客户端就是指提交应用程序的当前节点。在Driver端可以看到task执行的情况。生产环境下不能使用client模式,是因为:假设要提交100个application到集群运行,Driver每次都会在client端启动,那么就会导致客户端100次网卡流量暴增的问题。client模式适用于程序测试,不适用于生产环境,在客户端可以看到task的执行和结果
二、Standalone-cluster提交任务方式
1、提交命令
./spark-submit --master spark://mynode1:7077
--deploy-mode cluster
--class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.3.1.jar 100
2、执行原理图解

1)、执行流程
1、cluster模式提交应用程序后,会向Master请求启动Driver
2、Master接受请求,随机在集群一台节点启动Driver进程
3、Driver启动后为当前的应用程序申请资源
4、Driver端发送task到worker节点上执行
5、worker将执行情况和执行结果返回给Driver端
2)、总结
Driver进程是在集群某一台Worker上启动的,在客户端是无法查看task的执行情况的。假设要提交100个application到集群运行,每次Driver会随机在集群中某一台Worker上启动,那么这100次网卡流量暴增的问题就散布在集群上。
- 总结Standalone两种方式提交任务,Driver与集群的通信包括:
1. Driver负责应用程序资源的申请
2. 任务的分发。
3. 结果的回收。
4. 监控task执行情况。
相关文章:
Spark---基于Standalone模式提交任务
Standalone模式两种提交任务方式 一、Standalone-client提交任务方式 1、提交命令 ./spark-submit --master spark://mynode1:7077 --class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.3.1.jar 100 或者 ./spark-submit --master spark…...
webrtc的RTCPeerConnection使用
背景: 平时我们很少会需要使用到点对点单独的通讯,即p2p,一般都是点对服务端通讯,但p2p也有自己的好处,即通讯不经过服务端,从服务端角度这个省了带宽和压力,从客户端角度,通讯是安全,且快速的,当然有些情况下可能速度并不一定快。那么如何实现p2p呢? 解决办法: …...
【视觉SLAM十四讲学习笔记】第三讲——Eigen库
专栏系列文章如下: 【视觉SLAM十四讲学习笔记】第一讲——SLAM介绍 【视觉SLAM十四讲学习笔记】第二讲——初识SLAM 【视觉SLAM十四讲学习笔记】第三讲——旋转矩阵 本章将介绍视觉SLAM的基本问题之一:如何描述刚体在三维空间中的运动? Eigen…...
Ubuntu开机显示recovering journal,进入emergency mode
在一次正常的shutdown -r now之后,服务器启动不起来了,登录界面显示recovering journal,主要报错信息如下所示: /dev/sda2:recovering journal /dev/sda2:Clearn... You are in emergency mode. After logging in, type journalc…...
C++_String增删查改模拟实现
C_String增删查改模拟实现 前言一、string默认构造、析构函数、拷贝构造、赋值重载1.1 默认构造1.2 析构函数1.3 拷贝构造1.4 赋值重载 二、迭代器和范围for三、元素相关:operator[ ]四、容量相关:size、resize、capacity、reserve4.1 size、capacity4.2…...
LeeCode前端算法基础100题(2)- 最多水的容器
一、问题详情: 给定一个长度为 n 的整数数组 height 。有 n 条垂线,第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 说明:…...
排序算法--归并排序
实现逻辑 ① 将序列每相邻两个数字进行归并操作,形成floor(n/2)个序列,排序后每个序列包含两个元素 ② 将上述序列再次归并,形成floor(n/4)个序列,每个序列包含四个元素 ③ 重复步骤②,直到所有元素排序完毕 void pri…...
【LeetCode:1410. HTML 实体解析器 | 模拟+哈希表+字符串+库函数】
🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…...
基于SSM的公司仓库管理系统(有报告)。Javaee项目
演示视频: 基于SSM的公司仓库管理系统(有报告)。Javaee项目 项目介绍: 采用M(model)V(view)C(controller)三层体系结构,通过Spring SpringMvc …...
spark数据倾斜的解决思路
数据倾斜是:多个分区中,某个分区的数据比其他分区的数据多的多 数据倾斜导致的问题: 导致某个spark任务耗时较长,导致整个任务耗时增加,甚至出现OOM运行速度慢:主要发生在shuffle阶段,同样的k…...
Python武器库开发-前端篇之html概述(二十八)
前端篇之html概述(二十八) html概述 HTML5是构建Web内容的一种语言描述方式。HTML5是互联网的下一代标准,是构建以及呈现互联网内容的一种语言方式.被认为是互联网的核心技术之一。HTML产生于1990年,1997年HTML4成为互联网标准,…...
安防视频EasyCVR平台太阳能供电+4G摄像头视频监控方案的建设
在工地、光伏、风电站、水库河道等场景中,以及一些偏远地区的项目现场,会存在无网无电情况,大大制约了视频监控系统建设的效率及可行性。在这种场景中,我们也可以通过太阳能供电4G监控摄像机的方案,满足偏远地区无网无…...
12.位运算的性质(异或的性质)
文章目录 异或的性质求异或和问题[421. 数组中两个数的最大异或值](https://leetcode.cn/problems/maximum-xor-of-two-numbers-in-an-array/)[2935. 找出强数对的最大异或值 II](https://leetcode.cn/problems/maximum-strong-pair-xor-ii/) 异或前缀和问题(最..回…...
国标直流充电枪9孔分别啥意思?
DC:直流电源正 DC-:直流电源负 PE:接地(搭铁)S:通讯CAN-H S-:通讯CAN-L CC1:充电连接确认 CC2:充电连接确认 A:12V A-:12V- 以上就是国标直流充电…...
关于 Google AMP 和 SEO
Google 于 2015 年首次推出 AMP,即加速移动页面。借助开源 AMP 框架,网页设计师可以制作快速加载的移动网页。该框架的创建是为了应对使用移动设备访问互联网的个人数量的增加。从那时起,谷歌一直在推动使用 AMP 来增强移动设备上的 SEO 和用…...
【SpringMVC】 对请求的不同响应
前言 本文学习如何运用不同的注解来返回不同的响应. 1.返回静态页面Controller 返回index.html页面 Controller 和 RestController的区别 controller 只有加上这个注解,Spring才会帮我们管理这个代码.后续我们访问时才能访问到. RestController 等同于 Controller ResponseBo…...
SQL进阶学习
1.[NISACTF 2022]join-us sql报错注入和联合注入 过滤: as IF rand() LEFT by updatesubstring handler union floor benchmark COLUMN UPDATE & sys.schema_auto_increment_columns && 11 database case AND right CAST FLOOR left updatexml DATABA…...
邦芒解析:做好职场规划防止跳槽失败
为了防止跳槽进入不适合自己的工作环境,你可以采取以下措施: 1、做好调研:在决定跳槽之前,尽可能了解新公司的情况。这包括公司的文化、工作氛围、发展前景以及团队成员之间的关系等。通过搜索公司网站、阅读员工评价以及与公司内…...
基于springboot实现实习管理系统的设计与实现项目【项目源码+论文说明】计算机毕业设计
基于sprinmgboot实现实习管理系统的设计与实现演示 摘要 随着信息化时代的到来,管理系统都趋向于智能化、系统化,实习管理也不例外,但目前国内仍都使用人工管理,市场规模越来越大,同时信息量也越来越庞大,…...
【华为OD题库-031】比赛的冠亚季军-java
题目 有N(3<N<10000)个运动员,他们的id为0到N-1,他们的实力由一组整数表示。他们之间进行比赛,需要决出冠亚军。比赛的规则是0号和1号比赛,2号和3号比赛,以此类推,每一轮,相邻的运动员进行比赛&#…...
Parlant:构建可控AI对话智能体的上下文工程与动态匹配框架
1. 项目概述:为什么我们需要一个对话控制层?如果你正在构建面向真实客户的AI智能体,无论是客服、销售还是顾问,你大概率已经踩过这两个坑:要么是系统提示词(System Prompt)越来越长,…...
Dialop:基于状态机的前端对话式应用开发框架实战指南
1. 项目概述:一个被低估的对话式应用开发框架最近在折腾一个需要集成复杂对话逻辑的Web应用,从简单的客服机器人到多轮交互的数据收集工具,市面上能找到的框架要么太重,要么太轻,要么就是文档写得云里雾里。就在我准备…...
VSCode实时协作权限失控危机(2026 Beta用户实测:83%团队遭遇越权编辑),这份ACL策略清单请立刻保存
更多请点击: https://intelliparadigm.com 第一章:VSCode 2026实时协作权限失控的真相与影响 VSCode 2026 引入的 Live Share v4.2 协作引擎在默认配置下启用了隐式跨会话资源继承机制,导致用户在加入他人会话时,其本地工作区 .…...
C++编写MCP网关必须规避的9个LLVM ThinLTO链接时错误,否则静态库合并后symbol重排将导致L1d缓存命中率暴跌41.7%
更多请点击: https://intelliparadigm.com 第一章:C编写高吞吐量MCP网关的核心设计原则 构建面向现代微服务通信协议(MCP)的高性能网关,需在C层面直面并发模型、内存生命周期与协议栈优化三重挑战。核心并非堆砌异步I…...
如何让Windows任务栏变透明:TranslucentTB完整配置指南
如何让Windows任务栏变透明:TranslucentTB完整配置指南 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB 还在为Windows单调的任…...
AI提示词库:结构化规则提升AI编程助手效率与代码质量
1. 项目概述:一个为开发者量身打造的AI提示词库如果你和我一样,每天都在和Cursor、GitHub Copilot、Windsurf这些AI编程助手打交道,那你肯定也经历过这样的时刻:面对一个新项目,或者一个不熟悉的框架,你希望…...
超详细 Kubectl 完整命令手册(生产级、全分类、带参数解释+实操示例)
超详细 Kubectl 完整命令手册 (生产级、全分类、带参数解释 实操示例) 一、基础语法 & 全局通用参数 1. 标准语法 kubectl 【子命令】【资源类型】【资源名称】【可选参数】2. 全局必用通用参数参数作用-n, --namespace指定命名空间-A, --all-names…...
OOM Killer 选中你的进程只用了 0.3 毫秒——追踪 oom_badness() 的打分公式和 5 个可调旋钮
一台 64GB 内存的服务器,跑着你的 Java 应用、Redis、MySQL、Nginx。某天凌晨 3:47,java 进程消失了。dmesg 里一行冰冷的记录: [14523.413289] Out of memory: Killed process 3742 (java) total-vm:8234512kB, anon-rss:4182736kB, file-rss:0kB, shmem-rss:0kB, UID:100…...
ncmdump终极指南:快速免费解密网易云NCM音乐格式
ncmdump终极指南:快速免费解密网易云NCM音乐格式 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经在网易云音乐下载了喜欢的歌曲,却发现只能在特定平台播放?当你尝试在其他设备或播放器上…...
S32K344 Flash Driver实战:手把手教你用C40_Ip库实现任意字节写入与扇区解锁
S32K344 Flash驱动深度实战:突破C40_Ip库8字节对齐限制的工程解决方案 从真实案例看Flash驱动的工程挑战 去年在为某新能源车厂开发OTA升级功能时,我们团队遇到了一个典型的嵌入式开发困境:S32K344微控制器的官方Flash驱动库C40_Ip强制要求所…...
