当前位置: 首页 > article >正文

Spark集群架构解析:核心组件与Standalone、YARN模式深度对比(AM,Container,Driver,Executor)

一、核心组件定义与关系拆解

1. ApplicationMaster(AM)
  • 定义:YARN 框架中的应用管理器,每个应用程序(如 Spark 作业)对应一个 AM。
  • 职责
    • 向 YARN 的 ResourceManager 申请资源(Container)。
    • 管理分配到的 Container,启动 Executor 进程。
    • 监控任务执行状态,处理失败重试。
  • 与其他组件关系:在 YARN 模式下,AM 是 Spark 与 YARN 的桥梁,不直接参与 Spark 作业逻辑(除了 yarn-cluster 模式下启动 Driver)。
2. Driver
  • 定义:Spark 应用的主控进程,是 Spark 作业的执行入口。
  • 职责
    • 创建 SparkContext,解析用户代码(如 RDD 转换)。
    • 将作业分解为 Task,调度到 Executor 执行。
    • 监控 Task 进度,收集结果,处理错误。
  • 与其他组件关系:在 Standalone 和 YARN 模式中位置不同(见下文对比),是 Spark 作业的 “大脑”。
3. Executor
  • 定义:运行 Spark 任务的工作进程,每个 Executor 负责执行多个 Task。
  • 职责
    • 维护 Task 执行的线程池,执行 Driver 分配的 Task。
    • 缓存 RDD 数据,供 Task 复用。
    • 向 Driver 汇报任务状态和结果。
  • 与其他组件关系:依赖 Container 提供的资源运行,受 Driver 调度。
4. Container
  • 定义:YARN 中的资源抽象单位,封装 CPU、内存等资源。
  • 职责:为应用程序组件(如 AM、Executor)提供运行环境
  • 与其他组件关系:AM 向 YARN 申请 Container 来启动 Executor,Driver 和 Executor 在 Container 中运行(YARN 模式下)。

在 yarn-cluster 模式下:AM、Driver、Executor 各自占用独立的 Container,且 Container 是物理隔离的资源单元(包含实际分配的内存、CPU 等资源),并非逻辑概念每个 Container 对应一个真实运行的进程容器,由 YARN 的 ResourceManager 按物理资源标准分配。

其实上面这些概念AM,Container都是在Spark on Yarn集群模式下才有的,AM,Container这些概念是Hadoop中的,Spark通过Yarn分配资源,那就一定会存在,Spark Standalone没有,因为它是不依赖于外部框架的,而是用自身提供的

二、Standalone 与 YARN 模式的架构对比

1. Standalone 模式(Spark 原生集群管理器)
  • 架构图

  • 核心关系
    • Driver:由客户端启动,直接与 Master(集群管理器)和 Worker(工作节点)交互。
    • Executor:由 Worker 启动,运行在 Worker 节点上,受 Driver 调度。
    • 无 ApplicationMaster:Standalone 是 Spark 自研的资源管理框架,不依赖 YARN,因此没有 AM 组件。
    • 资源管理:Master 负责分配 Worker 节点的资源给 Driver,Driver 直接控制 Executor 的启动。
 Standalone 模式为什么没有 AM 和 Container?
  • AM 的替代者:Standalone 模式中,Master 节点承担资源调度角色(类似 YARN 的 ResourceManager),但没有 AM 这个中间层。
  • 资源分配单位差异
    • YARN 用 Container 封装资源;Standalone 直接向 Worker 节点申请 Executor 进程(每个 Executor 对应 Worker 节点的一组 CPU / 内存)。
  • 组件运行方式
    • Driver:由客户端启动,运行在客户端或 Worker 节点(取决于--deploy-mode)。
    • Executor:由 Worker 节点直接启动,作为独立进程运行(无 Container 封装)。
Standalone 模式架构流程
Master(总调度)↓
Worker节点1↓
Driver(若deploy-mode=cluster)或Executor1↓
Worker节点2↓
Executor2、Executor3...
2. YARN 模式(Spark 运行在 YARN 集群上)
  • 架构图(以 yarn-cluster 为例)

  • 核心关系
    • ApplicationMaster:作为 YARN 与 Spark 的中间层,向 ResourceManager 申请 Container 资源,启动 Driver 和 Executor。
    • Driver

yarn-cluster 模式下由 AM 启动,运行在 Container 中;

yarn-client 模式下由客户端启动,运行在客户端机器。

  • Executor:运行在 NodeManager 管理的 Container 中,受 Driver 调度。
  • 资源管理:YARN 的 ResourceManager 统一管理集群资源,AM 作为应用代表申请资源,Driver 不直接与 ResourceManager 交互。
(1) yarn-cluster 模式:Container 是 “物理隔离的办公间”
  • Container 本质:YARN 分配的最小资源单元(内存 / CPU 等),是进程运行的物理容器(类似 Docker 容器)。
  • 组件与 Container 的映射
    • AM:单独占用 1 个 Container(由 ResourceManager 分配),负责启动 Driver 和申请 Executor 资源。
    • Driver:由 AM 在另一个 Container 中启动(属于 AM 的子任务)。
    • Executor:每个 Executor 占用 1 个 Container,由 AM 向 ResourceManager 申请后启动。
  • 类比场景
    • ResourceManager 是 “房东”,负责分配房间(Container);
    • AM 是 “租客代表”,租到第一个房间后,再替 Driver 和 Executor 租其他房间。
yarn-cluster 模式架构流程
ResourceManager(总房东)↓
AM(租客代表)[Container1]↓
Driver(项目经理)[Container2]↓
Executor1[Container3]、Executor2[Container4]...(工人)
(2) yarn-client 模式:Driver 跳出 Container 的 “例外”
  • Container 的角色
    • AM 占用 1 个 Container(在集群内),仅负责申请 Executor 的 Container。
    • 每个 Executor 占用 1 个 Container(在集群内)。
  • Driver 的特殊性
    • Driver 在客户端机器(非集群节点)直接运行,不依赖 Container(因为 YARN 无法管理客户端资源)。
    • 类比:AM 在集群内租房间给 Executor,但 Driver 在 “集群外的自家房子” 办公,只通过网络指挥集群内的 Executor。
yarn-client 模式架构流程
客户端机器(本地)↓
Driver(项目经理)[非Container]↓
ResourceManager(总房东)↓
AM(租客代表)[Container1]↓
Executor1[Container2]、Executor2[Container3]...(工人)

涉及ResourceManager,NodeManager的,从略微更高的角度,去理解以上他们之间关系,请见文章

YARN与Spark组件架构关系及交互机制:从ResourceManager到Executor的层级、依赖与通信链路解析-CSDN博客

三、两种模式下组件关系的类比理解

1. Standalone 模式:自营小团队
  • Master:团队领导,分配任务给 Worker(员工)。
  • Driver:项目经理,直接对接领导,安排具体工作(Task)给员工(Executor)。
  • Executor:员工,在自己的工位(Worker 节点)上干活,听项目经理指挥。
  • 特点:Spark 自己管资源,简单直接,但扩展性和资源隔离性较差。
2. YARN 模式:外包大公司
  • YARN ResourceManager:大公司 CEO,掌管所有资源(Container)。
  • ApplicationMaster:外包项目负责人,向 CEO 申请资源(Container),拿到资源后组建团队。
  • Driver:项目技术负责人,由外包负责人招聘(启动),负责具体技术方案和任务分配。
  • Executor:外包员工,在公司分配的工位(Container)上干活,听技术负责人指挥。
  • 特点:YARN 统一管资源,Spark 作为应用运行,适合多应用混部,资源利用率高。

四、关键差异总结表

对比维度Standalone 模式YARN 模式
资源管理器Spark 自研的 Master-Worker 架构YARN 的 ResourceManager-NodeManager 架构
ApplicationMaster无,Driver 直接与 Master 交互有,作为 Spark 应用与 YARN 的中间层
Driver 位置由客户端启动,运行在客户端或 Worker 节点yarn-client 在客户端,yarn-cluster 在集群内
Executor 运行环境直接运行在 Worker 节点上运行在 YARN 的 Container 中(资源隔离性更好)
适用场景小规模集群,Spark 单一应用场景大规模集群,多应用混部(如 Hadoop 生态)

五、一句话理清组件关系

  • Standalone:Driver(项目经理)直接找 Master(领导)要资源,分配给 Worker 上的 Executor(员工)干活。
  • YARN:AM(外包负责人)先找 YARN CEO(ResourceManager)要 Container(工位),用 Container 启动 Driver(技术负责人)和 Executor(员工),Driver 再指挥 Executor 干活。

相关文章:

Spark集群架构解析:核心组件与Standalone、YARN模式深度对比(AM,Container,Driver,Executor)

一、核心组件定义与关系拆解 1. ApplicationMaster(AM) 定义:YARN 框架中的应用管理器,每个应用程序(如 Spark 作业)对应一个 AM。职责: 向 YARN 的 ResourceManager 申请资源(Con…...

Linux Kernel调试:强大的printk(二)

前言 如果你对printk的基本用法还不熟悉,请先阅读: Linux Kernel调试:强大的printk(一) 上一篇Linux Kernel调试:强大的printk(一)我们介绍了printk的基础知识和基本用法&#xf…...

Kafka Kraft模式集群 + ssl

文章目录 启用集群资源规划准备证书创建相关文件夹配置文件启动各Kafka节点 故障转移测试spring boot集成 启用集群 配置集群时关键就是提前梳理好需要的网络资源,完成对应server.properties文件的配置。在执行前先把这些梳理好,可以方便后面的配置&…...

[crxjs]自己创建一个浏览器插件

参考官方 https://crxjs.dev/vite-plugin/getting-started/vue/create-project 按照流程操作会失败的原因 是因为跨域的问题, 在此处添加 server: {host: "localhost",port: 5173,cors: true,headers: {"Access-Control-Allow-Origin": "*",}…...

类的设计模式——单例、工厂以及建造者模式

1.单例模式 1.1 饿汉模式 单例模式:一个类只能创建一个对象,这个设计模式可以保证系统中该类只有一个实例,并提供一个访问它的全局访问点,该实例被所有程序模块共享。 饿汉模式指在程序初始化时就创建一个唯一的实例对象。适用…...

STM32之看门狗(IWDG)

一、看门狗外设的原理与应用 背景说明 随着单片机的发展,单片机在家用电器、工业自动化、生产过程控制、智能仪器仪表等领域的应用越来越广泛。然而处于同一电力系统中的各种电气设备通过电或磁的联系彼此紧密相连,相互影响,由于运行方式的…...

PyTorch实现MLP信用评分模型全流程

知识点回顾: 过拟合的判断:测试集和训练集同步打印指标模型的保存和加载 仅保存权重保存权重和模型保存全部信息checkpoint,还包含训练状态 早停策略 浙大疏锦行 import torch import torch.nn as nn import torch.optim as optim from skle…...

语音识别——文本转语音

python自带的pytts说话人的声音比较机械,edge-tts提供了更自然的语音合成效果,支持多种语音选择。 项目地址:GitHub - rany2/edge-tts: Use Microsoft Edges online text-to-speech service from Python WITHOUT needing Microsoft Edge or …...

跟着华为去变革 ——读《常变与长青》有感

《常变与长青》,是华为郭平总2024年上市的著作。走进这本书,我们能够清晰看到华为30多年的成长过程和伴随期间的变革历程:从一家设备代理商开始,起步蹒跚,砥砺前行,在闯过一个又一个磨难之后,成…...

图像分割技术的实现与比较分析

引言 图像分割是计算机视觉领域中的一项基础技术,其目标是将数字图像划分为多个图像子区域(像素的集合),以简化图像表示,便于后续分析和理解。在医学影像、遥感图像分析、自动驾驶、工业检测等众多领域,图…...

node.js配置变量

一、下载安装包 1、官网下载 大家可以在官网下载,适合自己电脑以及项目的需要的版本。 二、node.js安装 1、安装 双击下载的安装包文件,通常为 .exe 或 .msi 格式(Windows)或 .dmg 格式(Mac)。系统会…...

Ubuntu+Docker+内网穿透:保姆级教程实现安卓开发环境远程部署

文章目录 前言1. 虚拟化环境检查2. Android 模拟器部署3. Ubuntu安装Cpolar4. 配置公网地址5. 远程访问小结 6. 固定Cpolar公网地址7. 固定地址访问 前言 本文将详细介绍一种创新性的云开发架构:基于Ubuntu系统构建Android仿真容器环境,并集成安全隧道技…...

为什么需要清除浮动?清除浮动的方式有哪些?

导语: 在前端面试中,“清除浮动”几乎是每位面试官都会问到的基础题。虽然浮动已经不如 Flex 和 Grid 那么常用了,但它在许多老项目中仍然占有一席之地。理解浮动的机制、掌握清除浮动的方式,是面试中体现你前端基础扎实度的关键点。 一、面试主题概述 浮动(float)最初是…...

计算机网络学习20250526

SMTP——简单邮件传输协议 TCP 端口号:25 Alice给Bob发送邮件过程: Alice使用邮件代理程序写邮件给Bob用户代理把报文发给邮件服务器,放入报文队列中邮件服务器上SMTP客户端建立与Bob服务器上SMTP服务器的TCP连接经过初始的握手后&#xff…...

ArkUI:鸿蒙应用响应式与组件化开发指南(一)

文章目录 引言1.ArkUI核心能力概览1.1状态驱动视图1.2组件化:构建可复用UI 2.状态管理:从单一组件到全局共享2.1 状态装饰器2.2 状态传递模式对比 引言 鸿蒙生态正催生应用开发的新范式。作为面向全场景的分布式操作系统,鸿蒙的北向应用开发…...

YOLOv11改进 | Neck篇 | 双向特征金字塔网络BiFPN助力YOLOv11有效涨点

YOLOv11改进 | Neck篇 | 双向特征金字塔网络BiFPN助力YOLOv11有效涨点 引言 目标检测领域的最新进展表明,特征金字塔网络(FPN)的设计对模型性能具有决定性影响。本文详细介绍如何将**双向特征金字塔网络(BiFPN)**集成到YOLOv11的Neck部分,通过改进的多尺度特征融合机制…...

C/C++的OpenCV 进行轮廓提取

使用 C/C的OpenCV 进行轮廓提取 轮廓可以简单地描述为连接所有具有相同颜色或强度的连续点(沿着边界)的曲线。轮廓是形状分析以及对象检测和识别的有用工具。OpenCV 提供了非常方便的函数来查找和绘制轮廓。 本文将指导您完成使用 C 和 OpenCV 库从图像…...

计算机网络总结(物理层,链路层)

目录 第一章 概述 1.基本概念 2.- C/S模式,B/S模式,P2P模式 3.- LAN,WAN,MAN,PAN的划分 4.电路交换与分组交换,数据报交换和虚电路交换 第二章 物理层 1.信号编码:不归零编码,曼切斯特编码 2.几种复用技术的特…...

TIGER - 一个轻量高效的语音分离模型,支持人声伴奏分离、音频说话人分离等 支持50系显卡 本地一键整合包下载

TIGER 是一种轻量级语音分离模型,通过频段分割、多尺度及全频帧建模有效提取关键声学特征。该项目由来自清华大学主导研发,通过频率带分割、多尺度以及全频率帧建模的方式,有效地提取关键声学特征,从而实现高效的语音分离。 TIGER…...

yolov8,c++案例汇总

文章目录 引言多目标追踪案例人体姿态估计算法手势姿态估计算法目标分割算法 引言 以下案例,基于c,ncnn,yolov8既可以在windows10/11上部署, 也可以在安卓端部署, 也可以在嵌入式端部署, 服务器端可支持部署封装为DLL,支持c/c#/java端调用 多目标追踪案例 基于yolov8, ncnn,…...

无人机降落伞设计要点难点及原理!

一、设计要点 1. 伞体结构与折叠方式 伞体需采用轻量化且高强度的材料(如抗撕裂尼龙或芳纶纤维),并通过多重折叠设计(如三重折叠缝合)减少展开时的阻力,同时增强局部承力区域的强度。 伞衣的几何参数&am…...

20250526给荣品PRO-RK3566的Android13单独编译boot.img

./build.sh init ./build.sh -K ./build.sh kernel 20250526给荣品PRO-RK3566的Android13单独编译boot.img 2025/5/26 15:25 缘起:需要给荣品PRO-RK3566的Android13单独编译内核,但是不想编译整个系统。于是: 如果特调试某些特别的改动/文件…...

vue3项目动态路由的相关配置踩坑记录

1.路由文件中引入store的报错解决 import { useUserStore } from /stores/user // 错误:此时 Pinia 未初始化const store useUserStore() // 报错 解决方案: import pinia,{ useUserStore } from /stores/user 或者在路由前置守卫中调用useUserSto…...

git子模块--命令--列表版

Git子模块指令查询手册 一、基本操作指令 添加子模块 git submodule add <仓库地址> [路径] 添加子模块并生成.gitmodules。 克隆含子模块项目 git clone --recursive <主仓库地址> 克隆主仓库及所有子模块。 初始化子模块 git submodule init 将.gitmodules…...

C++(4)

四、模板与容器 1. 模板 1.1 函数模板 #include <iostream> using namespace std;// 函数模板声明 template<typename T> // 也可使用 class T add(T a, T b) {return a b; }int main() {string a "hello";string b "world";cout <&…...

构建版本没mac上传APP方法

在苹果开发者的app store connect上架Ios应用的时候&#xff0c;发现需要使用xode等软件来上传iOS的APP。 但是不管是xcode也好&#xff0c;transporter也好&#xff0c;还是命令行工具也好&#xff0c;都必须安装在mac电脑才能使用&#xff0c;。 假如没有mac电脑&#xff0…...

如何解决大模型返回的JSON数据前后加上```的情况

环境说明 springboot 应用使用dashscope-sdk-java对接阿里百练 deepseek v3模型 问题表现 已经指定了输出json格式&#xff0c;但指令不明确&#xff0c;输出JSON格式的写法如下 注&#xff1a;提示词一开始是能正常功能的&#xff0c;但过了几天就出现了异常&#xff0c;原…...

本地处理 + GPU 加速 模糊视频秒变 4K/8K 修复视频老旧素材

各位数码小达人们&#xff01;你们知道吗&#xff0c;今天我要给大家介绍一款超厉害的工具——Video2X。它就像是一个神奇的魔法棒&#xff0c;能把低分辨率的视频、GIF和图像变成高清甚至4K的&#xff0c;而且画质细节一点都不会损失&#xff01; 先来说说它的核心功能。第一…...

服务器异常数据问题解决 工具(tcpdump+wireshark+iptables)

问题&#xff1a; 某天一客户反馈&#xff0c;后台页面上显示的设备数据异常增长。现场实际只有2w台设备安装了助手(客户端)&#xff0c;但是后台显示有16w的助手设备&#xff0c;并且还在持续且快速的增长。这些数据会被加载到缓存&#xff0c;时间久了&#xff0c;服务端程序…...

综合实现案例 LVS keepalived mysql 等

基于企业级高可用架构的 Linux 案例&#xff0c;整合 Nginx、HTTPS、LVS、Keepalived、MySQL 等服务&#xff0c;实现 Web 服务的负载均衡、高可用性及数据持久化。 案例场景&#xff1a;高可用 Web服务架构 目标 构建高可用 Web 集群&#xff0c;支持负载均衡和故障自动切换…...