当前位置：首页 > news >正文

总结：Yarn资源管理

news 2026/3/30 10:27:12

一、介绍

本文梳理下Yarn的资源分配计算逻辑。

二、配置 - 资源限制

1、配置NodeManager可分配的资源池的总量

<property><name>yarn.nodemanager.resource.memory-mb</name><value>4096</value>
</property>

作用对象：节点管理器（NodeManager）。
含义：这个配置项定义了每个节点管理器可以使用的最大内存量（以 MB 为单位）。
值：4096 表示每个节点管理器可以使用的最大内存量为 4096 MB（即 4 GB）。
作用：这个配置项限制了节点管理器可以分配给容器的总内存量。换句话说，它决定了节点管理器所在机器上所有容器可以使用的内存总量。

同理：

<property><name>yarn.nodemanager.resource.cpu-vcores</name><value>4</value>
</property>

2、配置容器可配分配的最小和最大的资源量

<property><name>yarn.scheduler.minimum-allocation-mb</name><value>1024</value>
</property>

作用对象：资源管理器（ResourceManager）。
含义：这个配置项定义了资源管理器在分配内存时，每个容器（Container）的最小内存分配量（以 MB 为单位）。
值：1024 表示每个容器至少分配 1024 MB（即 1 GB）的内存。
作用：这个配置项确保了每个容器至少有 1 GB 的内存可用。它决定了资源管理器在分配内存时，不能分配小于这个值的内存给容器。

同理：

<property><name>yarn.scheduler.maximum-allocation-mb</name><value>6144</value>
</property>
<property><name>yarn.scheduler.minimum-allocation-vcores</name><value>1</value>
</property>
<property><name>yarn.scheduler.maximum-allocation-vcores</name><value>16</value>
</property>

注意：我们尽量设置yarn.scheduler.maximum-allocation-mb小于yarn.nodemanager.resource.memory-mb。

以确保节点管理器有足够的内存资源来满足单个容器的最大内存请求。

三、Flink任务资源分配与Yarn资源限制的关系

如果Flink任务以per job cluster方式在yarn上运行，那么Flink任务分配的资源和Yarn上面配置的资源限制是什么关系？举个例子说明

在 Flink 以 per-job cluster 方式在 YARN 上运行时，Flink 任务的资源分配和 YARN 上的资源限制之间存在密切的关系。具体来说，Flink 任务的资源需求会受到 YARN 配置的资源限制的影响。下面通过一个具体的例子来说明这种关系。

示例场景

假设你有一个 YARN 集群，配置如下：

<!-- YARN 配置 -->
<property><name>yarn.nodemanager.resource.memory-mb</name><value>8192</value>
</property>
<property><name>yarn.nodemanager.resource.cpu-vcores</name><value>8</value>
</property><property><name>yarn.scheduler.minimum-allocation-mb</name><value>1024</value>
</property>
<property><name>yarn.scheduler.maximum-allocation-mb</name><value>6144</value>
</property><property><name>yarn.scheduler.minimum-allocation-vcores</name><value>1</value>
</property>
<property><name>yarn.scheduler.maximum-allocation-vcores</name><value>4</value>
</property>

Flink 任务配置

假设你提交一个 Flink 任务，配置如下：

flink run -m yarn-cluster -yn 2 -ytm 3072 -yjm 1024 -ys 2 -c com.example.MyFlinkJob /path/to/my-flink-job.jar

-yn 2：指定 YARN 集群中启动 2 个 TaskManager。
-ytm 3072：每个 TaskManager 分配 3072 MB 内存。
-yjm 1024：JobManager 分配 1024 MB 内存。
-ys 2：每个 TaskManager 分配 2 个 CPU 核。

资源分配关系

1. 内存分配

YARN 配置：
- yarn.nodemanager.resource.memory-mb：每个节点管理器最大可用内存为 8192 MB（8 GB）。
- yarn.scheduler.minimum-allocation-mb：每个容器最小分配内存为 1024 MB（1 GB）。
- yarn.scheduler.maximum-allocation-mb：每个容器最大分配内存为 6144 MB（6 GB）。
Flink 任务配置：
- JobManager 内存：1024 MB。
- 每个 TaskManager 内存：3072 MB。
- 总共需要的内存：1024 MB (JobManager) + 2 * 3072 MB (TaskManagers) = 7168 MB。
关系：
- Flink 任务总共需要 7168 MB 内存，这小于 YARN 配置的 yarn.nodemanager.resource.memory-mb（8192 MB），因此单个节点管理器可以满足 Flink 任务的内存需求。
- 每个 TaskManager 请求的内存为 3072 MB，这小于 YARN 的

总结：Yarn资源管理

一、介绍本文梳理下Yarn的资源分配计算逻辑。二、配置 - 资源限制 1、配置NodeManager可分配的资源池的总量 <property><name>yarn.nodemanager.resource.memory-mb</name><value>4096</value> </property> 作用对象：节点管理器（No…...

编程日记 2024/11/27 19:54:22

Python学习34天

import random class Game: peo0 rob0 # # def __init__(self,peo,rob): # self.peopeo # self.robrob def Play(self): """ 石头剪刀布游戏，0代表石头，1代见到，2代表石头 …...

编程日记 2024/11/27 19:52:19

深入浅出 WebSocket：构建实时数据大屏的高级实践

简介请参考下方，学习入门操作基于 Flask 和 Socket.IO 的 WebSocket 实时数据更新实现在当今数字化时代，实时性是衡量互联网应用的重要指标之一。无论是股票交易、在线游戏，还是实时监控大屏，WebSocket 已成为实现高效、双向…...

编程日记 2024/11/27 19:46:12

三开关VUE组件

一、使用效果 <template><QqThreeSwitch v-model"value" /><!-- <SqThreeSwitch v-model"value" :options"[test1, test2, test3]"><template #left-action><div style"display: flex"><IconMoon…...

编程日记 2024/11/27 19:44:09

SpringCloud+SpringCloudAlibaba学习笔记

SpringCloud 服务注册中心 eureka ap 高可用分布式容错 <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-netflix-eureka-server</artifactId> </dependency> <dependency><groupId…...

编程日记 2024/11/27 19:40:05

牛客小白月赛105（A~E）

文章目录 A lz的吃饭问题思路code B lz的数字问题思路code C lz的蛋挞问题思路code D lz的染色问题思路code E lz的括号问题思路code 总结牛客小白月赛105 A lz的吃饭问题思路签到题，比较大小即可 code void solve(){int a,b,c,d;cin >> a >> b…...

编程日记 2024/11/27 19:39:04

OSPF协议整理

OSPF（Open Shortest Path First）即开放式最短路径优先协议，是一种广泛应用于大型网络中的链路状态路由协议。 OSPF 的基本概念 OSPF 是基于链路状态算法的内部网关协议（IGP），用于在一个自治系统&#xff…...

编程日记 2024/11/27 19:38:03

Java中的多线程

文章目录 Java中的多线程一、引言二、多线程的创建和启动1、继承Thread类2、实现Runnable接口三、线程的常用方法1、currentThread()和getName()2、sleep()和yield()3、join() 四、线程优先级五、使用示例六、总结 Java中的多线程一、引言在Java中，多线程编程是…...

编程日记 2024/11/27 19:35:00

什么是聚簇索引、非聚簇索引、回表查询

其实聚集索引也叫聚簇索引，二级索引也叫非聚簇索引，大家不要认为这是不同的两个知识点。定义先看一下数据库的索引介绍。聚簇索引 1. 如果存在主键（一般都存在），主键索引就是聚簇索引。 2. 如果不存在，…...

编程日记 2024/11/27 19:31:57

探索 Spring 框架核心组件：构建强大 Java 应用的基石

Spring框架作为Java企业级开发的首选框架之一，其强大的功能和灵活的架构深受开发者喜爱。Spring框架的核心组件共同构建了一个高效、可扩展的应用程序开发平台。本文将深入探讨Spring框架的核心组件，揭示它们如何在Spring框架中发挥关键作用。一、Bean…...

编程日记 2024/11/27 19:27:54

Android 13 Aosp 默认允许应用动态权限

图库 frameworks/base/services/core/java/com/android/server/pm/permission/DefaultPermissionGrantPolicy.java 修改 public void grantDefaultPermissions(int userId) {DelayingPackageManagerCache pm new DelayingPackageManagerCache();grantPermissionsToSysCompon…...

编程日记 2024/11/27 19:26:53

【C++知识总结1】c++第一篇，简单了解一下命名空间是什么

一、C的由来 C语言是一种结构化和模块化的编程语言，它对于处理较小规模的程序非常适用。然而，当面临需要高度抽象和建模的复杂问题，以及规模较大的程序时，C语言就显得不那么合适了。为了应对这种挑战，并在解决软件危机…...

编程日记 2024/11/27 19:25:52

从0开始深度学习（32）——循环神经网络的从零开始实现

本章将从零开始，基于循环神经网络实现字符级语言模型（不是单词级） 首先我们把从0开始深度学习（30）——语言模型和数据集中的load_corpus_time_machine()函数进行引用，用于导入数据： train_iter…...

编程日记 2024/11/27 19:22:49

GitLab使用操作v1.0

1.前置条件 Gitlab 项目地址：http://******/req Gitlab账户信息：例如 001/******自己的分支名称：例如 001-master（注：master只有项目创建者有权限更新，我们只能更新自己分支，然后创建合并请求&…...

编程日记 2024/11/27 19:20:47

cuda conda yolov11 环境搭建

优雅的 yolo v11 标注工具 AutoLabel Conda环境直接识别训练 nvidia-smi 检查CUDA版本下载nvidia cudnn对应的版本将cuDNN压缩包内对应的文件复制到本地bin、include、lib的文件夹中 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6 miniConda快速开始-安装执行…...

编程日记 2024/11/27 19:17:45

解决SpringBoot连接Websocket报：请求路径 404 No static resource websocket.

问题发现最近在工作中用到了WebSocket进行前后端的消息通信，后端代码编写完后，测试一下是否连接成功，发现报No static resource websocket.，看这个错貌似将接口变成了静态资源来访问了，第一时间觉得是端点没有注册成…...

编程日记 2024/11/27 19:09:38

element-plus的组件数据配置化封装 - table

目录一、封装的table、table-column组件以及相关ts类型的定义 1、ATable组件的封装 - index.ts 2、ATableColumn组件的封装 - ATableColumn.ts 3、ATable、ATableColumn类型 - interface.ts 二、ATable、ATableColumn组件的使用三、相关属性、方法的使用以及相关说明 1. C…...

编程日记 2024/11/27 19:07:36

【二维动态规划：交错字符串】

介绍编程语言：Java 本篇介绍一道比较经典的二维动态规划题。交错字符串主要说明几点： 为什么双指针解不了？为什么是二维动态规划？根据题意分析处转移方程。严格位置依赖和空间压缩优化。题目介绍题意有点抽象&#xff0c…...

编程日记 2024/11/27 19:06:35

goframe开发一个企业网站 MongoDB 完整工具包18

1. MongoDB 工具包完整实现 (mongodb.go) package mongodbimport ("context""fmt""time""github.com/gogf/gf/v2/frame/g""go.mongodb.org/mongo-driver/mongo""go.mongodb.org/mongo-driver/mongo/options" )va…...

编程日记 2024/11/27 19:03:32

在vue中，根据后端接口返回的文件流实现word文件弹窗预览

需求弹窗预览word文件，因浏览器无法直接根据blob路径直接预览word文件，所以需要利用插件实现。解决方案利用docx-preview实现word文件弹窗预览，以node版本16.21.3和docx-preview版本0.1.8为例具体实现步骤 1、安装docx-preview插件 …...

编程日记 2024/11/27 19:00:29

从51到STM32：手把手教你用STM32CubeMX和PWM驱动智能小车电机（附代码避坑）

从51到STM32：智能小车电机控制的进阶实战指南十年前用51单片机做智能小车时，PWM配置需要手动计算定时器重装载值，而今天在STM32CubeMX里勾选几下就能生成精准的PWM信号——这就像从手动挡升级到了自动驾驶。作为过来人，我完整记…...

编程新知 2026/3/30 9:39:53

全志T3核心板DDR初始化失败：从ZQ校准误导到VREF电压偏差的排查实录

1. 问题现象与初步排查那天早上刚到实验室，测试组的同事就急匆匆跑过来："哥，又有三台设备启动不了，uboot都没跑起来！"我接过设备一看，果然又是熟悉的ZQ校准错误提示，这已经是本周第五…...

编程新知 2026/3/30 8:13:21

AI系统-20AI芯片ISP视觉系统介绍

人有五感：眼睛、耳朵、鼻子、舌头和皮肤。这些器官中的专门细胞和组织会接收原始刺激，并将其转化为神经系统可以使用的信号。神经将信号传递到大脑，大脑将其解释为影像（视觉）、声音（听觉）、气…...

编程新知 2026/3/30 7:57:10

如何分析竞争对手的seo关键词

<h2>如何分析竞争对手的SEO关键词</h2> <p>在当今竞争激烈的互联网市场中，了解和分析竞争对手的SEO关键词是提升自己网站排名的关键。SEO关键词分析不仅可以帮助你发现市场上的机会，还能让你更好地了解竞争对手的策略，从而…...

编程新知 2026/3/30 7:41:06

OpenClaw压力测试：nanobot持续运行72小时稳定性

OpenClaw压力测试：nanobot持续运行72小时稳定性 1. 测试背景与目标最近在本地部署了基于OpenClaw的nanobot项目，这是一个超轻量级的自动化助手框架。它内置了vllm部署的Qwen3-4B-Instruct-2507模型，通过chainlit提供推理界面。在实际使用中…...

编程新知 2026/3/30 6:58:55

Wan2.2-I2V-A14B GPU算力优化：显存碎片整理与缓存复用机制解析

Wan2.2-I2V-A14B GPU算力优化：显存碎片整理与缓存复用机制解析 1. 引言在视频生成领域，Wan2.2-I2V-A14B模型凭借其出色的生成质量和稳定性，已成为众多企业和开发者的首选。然而，随着视频分辨率和时长的提升，显存资源…...

编程新知 2026/3/30 6:52:54

实测分享：用Miniconda-Python3.10镜像快速创建独立开发环境

实测分享：用Miniconda-Python3.10镜像快速创建独立开发环境 1. 为什么需要独立Python环境在日常开发中，我们经常会遇到这样的困扰：不同项目依赖的Python包版本冲突，导致项目无法正常运行。比如项目A需要TensorFlow 2.4&#xf…...

编程新知 2026/3/30 6:44:53

STM32一键下载电路设计与CH340应用

STM32一键下载电路设计与实现1. 项目概述1.1 功能需求STM32系列微控制器在开发过程中，通常需要通过串口进行程序下载。传统下载方式需要手动操作BOOT0和RESET引脚，过程繁琐且容易出错。本项目设计了一种基于CH340芯片的自动下载电路，通过软件…...

编程新知 2026/3/30 6:28:51

圣女司幼幽-造相Z-Turbo多模态生成：从文本到视频脚本的连贯创作

圣女司幼幽-造相Z-Turbo多模态生成：从文本到视频脚本的连贯创作最近在尝试一些新的内容创作工具，发现了一个挺有意思的现象：很多工具要么只能做图，要么只能写文案，想把它们串起来做个完整的视频，中间总得…...

编程新知 2026/3/30 6:24:51

nli-distilroberta-base多场景：科研论文摘要与结论段落逻辑支撑关系分析

nli-distilroberta-base多场景：科研论文摘要与结论段落逻辑支撑关系分析 1. 项目概述 nli-distilroberta-base是基于DistilRoBERTa模型的自然语言推理(NLI)Web服务，专门用于分析两个句子之间的逻辑关系。这个轻量级模型在学术写作领域具有独特价值&…...

编程新知 2026/3/30 6:06:38