Kafka 重平衡
Kafka 重平衡
- 协调者
- Rebalance
- Rebalance 条件
- Rebalance 避免
Rebalance :
- 让单 Group 下所有的 Consumer 怎么消费订阅主题的所有分区
- Rebalance 时 , 所有 Consumer 要共同参与 (无法消费),在协调者 (Coordinator) 协调下,完成订阅主题分区的分配
协调者
协调者 (Coordinator) :
- 给 Group 执行 Rebalance 时,提供位移管理和组成员管理
- Consumer 提交位移 , 就是向 Coordinator 所在的 Broker 提交位移
- 当 Consumer 启动时,会向 Coordinator 所在的 Broker 发送各种请求,由 Coordinator 负责执行消费者组的注册、成员管理记录
所有 Broker 启动时,会创建 Coordinator
- 所有 Broker 都有各自的 Coordinator 组件
- 在
__consumer_offsets能找 Group 的 Coordinator 在那个 Broker
某个 Group 确定 Coordinator 所在的 Broker 的步骤 :
- 找位移主题的哪个分区保存该 Group 数据:
partitionId = Math.abs(groupId.hashCode() % offsetsTopicPartitionCount) - 找该分区 Leader 副本的 Broker,该 Broker 为 Coordinator
例子 : 计算该 Group 的 Coordinator
- 当 Group 的
group.id设置为test-group,则 hashCode 值 = 627841412 __consumer_offsets的分区数 (50 个分区)- 将哈希值对分区数进行取模 , 求绝对值计算 :
abs(627841412 % 50) = 12 - 得出位移主题的分区 12 负责保存该 Group 的数据
- 只要找出位移主题分区 12 的 Leader 副本在哪个 Broker 。该 Broker就是 Coordinator
Java Consumer API,能自动发现并连接正确的 Coordinator,能解决定位问题 :
- 当 Consumer Group 出现问题,排查 Broker 端日志时,只要根据该算法就能准确定位 Coordinator 对应的 Broker
Rebalance
Rebalance 弊端 :
- Rebalance 影响 Consumer 端 TPS。Rebalance 时 , Consumer 都搁置
- 当 Group 下成员很多 ,Rebalance 慢
- Rebalance 效率低
例子 : 一个 Group 下有 10 个成员,每个成员平均消费 5 个分区
- 当一个成员退出,就要进行 Rebalance,把该成员之前负责的 5 个分区给其他成员
- 好的做法 : 维持当前 9 个成员消费分区的方案不变,将 5 个分区随机分配给这 9 个成员,能最大限度减少 Rebalance 对剩余 Consumer 的影响
- 默认情况,每次 Rebalance 时,不会考虑之前的分配方案
因此,Kafka-0.11.0.0 推出 StickyAssignor (有粘性的分区分配策略) :
- 每次 Rebalance 时,会尽可能保留之前的分配方案,实现分区分配的最小变动
- 该策略有 bug
Rebalance 条件
Rebalance 发生条件 :
- 组成员数量发生变化
- 订阅主题数量发生变化
- 订阅主题的分区数发生变化
Coordinator 误认为某个 Consumer 已挂要退组
- 当 Group 进行 Rebalance 后,每个 Consumer 都会定期向 Coordinator 发送心跳请求,表明它还活着
- 当某个 Consumer 没有及时发送心跳请求,Coordinator 就认为该 Consumer 挂了,就从 Group 中移除,并进行 Rebalance
Consumer 存活性的时间间隔 : session.timeout.ms ( 默认值是 10 秒)
- Coordinator 在 10 秒内没收到 Group 下某 Consumer 实例的心跳,就认为该 Consumer 挂了
session.timout.ms决定 Consumer 存活性的时间间隔
控制发送心跳请求频率 : heartbeat.interval.ms
- 该值越小,Consumer 发送心跳请求的频率越高
- 频繁发送心跳请求会额外消耗带宽资源,好处 : 能更快得知是否 Rebalance
- Coordinator 通知各个 Consumer 进行 Rebalance,是将
REBALANCE_NEEDED封装到心跳请求中
控制 Consumer 实际消费能力 : max.poll.interval.ms
- 限定 Consumer 两次调用 poll 方法的最大时间间隔 (默认值是 5 分钟)
- Consumer 在 5 分钟之内无法消费完 poll 的消息, Consumer 会主动发起离开组请求,Coordinator 就会 Rebalance
Rebalance 避免
Rebalance 避免 :
- Rebalance 因未能及时发送心跳,导致 Consumer 被踢出 Group 而引发
- Rebalance 由 Consumer 消费时间过长导致
- Consumer 端的 GC 频繁 , 排除 GC 停顿
发送心跳配置 :
- 设置
session.timeout.ms = 6s: 让 Coordinator 能更快定位已挂掉的 Consumer - 设置
heartbeat.interval.ms = 2s - 保证能发送至少 3 轮的心跳请求,即
session.timeout.ms >= 3 * heartbeat.interval.ms
Consumer 消费时间过长 :
max.poll.interval.ms> 下游最大处理时间。如 : 下游最长时间是 7 分钟,就设置为 8 分钟左右
相关文章:
Kafka 重平衡
Kafka 重平衡协调者RebalanceRebalance 条件Rebalance 避免Rebalance : 让单 Group 下所有的 Consumer 怎么消费订阅主题的所有分区Rebalance 时 , 所有 Consumer 要共同参与 (无法消费),在协调者 (Coordinator) 协调下,完成订阅主题分区的分配 协调者…...
PTA:L1-022 奇偶分家、L1-023 输出GPLT、L1-024 后天(C++)
目录 L1-022 奇偶分家 问题描述: L1-023 输出GPLT 问题描述: 实现代码: L1-024 后天 问题描述: 实现代码: 简单题,没写题解,看代码就能看懂 L1-022 奇偶分家 问题描述: 给…...
IDEA插件开发入门.02
前言许久没更新IDEA插件开发系列了。最近刚好在汇总日常开发中常见的代码“异味”,共享文档复制黏贴略显麻烦,所以想着是否可以搞一个IDEA插件来帮忙收集常见代码,毕竟IDEA作为后端程序员必备的开发工具,显然会方便很多。于是&…...
如何用 23 种编程语言说“Hello World”
在编程的世界里," Hello World " 往往是开发者开始学习一种新语言时写的第一个程序。这个简单的程序会将 “Hello World“ 输出在我们的屏幕上。看似很简单的行为,实际上对于每一个新学习编程语言的人来说,它代表着新的起点。那么&…...
【Linux快速入门】文件目录操作
文章目录概念1. Linux文件系统概述2. Linux文件目录结构3. Linux文件和目录操作3.1 文件操作3.1.1 创建文件3.1.2 复制文件3.1.3 移动文件3.1.4 删除文件3.1.5 查看文件3.1.6 输出指令3.1.7 >和>>指令3.2 目录操作3.2.1 创建目录3.2.2 复制目录3.2.3 移动目录3.2.4 删…...
字体反爬慢慢总结破解方式
什么是字体反爬 网页开发者自己创造一种字体,因为在字体中每个汉字都有其代号,那么以后再网页中不会直接显示这个文字的效果。而是显示其代号,因此即使获取了网页的文本内容。也只是获取到文字的代号,而不是文字本身。 简单来说&…...
Kafka 位移提交
Kafka 位移提交自动提交手动提交Consumer 的消费位移 : 记录 Consumer 下一条消息的消费位移 如 : Consumer 已消费 5 条消息 (位移: 0 - 4) , 此时 Consumer 位移 5 : 指向下一条消息的位移 提交位移 (Committing Offsets) : Consumer 向 Kafka 汇报位移数据 Consumer 能同…...
kubernetes--监控容器运行时:Falco
目录 Falco介绍 Falco架构 Falco的安装 告警规则示列 威胁场景测试: 监控容器创建的不可信任进程(自定义规则) Falco支持五种输出告警方式falco.yaml: Falco告警集中化展示: Falco介绍 Falco是一个Linux安全工具…...
HTTP协议详解(上)
目录 前言: 认识URL HTTP协议方法 通过Fiddler抓包 GET和POST之间典型区别 header详解 HTTP响应状态码 常见状态码解释 状态码分类 HTTP协议报文格式 小结: 前言: HTTP协议属于应用层协议,称为超文本传输协议ÿ…...
java性能-原生内存-内存分析
原生内存最佳实践 内存占用 jVM使用的原生内存和堆内存总和就是一个应用程序的总内存——操作系统角度 jvm启动时候加载的类路径下的jar文件相关的内存和系统其他进程共享资源的可能 测量内存占用 线程是个例外——每当创建一个线程操作系统都会分配一些原生内存存储线程栈…...
c++类与对象
🐶博主主页:ᰔᩚ. 一怀明月ꦿ ❤️🔥专栏系列:线性代数,C初学者入门训练,题解C,C的使用文章 🔥座右铭:“不要等到什么都没有了,才下定决心去做” …...
Java并发编程与API详解
文章目录前言操作系统——进程和线程进程进程组成进程状态进程控制进程创建进程终止进程阻塞和唤醒进程通信线程线程组成线程状态线程控制线程的实现方式用户线程内核线程混合方式CPU调度调度的层次调度的实现调度器调度的时机、切换与过程进程调度的方式闲逛进程两种线程的调度…...
【冲刺蓝桥杯的最后30天】day5
大家好😃,我是想要慢慢变得优秀的向阳🌞同学👨💻,断更了整整一年,又开始恢复CSDN更新,从今天开始更新备战蓝桥30天系列,一共30天,如果对你有帮助或者正在备…...
大厂与小厂招人的区别,看完多少有点不敢相信
前两天在头条发了一条招人的感慨,关于大厂招人和小公司招人的区别。 大厂:有影响力,有钱,能够吸引了大量的应聘者。因此,也就有了筛选的资格,比如必须985名校毕业,必须35岁以下,不能…...
前端ES5对象特性
ES5对象特性 对象和函数的原型 JS中每一个对象都有一个特殊的内置属性,这个特殊的对象可以指向其他的对象 我们通过引用对象的属性key来获取一个value时,它会触发 Get 的操作首先检查该对象是否有对应的属性,如果有的话就使用对象内的如果…...
Linux入门介绍及Linux文件与目录结构
前言 本文小新为大家带来 Linux 入门介绍及Linux 文件与目录结构 相关知识,具体内容包括Linux入门介绍(包括:Linux概述,Linux与Windows区别,CentOS 下载地址),Linux文件与目录结构等进行详尽介绍…...
超赞,用python实现流媒体服务器功能,寥寥几句搞定。
步骤: 要使用Python将实时摄像机传送流写入H5页面,可以使用以下步骤。 1、安装必要的软件包。您需要安装OpenCV和Flask以及gunicorn 与 gevent 。您可以通过在终端中运行以下命令来执行此操作。 pip install opencv-python pip install Flask pip ins…...
冥想第七百二十一天
1.3.3周五,又是周五了。今天又运动了5公里,很舒服轻松。 2.还是往常的生活,休息的也很好,开春后跑的一直很好。 3.早上30分钟健康操。中午转了圈, 给大哥说下周去上海。 4.感谢父母,感谢朋友,感…...
06-Oracle表空间与用户管理
本讲主要内容: 1.表空间管理:表空间的作用,创建,修改,删除及管理; 2.用户管理:创建用户,修改用户,删除用户,修改密码,解锁; 3.用户…...
Mysql 索引特点
承接上文Mysql Server原理简介聚簇索引、二级索引、联合索引分别具备什么样的特点?聚簇索引数据跟索引放在一起的叫聚簇索引;数据和索引分开存储的叫非聚簇索引;innodb存储引擎,数据和文件都放在ibd文件中,实际的数据是…...
8种Prompt优化技巧:解决大模型输出不稳定痛点
8种Prompt优化技巧:解决大模型输出不稳定痛点 在大模型应用落地过程中,开发者常遇到输出结果不可控的问题:同样的需求多次调用返回内容差异巨大、回答偏离核心要求、格式混乱无法直接解析,这些问题严重影响业务流程的稳定性和用户…...
PyCharm+Conda环境避坑指南:手把手配置Real-ESRGAN,解决‘torch.cuda.is_available()‘报错和依赖冲突
PyCharmConda环境避坑指南:手把手配置Real-ESRGAN,解决‘torch.cuda.is_available()‘报错和依赖冲突 图像超分辨率技术正在改变我们处理低质量图像的方式,而Real-ESRGAN作为当前最先进的通用图像修复模型之一,其效果令人惊艳。但…...
Linux内核container_of宏解析与应用
1. 理解container_of宏的核心作用在Linux内核开发中,container_of宏是一个极其重要且频繁使用的工具。它的核心功能是通过结构体成员的地址反推出整个结构体的起始地址。想象一下,你手里只有一张照片的某个局部,却能准确找到这张照片在相册中…...
告别硬件烧钱!用Proteus仿真Arduino UNO做智能小车传感器方案选型
告别硬件烧钱!用Proteus仿真Arduino UNO做智能小车传感器方案选型 在创客和电子竞赛领域,智能小车一直是热门项目,但高昂的硬件成本常常让爱好者望而却步。一套完整的智能车系统可能包含多个传感器、电机驱动模块和控制器,实体采购…...
大数据领域Hive与Spark的结合使用案例
大数据领域Hive与Spark的结合使用案例 关键词:Hive、Spark、大数据处理、数据仓库、分布式计算、ETL、数据分析 摘要:在大数据技术栈中,Hive作为基于Hadoop的数据仓库工具,擅长海量数据的存储与离线分析;Spark作为高性能分布式计算引擎,在复杂数据处理和实时计算领域表现…...
自适应滤波实战:如何用LMS算法在MATLAB/Simulink中快速搭建一个‘简易版’维纳滤波器?
自适应滤波实战:LMS算法在MATLAB/Simulink中的工程化实现 在信号处理领域,自适应滤波技术因其强大的环境适应能力而备受青睐。想象一下,你正在处理一段被噪声污染的语音信号,或是试图从复杂工业环境中提取有效振动特征——传统固定…...
游戏服务器开发者的选择:用Fastutil的Object2ObjectOpenHashMap优化NPC数据存储
游戏服务器性能优化实战:Fastutil的Object2ObjectOpenHashMap在NPC数据管理中的应用 在大型多人在线游戏(MMO)开发中,NPC(非玩家角色)系统的数据管理往往成为性能瓶颈。传统Java集合在高频更新场景下容易引…...
AI Agent与传统RPA工具有什么本质区别?2026深度解析企业级智能体进化路径
在2026年3月下旬的当下,全球自动化技术正经历着从“按图索骥”到“自主导航”的范式跃迁。随着GPT-5.4等具备原生电脑操作能力的大模型发布,以及开源项目OpenClaw在过去一周内的爆发式增长,**AI Agent与传统RPA工具有什么本质区别?…...
Qwen3.5-4B模型在嵌入式系统日志智能分析中的实践
Qwen3.5-4B模型在嵌入式系统日志智能分析中的实践 1. 嵌入式日志分析的痛点与机遇 在物联网网关、工业控制器等嵌入式设备运行过程中,系统日志就像设备的"健康日记",记录着每一次心跳、每一次异常。传统运维人员需要像"破译密码"一…...
“吸收液中间冷却与调整填料高度组合应用” — aspenplusv11百万吨碳捕集系统的关键优化策略
aspenplusv11百万吨碳捕集系统,复配胺溶液,工艺流程优化,吸收液中间冷却、调整吸收段填料高度、贫液入塔分流等。 吸收液中间冷却与调整填料高度组合应用凌晨三点的实验室,咖啡杯底结着褐色的垢。盯着Aspen Plus界面里那个持续报警…...
