当前位置：首页 > news >正文

读kafka生产端源码，窥kafka设计之道（下）

news 2026/2/8 14:37:48

背景

在上一篇文章《读kafka生产端源码，窥kafka设计之道（上）》留下了kafka设计上比较优秀的一个点；内存的循环使用。本篇文章准备盘盘它。

好奇

为什么 kafka减少发送消息时向JVM频繁申请内存，就可以降低JVM GC的执行次数？

我们知道网络上传输的都是二进制数据；而在java中想通过socke网络套接字接口发送数据，底层都是用的ByteBuffer。在往网络上发送数据前，先申请块ByteBuffer的内存；然后把数据写入到此ByteBuffer内存中；调用底层socket的write接口，就OK了；大概伪代码流程

   //伪代码//申请内存ByteBuffer buffer = ByteBuffer.allocate(size)//内存里加入数据buffer.put(XXX)//发送数据SocketChannel.write(ByteBuffer src)

ByteBuffer占用的内存，什么时候会被回收了？

答：在jvm进行GC时会被回收；

试想如果上面那段代码执行非常频繁，创建ByteBuffer就会很频繁；创建ByteBuffer很频繁，那么申请内存就会很频繁，申请内存越频繁，内存被占满的时间也就会越来越短，内存满了就只能靠不停的GC进行内存的回收，加以重复使用了。而现代JVM里GC的发展目标之一，就是减少GC的停顿时间。GC优化大师从PS，CMS，G1，到ZGC，都在朝这这个方向在努力。

kafka如何解决这个内存频繁申请和GC 频繁释放的问题了？

如果可以用一句简单的话来总结：那么我想应该是 对ByteBuffer的重复使用。 是的用完了不要丢，也不让jvm 给GC了。即对进行了网络发送的ByteBuffer进行复用；如果有新的消息要发送，可以从缓存池里获取已有 ByteBuffer；然后往里面写入消息数据；当IO线程把ByteBuffer里的消息发往broker并收到对应的响应后，会把ByteBuffer放回缓存池供下一次需要发送的消息循环使用。
大概流程如下图：

核心参数和代码

有两个核心参数，可以控制缓存池BufferPool的行为

buffer.memory
缓存池大小，默认32M。如果IO thread发送消息的速率比业务线程生产消息的速度慢，则会引起业务线程的阻塞，可根据实际情况和jvm大小增大此参数
batch.size
控制每个缓存块ByteBuffer的大小，默认为16K。即一个 BatchRecord里可存的多条消息最大空间。
ByteBuffer的申请
ByteBuffer的回收

总结

如果要编写一款网络应用程序，或者网络框架的工具，我希望能向kafka一样，能考虑到内存的复用；并且减少对上层应用的影响。
假设一个应用通过kafka发送50个G的网络数据；那么kafka的缓存池，就节约了10个G内存的申请和回收；由此减少了多少次GC和GC暂停时间了。那么假设有个50个这样的应用了？总的收益又是多少了？
不是所有的工具都能号称是为应对大数据场景而产生的；kafka做为一款中间件，能比较好的融入大数据生态，kafka的研发人员有自己的独特设计和考虑在支撑这它。

原创不易，请点赞，关注，留言，转载 4暴击^^

读kafka生产端源码，窥kafka设计之道（下）

背景在上一篇文章《读kafka生产端源码，窥kafka设计之道（上）》留下了kafka设计上比较优秀的一个点；内存的循环使用。本篇文章准备盘盘它。好奇为什么 kafka减少发送消息时向JVM频繁申请内存，就可以降低JVM GC的执…...

编程日记 2023/7/27 20:35:53

Pytorch个人学习记录总结 06

目录神经网络-卷积层 torch.nn.Conv2d 神经网络-最大池化的使用 torch.nn.MaxPool2d 神经网络-卷积层 torch.nn.Conv2d torch.nn.Conv2d的官方文档地址 CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride1, padding0, dilation1, groups1, biasTrue,…...

编程日记 2023/7/27 20:34:52

Rust之泛型、特性和生命期(四)：验证有生存期的引用

开发环境 Windows 10Rust 1.71.0 VS Code 1.80.1 项目工程这里继续沿用上次工程rust-demo 验证具有生存期的引用生存期是我们已经在使用的另一种泛型。生存期不是确保一个类型具有我们想要的行为，而是确保引用在我们需要时有效。我们在第4章“引用和借用”一…...

编程日记 2023/7/27 20:33:51

kubesphere安装中间件

kubesphere安装mysql 创建configMap [client] default-character-setutf8mb4[mysql] default-character-setutf8mb4[mysqld] init_connectSET collation_connection utf8mb4_unicode_ci init_connectSET NAMES utf8mb4 character-set-serverutf8mb4 collation-serverutf8mb4_…...

编程日记 2023/7/27 20:32:50

zookeeper学习（二）集群模式安装

前置环境三台centos7服务器 192.168.2.201 192.168.2.202 192.168.2.150三台服务器都需要安装jdk1.8以上zookeeper安装包安装jdk 在单机模式已经描述过，这里略过，有需要可以去看单机模式中的这部分，注意的是三台服务器都需要安装安装…...

编程日记 2023/7/27 20:31:49

选择合适的图表，高效展现数据魅力

随着大数据时代的来临，数据的重要性愈发凸显，数据分析和可视化成为了决策和传递信息的重要手段。在数据可视化中，选择合适的图表是至关重要的一环，它能让数据更加生动、直观地呈现，为观众提供更有说服力的信息。本文将…...

编程日记 2023/7/27 20:30:47

springboot自动装配

SPI spi ： service provider interface ： 是java的一种服务提供机制，spi 允许开发者在不修改代码的情况下，为某个接口提供实现类，来扩展应用程序将实现类独立到配置文件中，通过配置文件控制导入&#xff…...

编程日记 2023/7/27 20:29:46

python小记-队列

队列（Queue）是一种常见的数据结构，它遵循先进先出（First-In-First-Out，FIFO）的原则。在队列中，新元素（也称为项）总是添加到队列的末尾，而最早添加的元素总是在…...

编程日记 2023/7/27 20:27:44

SpringBoot——持久化技术

简单介绍在之前我们使用的数据层持久化技术使用的是MyBatis或者是MyBatis-plus，其实都是一样的。在使用之前，我们要导入对应的坐标，然后配置MyBatis特有的配置，比如说Mapper接口，或者XML配置文件，那么除了…...

编程日记 2023/7/27 20:26:43

Kafka 入门到起飞 - 生产者参数详解，什么是生产者确认机制？什么是ISR？什么是 OSR?

上回书我们讲了，生产者发送消息流程解析传送门那么这篇我们来看下，生产者发送消息时几个重要的参数详解 ，什么是生产者确认机制？ 什么是ISR？ 什么是 OSR? 参数： bootstrap.servers ： Kafka 集…...

编程日记 2023/7/27 20:25:42

【文献分享】比目前最先进的模型轻30%！高效多机器人SLAM蒸馏描述符！

论文题目：Descriptor Distillation for Efficient Multi-Robot SLAM 中文题目：高效多机器人SLAM蒸馏描述符作者：Xiyue Guo, Junjie Hu, Hujun Bao and Guofeng Zhang 作者机构：浙江大学CAD&CG国家重点实验室香港中文大学…...

编程日记 2023/7/27 20:24:41

【数据动态填充到element表格；将带有标签的数据展示为文本格式】

一：数据动态填充到element表格； 二：将带有标签的数据展示为文本格式； 1、 <el-row><el-col :span"24"><el-tabs type"border-card"><el-tab-pane label"返回值"><el-…...

编程日记 2023/7/27 20:23:40

小程序轮播图的两种后台方式(PHP)--【浅入深出系列008】

微信目录集链接在此： 详细解析黑马微信小程序视频–【思维导图知识范围】难度★✰✰✰✰ 不会导入/打开小程序的看这里：参考让别人的小程序长成自己的样子-更换window上下颜色–【浅入深出系列001】文章目录本系列校训学习资源的选择啥是轮播图轮播…...

编程日记 2023/7/27 20:22:39

使用ComPDFKit PDF SDK 构建iOS PDF阅读器

在当今以移动为先的世界中，为企业和开发人员创建一个iOS应用程序是必不可少的。随着对PDF文档处理需求的增加，使用ComPDFKit这个强大的PDF软件开发工具包（SDK）来构建iOS PDF阅读器和编辑器可以让最终用户轻松查看和编辑PDF文档。 …...

编程日记 2023/7/27 20:21:38

一套流程6个步骤，教你如何正确采购询价

采购询价（RFQ）是一种竞争性投标文件，用于邀请供应商或承包商就标准化或重复生产的产品或服务提交报价。询价通常用于大批量/低价值项目，买方必须提供技术规格和商业要求，该文件有时也称为招标书或投标邀请书。询价流…...

编程日记 2023/7/27 20:20:36

git使用

常用命令 git init git库初始化，初始化后会在文件中出现一个.git的隐藏文件 git clone 从远程克隆仓库 git pull 从远程库中拉取 git commit 将暂存提交到本地仓库 git push 提交本地仓库到远程 git branch 查看当前分支 git branch <branchName> 切换分支 …...

编程日记 2023/7/27 20:19:35

SkyWalking链路追踪-搭建-spring-boot-cloud-单机环境之《10 分钟快速搭建 SkyWalking 服务》

首先了解一下单机环境第一步，搭建一个 Elasticsearch 服务。第二步，下载 SkyWalking 软件包。第三步，搭建一个 SkyWalking OAP 服务。第四步，启动一个 Spring Boot 应用，并配置 SkyWalking Agent。第五步，…...

编程日记 2023/7/27 20:18:34

Rabbit MQ整合springBoot

一、pom依赖二、消费端2.1、application.properties 配置文件2.2、消费端核心组件三、生产端3.1、application.properties 配置文件2.2、生产者 MQ消息发送组件四、测试1、生产端控制台2、消费端控制台一、pom依赖 <dependency><groupId>org.springframework.boo…...

编程日记 2023/7/27 20:17:32

Golang 中的 time 包详解（一）：time.Time

在日常开发过程中，会频繁遇到对时间进行操作的场景，使用 Golang 中的 time 包可以很方便地实现对时间的相关操作。接下来的几篇文章会详细讲解 time 包，本文先讲解一下 time 包中的结构体 time.Time。 time.Time time.Time 类型用来表示一个…...

编程日记 2023/7/27 20:16:31

CMU 15-445 -- Database Recovery - 18

CMU 15-445 -- Database Recovery - 18 引言ARIESLog Sequence NumbersNormal ExecutionTransaction CommitTransaction AbortCompensation Log Records Non-fuzzy & fuzzy CheckpointsSlightly Better CheckpointsFuzzy Checkpoints ARIES - Recovery PhasesAnalysis Phas…...

编程日记 2023/7/27 20:15:29

读kafka生产端源码，窥kafka设计之道（下）

背景

好奇

ByteBuffer占用的内存，什么时候会被回收了？

kafka如何解决这个内存频繁申请和GC 频繁释放的问题了？

核心参数和代码

总结

相关文章：

读kafka生产端源码，窥kafka设计之道（下）

Pytorch个人学习记录总结 06

Rust之泛型、特性和生命期(四)：验证有生存期的引用

kubesphere安装中间件

zookeeper学习（二）集群模式安装

选择合适的图表，高效展现数据魅力

springboot自动装配

python小记-队列

SpringBoot——持久化技术

Kafka 入门到起飞 - 生产者参数详解，什么是生产者确认机制？什么是ISR？什么是 OSR?

【文献分享】比目前最先进的模型轻30%！高效多机器人SLAM蒸馏描述符！

【数据动态填充到element表格；将带有标签的数据展示为文本格式】

小程序轮播图的两种后台方式(PHP)--【浅入深出系列008】

使用ComPDFKit PDF SDK 构建iOS PDF阅读器

一套流程6个步骤，教你如何正确采购询价

git使用

SkyWalking链路追踪-搭建-spring-boot-cloud-单机环境之《10 分钟快速搭建 SkyWalking 服务》

Rabbit MQ整合springBoot

Golang 中的 time 包详解（一）：time.Time

CMU 15-445 -- Database Recovery - 18

简易版抽奖活动的设计技术方案

Java 8 Stream API 入门到实践详解

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例

Java 加密常用的各种算法及其选择

【python异步多线程】异步多线程爬虫代码示例

（转）什么是DockerCompose?它有什么作用？

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

保姆级教程：在无网络无显卡的Windows电脑的vscode本地部署deepseek

鸿蒙（HarmonyOS5）实现跳一跳小游戏

FFmpeg avformat_open_input函数分析