当前位置：首页 > news >正文

Kafa分区策略实现

news 2026/5/13 20:51:26

引言

Kafka 的分区策略决定了生产者发送的消息会被分配到哪个分区中，合理的分区策略有助于实现负载均衡、提高消息处理效率以及满足特定的业务需求。

轮询策略（默认）

轮询策略是 Kafka 默认的分区策略（当消息没有指定键时）。生产者会按照顺序依次将消息发送到各个分区中，确保每个分区都能均匀地接收到消息，从而实现负载均衡。简单高效，能使各个分区的消息量相对均衡，充分利用每个分区的存储和处理能力。

import org.apache.kafka.clients.producer.*;
import java.util.Properties;public class RoundRobinProducer {public static void main(String[] args) {Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");Producer<String, String> producer = new KafkaProducer<>(props);for (int i = 0; i < 10; i++) {ProducerRecord<String, String> record = new ProducerRecord<>("testTopic", "message-" + i);producer.send(record);}producer.close();}
}

随机策略

随机策略会随机地将消息分配到一个分区中。这种策略在某些情况下可以实现一定程度的负载均衡，但由于是随机分配，可能会导致分区之间的消息分布不够均匀。可以通过自定义分区器来实现随机策略。

import org.apache.kafka.clients.producer.*;
import java.util.List;
import java.util.Map;
import java.util.Random;public class RandomPartitioner implements Partitioner {private final Random random = new Random();@Overridepublic int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);return random.nextInt(partitions.size());}@Overridepublic void close() {}@Overridepublic void configure(Map<String, ?> configs) {}
}// 使用随机分区器的生产者示例
public class RandomProducer {public static void main(String[] args) {Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("partitioner.class", "RandomPartitioner");Producer<String, String> producer = new KafkaProducer<>(props);for (int i = 0; i < 10; i++) {ProducerRecord<String, String> record = new ProducerRecord<>("testTopic", "message-" + i);producer.send(record);}producer.close();}
}

按键哈希策略

当消息指定了键时，Kafka 会根据键的哈希值将消息分配到特定的分区中。相同键的消息会被分配到同一个分区，这有助于保证具有相同业务逻辑的消息顺序性。可以保证消息的局部有序性，例如在处理用户相关的消息时，将同一个用户的消息发送到同一个分区，方便后续的处理和分析。

import org.apache.kafka.clients.producer.*;
import java.util.Properties;public class KeyBasedProducer {public static void main(String[] args) {Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");Producer<String, String> producer = new KafkaProducer<>(props);for (int i = 0; i < 10; i++) {ProducerRecord<String, String> record = new ProducerRecord<>("testTopic", "user-" + (i % 2), "message-" + i);producer.send(record);}producer.close();}
}

自定义分区策略(实现接口)

当上述默认策略无法满足业务需求时，可以自定义分区策略。通过实现org.apache.kafka.clients.producer.Partitioner接口，重写partition方法来实现自定义的分区逻辑。例如，根据消息的某些特定字段（如时间、地理位置等）来进行分区，以满足特定的业务需求。

import org.apache.kafka.clients.producer.*;
import java.util.List;
import java.util.Map;public class CustomPartitioner implements Partitioner {@Overridepublic int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);// 自定义分区逻辑，这里简单示例根据消息值的长度分区String message = (String) value;return message.length() % partitions.size();}@Overridepublic void close() {}@Overridepublic void configure(Map<String, ?> configs) {}
}// 使用自定义分区器的生产者示例
public class CustomProducer {public static void main(String[] args) {Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");props.put("partitioner.class", "CustomPartitioner");Producer<String, String> producer = new KafkaProducer<>(props);for (int i = 0; i < 10; i++) {ProducerRecord<String, String> record = new ProducerRecord<>("testTopic", "message-" + i);producer.send(record);}producer.close();}
}

Kafa分区策略实现

引言 Kafka 的分区策略决定了生产者发送的消息会被分配到哪个分区中，合理的分区策略有助于实现负载均衡、提高消息处理效率以及满足特定的业务需求。轮询策略（默认） 轮询策略是 Kafka 默认的分区策略（当消息没有指定键时&…...

编程日记 2025/1/31 0:24:15

Pyside/Pyqt中QWebEngineView和QWebEnginePage的区别

在 PySide/Qt 的 WebEngine 模块中，QWebEngineView 和 QWebEnginePage 是两个紧密相关但职责不同的类。以下是它们的核心区别和关系： 1. 职责区分类名核心职责模块归属QWebEngineView作为可视化的窗口部件（Widget），负…...

编程日记 2025/1/31 0:21:08

Kafka的内部通信协议

引言 kafka内部用到的常见协议和优缺点可以看看原文 Kafka用到的协议本文奖详细探究kafka核心通信协议和高性能的关键网络层通信的实现基于 Java NIO：Kafka 的网络通信层主要基于 Java NIO 来实现，这使得它能够高效地处理大量的连接和数据传输。…...

编程日记 2025/1/31 0:20:03

强大到工业层面的软件

电脑数据删不干净，简直是一种让人抓狂的折磨！明明已经把文件扔进了回收站，清空了，可那些残留的数据就像牛皮癣一样，怎么也除不掉。这种烦恼简直无处不在，让人从头到脚都感到无比烦躁。首先，心…...

编程日记 2025/1/31 0:18:58

数据分析和AI丨应对AI实施挑战，工程领域AI应用的五大方法

工程领域的人工智能 （AI） 已经开始发挥价值，低代码和无代码工具正在使曾经仅属于专业数据科学家的 AI 能力变得大众化。然而，并非工程领域的每个人都能从中受益，使用新的便捷的 AI 工具提高工作效率并不难&#xff0c…...

编程日记 2025/1/31 0:12:42

54. UDP协议

UDP协议 UDP（User Datagram Protocol，用户数据报协议）是一个无连接的传输层协议，它提供简单的、不可靠的信息传送服务。与TCP（传输控制协议）不同，UDP不提供数据包的排序、错误检查（仅…...

编程日记 2025/1/31 0:07:32

黑马程序员视频地址： 黑马程序员前端AJAX入门到实战全套教程https://www.bilibili.com/video/BV1MN411y7pw?vd_source0a2d366696f87e241adc64419bf12cab&spm_id_from333.788.videopod.episodes&p2https://www.bilibili.com/video/BV1MN411y7pw?vd_source…...

编程日记 2025/1/31 0:04:26

深入解析Java集合框架：春招面试要点

在上一篇文章中，我们深入探讨了Java核心基础，这是学习Java的基石。而在实际的Java开发中，集合框架的使用频率极高，它为我们提供了丰富的数据结构和算法实现，极大地提高了开发效率。对于春招面试来说，集合框…...

编程日记 2025/1/31 0:00:21

【Elasticsearch】Elasticsearch的查询

Elasticsearch的查询 DSL查询基础语句叶子查询全文检索查询matchmulti_match 精确查询termrange 复合查询算分函数查询bool查询排序分页基础分页深度分页高亮高亮原理实现高亮 RestClient查询基础查询叶子查询复合查询排序和分页高亮数据聚合DSL实现聚合Bucket聚合带条件聚合…...

编程日记 2025/1/30 23:58:17

STM32 PWM驱动直流电机

接线图： 代码配置： 根据驱动舵机的代码来写，与舵机不同的是，这次的引脚接到了PA2上，所以需要改一下引脚以及改为OC3通道。另外还需在配置两个GPIO引脚，来控制电机的旋转方向，这里连接到了PA4与…...

编程日记 2025/1/30 23:55:14

系统思考—心智模式

“我们的大脑对连贯性的渴望远胜于对准确性的追求。”—诺贝尔经济学得主丹尼尔卡尼曼在面对复杂的决策时，我们往往更倾向于寻找那些能够迅速串联起来的信息，而非深入挖掘每一个细节的真实性。这种倾向在日常生活中或许能帮助我们迅速作出决策&#xf…...

编程日记 2025/1/30 23:51:07

JavaScript_02 表单

表单常用演示: 1.图片结果失真了... 2.切换图片切换结果 3.表单:...

编程日记 2025/1/30 23:50:06

【Qt】06－对话框

对话框前言一、模态和非模态对话框1.1 概念1.2 模态对话框1.2.1 代码QAction类 1.2.2 模态对话框运行分析 1.3 非模态对话框1.3.1 代码局部变量和成员变量setAttribute 类 1.3.2 现象解释二、标准对话框2.1 提示对话框 QMessageBox2.1.1 现象及解释 2.2 问题对话框2.2.1 现象…...

编程日记 2025/1/30 23:47:01

AI学习指南Ollama篇-使用Ollama构建自己的私有化知识库

一、引言（一）背景介绍随着企业对数据隐私和效率的重视，私有化知识库的需求日益增长。私有化知识库不仅可以保护企业数据的安全性，还能提供高效的知识管理和问答系统，提升企业内部的工作效率和创新能力。（二）Ollama和AnythingLLM的结合 Ollama和AnythingLLM的结合…...

编程日记 2025/1/30 23:45:59

2.策略模式（Strategy）

定义定义一系列算法，把它们一个个封装起来，并且使他们可互相替换（变化）。该模式使算法可独立于使用它的客户程序（稳定）而变化（拓展，子类化）。动机（Motiva…...

编程日记 2025/1/30 23:42:57

Python里的小整数问题挺有意思的

简单来说，Python为了优化性能，会把一些常用的整数（通常是-5到256）提前创建好，放到一个“缓存池”里。这样，当你用到这些小整数时，Python就不用每次都重新创建对象了，直接从缓存池里拿…...

编程日记 2025/1/30 23:35:41

开源智慧园区管理系统对比五款主流产品探索智能运营新模式

内容概要在这个数字化迅速发展的时代，园区管理也迎来了全新的机遇和挑战。众所周知，开源智慧园区管理系统作为一种创新解决方案，正逐步打破传统管理的局限性。它的开放性不仅使得系统可以根据具体需求进行灵活调整，也为用户提供…...

编程日记 2025/1/30 23:32:34

正则表达式入门

入门 1、提取文章中所有的英文单词 //1．先创建一个Pattern对象，模式对象，可以理解成就是一个正则表达式对象 Pattern pattern Pattern.compile("[a-zA-Z]"); //2．创建一个匹配器对象 //理解:就是 matcher匹配器按照p…...

编程日记 2025/1/30 23:28:20

hive:数据导入,数据导出,加载数据到Hive,复制表结构

hive不建议用insert,因为Hive是建立在Hadoop之上的数据仓库工具，主要用于批处理和大数据分析，而不是为OLTP（在线事务处理）操作设计的。INSERT操作会非常慢数据导入命令行界面:建一个文件查询数据>>复制>>粘贴到新…...

编程日记 2025/1/30 23:26:09

【某大厂一面】HashSet底层怎么实现的

HashSet 是 Java 集合框架中的一个非常常用的集合类，它实现了 Set 接口，并且底层通常是通过哈希表（HashMap）来实现的。要理解 HashSet 的底层实现，我们需要从哈希表的工作原理开始讲起。下面是对 HashSet 底层实现的详…...

编程日记 2025/1/30 23:24:00

Naftis社区贡献指南：如何参与这个开源Istio项目

Naftis社区贡献指南：如何参与这个开源Istio项目【免费下载链接】naftis An awesome dashboard for Istio built with love. 项目地址: https://gitcode.com/gh_mirrors/na/naftis Naftis是一个基于Apache 2.0协议开源的Istio仪表板项目，专为简化…...

编程新知 2026/5/13 20:05:42

2025届毕业生推荐的六大AI学术助手解析与推荐

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 于内容创作进程里，要减低AI生成文本的可检测比率，得从语义、结构以及…...

编程新知 2026/5/13 19:48:20

先进制程EPE挑战：从系统误差到量测革命，如何驯服边缘位置误差

1. 从“理所当然”到“如履薄冰”：边缘位置误差如何成为先进制程的“隐形杀手”在半导体行业过去的黄金岁月里，工程师们有一个近乎奢侈的“共识”：芯片内部那些由光刻、刻蚀定义的特征边缘，可以被理所当然地看作是笔直且在不同工艺…...

编程新知 2026/5/13 19:27:04

ExifToolGUI终极指南：3步掌握照片元数据批量管理工具

ExifToolGUI终极指南：3步掌握照片元数据批量管理工具【免费下载链接】ExifToolGui A GUI for ExifTool 项目地址: https://gitcode.com/gh_mirrors/ex/ExifToolGui 你是否曾为整理数百张旅行照片而头疼？需要统一修改拍摄时间、批量添加版权信息&…...

编程新知 2026/5/13 19:20:25