当前位置：首页 > article >正文

Kafka自定义分区机制

article 2026/3/2 18:29:18

文章目录

1.如何自定义分区机制
2.示例

1.如何自定义分区机制

若需要使用自定义分区机制，需要完成两件事：
1)在 producer 程序中创建一个类，实现 org.apache.kafka.clients.producer.Partitioner 接口主要分区逻辑在 Partitioner.partition中实现。
2)在用于构造KafkaProducer的Properties对象中设置 partitioner.class 参数。

2.示例

假设我们的消息中有一些消息是用于审计功能的，这类消息的 key 会被固定地分配一个字符串“audit”。我们想要让这类消息发送到 topic 的最后一个分区上，便于后续统一处理，而对于相同 topic 下的其他消息则采用随机发送的策略发送到其他分区上。那么现在就可以这样来实现自定义的分区策略，如下列代码所示:

import org.apache.kafka.clients.producer.Partitioner;
import org.apache.kafka.common.Cluster;
import org.apache.kafka.common.PartitionInfo;
import java.util.List;
import java.util.Map;
import java.util.Random;
public class AuditPartitioner implements Partitioner {private Random random;@Overridepublic void configure(Map<String, ?> map) {//该方法实现必要资源的初始化工作random= new Random();}@Overridepublic int partition(String topic, Object keyObj, byte[] keyBytes, Object valueObj, byte[] valueBytes, Cluster cluster) {String key=(String)keyObj;//从集群元数据中把属于该topic的所有分区信息都读取出供分区策略使用List<PartitionInfo> partitionInfoList = cluster.availablePartitionsForTopic(topic);int partitionCount =partitionInfoList.size();int auditPartition=partitionCount-1;return key == null|| key.isEmpty()|| !key.contains ("audit")?random.nextInt(partitionCount-1):auditPartition;}@Overridepublic void close() {//该方法实现必要资源的清理工作}
}

创建好自定义分区策略类后，在构建KafkaProducer 之前为Properties增加该属性；代码如下：

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;
import java.util.Properties;
import java.util.concurrent.ExecutionException;
public class ProducerTest {public static void main(String[] args) throws ExecutionException, InterruptedException {Properties props = new Properties();props.put("bootstrap.servers", "localhost:9092");//必须指定props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");//必须指定props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");//必须指定props.put("acks", "-1");props.put("retries", 3);props.put("batch.size", 323840);props.put("linger.ms", 10);props.put("buffer.memory", 33554432);props.put("max.block.ms", 3000);props.put("partitioner.class","com.exm.collectcodenew.kafka.producer.custompartitioner.AuditPartitioner");Producer<String, String> producer = new KafkaProducer<>(props);ProducerRecord nonKeyRecord = new ProducerRecord("topic-test","non-key record");ProducerRecord auditRecord = new ProducerRecord("topic-test", "audit","audit record");ProducerRecord nonAuditRecord =new ProducerRecord("topic-test","other","non-sudit record");producer.send(nonKeyRecord).get();producer.send(nonAuditRecord).get();producer.send(auditRecord).get();producer.send(nonKeyRecord).get();producer.send(nonAuditRecord).get();producer.close();}
}

Kafka自定义分区机制

文章目录

1.如何自定义分区机制

2.示例

相关文章：

Kafka自定义分区机制

【HarmonyOS NEXT】关键资产存储开发案例

强化学习（赵世钰版）-学习笔记（9.策略梯度法）

ModuleNotFoundError: No module named ‘flask‘ 错误

【c++】【STL】unordered_set 底层实现（简略版）

【Zephyr】【一】学习笔记

网络安全设备配置与管理-实验4-防火墙AAA服务配置

后端框架模块化

【论文阅读】Contrastive Clustering Learning for Multi-Behavior Recommendation

视频转音频, 音频转文字

基于协同过滤推荐算法的景点票务数据系统（python-计算机毕设）

QT学习笔记1

Ubuntu 24 常用命令方法

Flask多参数模版使用

torcharrow gflags版本问题

自然语言处理｜深入解析 PEGASUS：从原理到实践

Spring AI Alibaba快速使用

socks 协议介绍

Linux --centos安装显卡驱动

【软件工程】简答题

统信UOS中使用Vscode编程

K8s认证（CKA/CKAD/CKS）哪家强？主流证书对比

HTTP1.0、HTTP1.1、HTTP2.0对比

docker安装向量数据库Milvus及可视化工具 Attu

A l密码学（Deepseek)

DeepSeek + Kimi 自动生成 PPT

Apache Paimon 在抖音集团多场景中的优化实践

Uni-App 双栏联动滚动组件开发详解 (电梯导航)

当下主流 AI 模型对比：ChatGPT、DeepSeek、Grok 及其他前沿技术

【自用】NLP算法面经（5）