当前位置: 首页 > news >正文

Kafka-Go学习

文章目录

      • 1. **安装 `kafka-go`**
      • 2. **基本概念**
      • 3. **`kafka-go` 基本用法**
        • 3.1 创建 Producer(生产者)
        • 3.2 创建 Consumer(消费者)
        • 3.3 生产者和消费者配置详解
          • 生产者配置 (`kafka.WriterConfig`)
          • 消费者配置 (`kafka.ReaderConfig`)
      • 4. **高级用法**
        • 4.1 消费者偏移量管理
        • 4.2 分区管理
        • 4.3 使用 SASL 认证
      • 5. **Kafka 生产者与消费者优化**
        • 5.1 优化生产者
        • 5.2 优化消费者
      • 6. **错误处理**
      • 7. **总结**
        • 常用资源

kafka-go 是 Go 语言中一个轻量级、高效的 Kafka 客户端库,提供了简单易用的 API 来与 Apache Kafka 进行交互。 kafka-go 支持 Kafka 的生产者和消费者功能,适用于 Go 应用程序中使用 Kafka 进行消息队列的实现。

1. 安装 kafka-go

首先,需要在 Go 项目中安装 kafka-go 库:

go get github.com/segmentio/kafka-go

2. 基本概念

  • Producer (生产者):生产者负责将消息发送到 Kafka 中的某个主题。
  • Consumer (消费者):消费者从 Kafka 中读取消息。
  • Topic (主题):Kafka 将消息按主题进行分类,每个主题可能有多个分区。
  • Partition (分区):每个主题可以被划分为若干个分区,消息在分区之间进行负载均衡。

3. kafka-go 基本用法

3.1 创建 Producer(生产者)

生产者的作用是向 Kafka 的主题中发送消息。kafka-go 提供了一个简单的 API 来实现消息的生产。

package mainimport ("context""fmt""log""time""github.com/segmentio/kafka-go"
)func main() {// 配置 Kafka writer(生产者)writer := kafka.NewWriter(kafka.WriterConfig{Brokers:  []string{"localhost:9092"}, // Kafka broker 地址Topic:    "example-topic",            // 发送到的 Kafka 主题Balancer: &kafka.LeastBytes{},        // 负载均衡策略})// 定义上下文ctx := context.Background()// 发送消息err := writer.WriteMessages(ctx,kafka.Message{Key:   []byte("Key-A"),Value: []byte("Hello Kafka!"),},kafka.Message{Key:   []byte("Key-B"),Value: []byte("Another Message"),},)if err != nil {log.Fatal("Failed to write messages:", err)}fmt.Println("Messages successfully sent to Kafka")// 关闭 writerif err := writer.Close(); err != nil {log.Fatal("Failed to close writer:", err)}
}
3.2 创建 Consumer(消费者)

消费者从 Kafka 的主题中读取消息。你可以设置不同的消费者组来实现分布式消费。

package mainimport ("context""fmt""log""time""github.com/segmentio/kafka-go"
)func main() {// 配置 Kafka reader(消费者)reader := kafka.NewReader(kafka.ReaderConfig{Brokers:  []string{"localhost:9092"},  // Kafka broker 地址Topic:    "example-topic",             // 读取的 Kafka 主题GroupID:  "example-group",             // 消费者组 IDMinBytes: 10e3,                       // 每次 fetch 请求最少读取 10KBMaxBytes: 10e6,                       // 每次 fetch 请求最多读取 10MB})// 读取消息for {// 设置上下文ctx := context.Background()// 读取消息msg, err := reader.ReadMessage(ctx)if err != nil {log.Fatal("Failed to read message:", err)}// 打印消息fmt.Printf("Message at offset %d: key = %s, value = %s\n", msg.Offset, string(msg.Key), string(msg.Value))// 模拟延迟,避免占用过多 CPU 资源time.Sleep(1 * time.Second)}// 关闭 readerif err := reader.Close(); err != nil {log.Fatal("Failed to close reader:", err)}
}
3.3 生产者和消费者配置详解
生产者配置 (kafka.WriterConfig)
  • Brokers:Kafka broker 的地址列表。
  • Topic:指定生产者要发送消息的 Kafka 主题。
  • Balancer:消息负载均衡策略,如 LeastBytes(最小字节数分配)或 Hash(基于消息 key 的哈希分配)。
消费者配置 (kafka.ReaderConfig)
  • Brokers:Kafka broker 的地址列表。
  • Topic:指定消费者要读取的 Kafka 主题。
  • GroupID:消费者组 ID,Kafka 会将同一个组的消费者平衡分配到不同的分区。
  • MinBytesMaxBytes:每次从 Kafka 读取的最小和最大字节数,影响消息的拉取频率和性能。

4. 高级用法

4.1 消费者偏移量管理

Kafka 消费者通过偏移量(Offset)来管理读取进度,kafka-go 自动为你处理偏移量提交,但你也可以手动管理。

package mainimport ("context""fmt""log""github.com/segmentio/kafka-go"
)func main() {reader := kafka.NewReader(kafka.ReaderConfig{Brokers: []string{"localhost:9092"},Topic:   "example-topic",GroupID: "example-group",})// 读取消息并手动提交偏移量for {msg, err := reader.FetchMessage(context.Background())if err != nil {log.Fatal("Failed to fetch message:", err)}fmt.Printf("Message: %s = %s\n", string(msg.Key), string(msg.Value))// 手动提交消息偏移量if err := reader.CommitMessages(context.Background(), msg); err != nil {log.Fatal("Failed to commit message:", err)}}if err := reader.Close(); err != nil {log.Fatal("Failed to close reader:", err)}
}
4.2 分区管理

Kafka 主题中的消息被分布在多个分区中,kafka-go 允许生产者根据消息的 Key 选择分区,确保相同的 Key 总是发送到同一个分区。

writer := kafka.NewWriter(kafka.WriterConfig{Brokers: []string{"localhost:9092"},Topic:   "example-topic",Balancer: &kafka.Hash{},  // 基于 Key 的 Hash 分配到相同分区
})
4.3 使用 SASL 认证

如果 Kafka 使用了 SASL(Simple Authentication and Security Layer)认证机制,你可以通过 kafka-go 提供的 SASL 支持来进行认证。

import "github.com/segmentio/kafka-go/sasl/plain"dialer := &kafka.Dialer{SASLMechanism: plain.Mechanism{Username: "my-username",Password: "my-password",},
}reader := kafka.NewReader(kafka.ReaderConfig{Brokers: []string{"localhost:9092"},Topic:   "example-topic",Dialer:  dialer,  // 配置认证
})

5. Kafka 生产者与消费者优化

5.1 优化生产者
  • Batching:批量发送消息能提升效率,kafka-go 允许配置批量发送。
  • Compression:使用压缩算法如 gzipsnappy,可以减少网络带宽使用。
writer := kafka.NewWriter(kafka.WriterConfig{Brokers:      []string{"localhost:9092"},Topic:        "example-topic",BatchSize:    100,  // 设置批量大小BatchTimeout: time.Millisecond * 10,Compression:  kafka.Gzip,
})
5.2 优化消费者
  • 并发消费:可以启动多个消费者来读取不同的分区,提升消息处理的吞吐量。
  • 流量控制:通过配置 MinBytesMaxBytes 来控制每次 fetch 的大小,从而优化消费者的性能。

6. 错误处理

Kafka 通常是分布式的,可能会遇到网络故障或 broker 不可用等问题。在生产者和消费者中应该使用适当的错误处理和重试机制。

for {err := writer.WriteMessages(ctx, msg)if err != nil {fmt.Println("Error writing message:", err)time.Sleep(1 * time.Second)  // 简单的重试机制}
}

7. 总结

kafka-go 是 Go 语言中用于与 Kafka 进行通信的一个简洁高效的库,提供了生产者、消费者、分区管理、偏移量管理等完整的功能。它的 API 设计简单易用,同时具有较高的性能和扩展性,适合在 Go 应用中集成 Kafka 消息队列。

常用资源
  • Kafka 官方文档:https://kafka.apache.org/documentation/
  • kafka-go 官方文档:https://github.com/segmentio/kafka-go

相关文章:

Kafka-Go学习

文章目录 1. **安装 kafka-go**2. **基本概念**3. **kafka-go 基本用法**3.1 创建 Producer(生产者)3.2 创建 Consumer(消费者)3.3 生产者和消费者配置详解生产者配置 (kafka.WriterConfig)消费者配置 (kafka.ReaderConfig) 4. **…...

Nginx反向代理出现502 Bad Gateway问题的解决方案

🎉 前言 前一阵子写了一篇“关于解决调用百度翻译API问题”的博客,近日在调用其他API时又遇到一些棘手的问题,于是写下这篇博客作为记录。 🎉 问题描述 在代理的遇到过很多错误码,其中出现频率最高的就是502&#x…...

通信工程学习:什么是VLAN虚拟局域网

VLAN:虚拟局域网 VLAN(Virtual Local Area Network,虚拟局域网)是一种将物理局域网在逻辑上划分成多个广播域的通信技术。以下是关于VLAN的详细解释: 一、VLAN虚拟局域网的定义与概述 VLAN通过逻辑方式将网络中的设备…...

python qt5 常用

QT5中如何设置让窗口根据屏幕比例显示设置? desktop QDesktopWidget().screenGeometry() self.resize(int(desktop.width() * 0.3), int(desktop.height()*0.5)) QT5中关于背景穿透问题的处理方式? 场景如下:我们在开发的时候&#xff0c…...

漏洞复现_永恒之蓝

1.概述 永恒之蓝(EternalBlue)是一个影响Windows操作系统的远程代码执行漏洞,编号为CVE-2017-0144,最初由美国国家安全局(NSA)开发并利用,后来被黑客组织Shadow Brokers泄露。该漏洞存在于SMBv…...

PyCharm的使用

PyCharm的入门使用教程 下载和安装PyCharm: 首先,访问JetBrains官方网站(https://www.jetbrains.com/pycharm/)下载PyCharm的最新版本。根据您的操作系统选择合适的版本进行下载。 安装完成后,打开PyCharm。 创建新…...

浅谈C#之AutoResetEvent和ManualResetEvent

一、基本介绍 AutoResetEvent和ManualResetEvent都是同步原语,它们用于线程之间的协调和通信。它们都是从EventWaitHandle类派生的,但它们在重置事件状态的行为上有所不同。 二、简单示例 AutoResetEvent AutoResetEvent是一个自动重置的事件。当一个线…...

【网络安全 | 靶机搭建】修改镜像源、更新软件源、安装git、更改python版本等

文章目录 0x00、必要准备0x01、修改镜像源0x02、更新软件源并清除缓存0x03、安装git0x04、更改默认Python版本为python30x05、安装增强功能0x06、vmware虚拟机导出iso0x00、必要准备 安装虚拟机时必须保存用户名、密码,用于后续操作,可以截图保存: 以下内容按个人需要进行配…...

VuePress搭建文档网站/个人博客(详细配置)主题配置

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…...

Go语言笔记

目录 一、变量声明 二、流程控制 if(条件判断) for(循环结构) Switch(简化if) goto(跳出循环) 三、运算符 1、算数运算符 2、关系运算符 3、逻辑运算符 4、位运算符 5、…...

java缓存介绍

在Java编程中,缓存技术是一种非常有效的优化手段,用于减少数据访问的延迟和提高应用性能。缓存技术通过存储数据的副本在内存中,使得后续对相同数据的请求能够直接从内存中快速获取,而不需要再次进行耗时的磁盘访问或网络请求。 缓…...

react中diff的选择性子树渲染

在React中,组件的渲染是高效的,这得益于React的虚拟DOM(Virtual DOM)和diff算法。React的diff算法主要用于比较旧虚拟DOM树和新虚拟DOM树之间的差异,并仅更新实际DOM中需要变化的部分,从而提高性能。 关于…...

Git clone远程仓库没有其他分支的问题

在使用Git克隆(Git clone)时,可能遇到分支不全的问题。有以下几种可能的原因和解决方法: 未将所有分支克隆下来:默认情况下,Git只会克隆远程仓库的主分支。如果您想要克隆其他分支,可以使用以下…...

山东潍坊戴尔存储服务器维修 md3800f raid恢复

山东戴尔存储故障维修 存储型号:DELL PowerVault md3800f 故障问题:存储除尘后通电开机,发现有物理硬盘没有插到位,用户带电拔插了多块物理盘,导致关连的磁盘阵列掉线,卷失败; 处理方式&#xf…...

Hive企业级调优[6]——HQL语法优化之任务并行度

目录 HQL语法优化之任务并行度 优化说明 Map端并行度 Reduce端并行度 优化案例 HQL语法优化之任务并行度 优化说明 对于分布式计算任务来说,设置一个合理的并行度至关重要。Hive的计算任务依赖于MapReduce框架来完成,因此并行度的调整需要从Map端和…...

Excel 冻结多行多列

背景 版本:office 2021 专业版 无法像下图内某些版本一样,识别选中框选的多行多列。 如下选中后毫无反应,点击【视图】->【冻结窗口】->【冻结窗格】后自动设置为冻结第一列。 操作 如下,要把前两排冻结起来。 选择 C1&a…...

基于微信小程序的智慧物业管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏:Java精选实战项目…...

【论文笔记】BEVNeXt: Reviving Dense BEV Frameworks for 3D Object Detection

原文链接:https://arxiv.org/pdf/2312.01696 简介:最近,在摄像头3D目标检测任务中,基于查询的Transformer解码器正在超越传统密集BEV方法。但密集BEV框架有着更好的深度估计和目标定位能力,能全面精确地描绘3D场景。本…...

基于open-gpu-kernel-modules的p2p vram映射bar1提高通信效率

背景 bar1 Base Address Register 1 用于内存映射的寄存器,定义了设备的内存映射区域,BAR1专门分配给gpu的一部分内存区域,允许cpu通过pcie总线直接访问显存VRAM中的数据。但bar1的大小是有限的,在常规的4090上,bar1只…...

java之斗地主部分功能的实现

今天我们要实现斗地主中发牌和洗牌这两个功能,该如何去实现呢? 1.创建牌类:52张牌每一张牌包含两个属性:牌的大小和牌的花色。 故我们优先创建一个牌的类(Card):包含大小和花色。 public class Card { //单张牌的大小及类型/…...

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...

聊聊 Pulsar:Producer 源码解析

一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台,以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中,Producer(生产者) 是连接客户端应用与消息队列的第一步。生产者…...

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 初始化服务器)

服务端执行命令请求的过程 【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生 初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

从零实现STL哈希容器:unordered_map/unordered_set封装详解

本篇文章是对C学习的STL哈希容器自主实现部分的学习分享 希望也能为你带来些帮助~ 那咱们废话不多说&#xff0c;直接开始吧&#xff01; 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...

EtherNet/IP转DeviceNet协议网关详解

一&#xff0c;设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络&#xff0c;本网关连接到EtherNet/IP总线中做为从站使用&#xff0c;连接到DeviceNet总线中做为从站使用。 在自动…...

NLP学习路线图(二十三):长短期记忆网络(LSTM)

在自然语言处理(NLP)领域,我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感,还是实现语言的翻译,都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心,而循环神经网络(RNN) 曾被视为…...

在QWebEngineView上实现鼠标、触摸等事件捕获的解决方案

这个问题我看其他博主也写了&#xff0c;要么要会员、要么写的乱七八糟。这里我整理一下&#xff0c;把问题说清楚并且给出代码&#xff0c;拿去用就行&#xff0c;照着葫芦画瓢。 问题 在继承QWebEngineView后&#xff0c;重写mousePressEvent或event函数无法捕获鼠标按下事…...

JS设计模式(4):观察者模式

JS设计模式(4):观察者模式 一、引入 在开发中&#xff0c;我们经常会遇到这样的场景&#xff1a;一个对象的状态变化需要自动通知其他对象&#xff0c;比如&#xff1a; 电商平台中&#xff0c;商品库存变化时需要通知所有订阅该商品的用户&#xff1b;新闻网站中&#xff0…...

算法:模拟

1.替换所有的问号 1576. 替换所有的问号 - 力扣&#xff08;LeetCode&#xff09; ​遍历字符串​&#xff1a;通过外层循环逐一检查每个字符。​遇到 ? 时处理​&#xff1a; 内层循环遍历小写字母&#xff08;a 到 z&#xff09;。对每个字母检查是否满足&#xff1a; ​与…...

Java求职者面试指南:计算机基础与源码原理深度解析

Java求职者面试指南&#xff1a;计算机基础与源码原理深度解析 第一轮提问&#xff1a;基础概念问题 1. 请解释什么是进程和线程的区别&#xff1f; 面试官&#xff1a;进程是程序的一次执行过程&#xff0c;是系统进行资源分配和调度的基本单位&#xff1b;而线程是进程中的…...