当前位置：首页 > news >正文

【RocketMq系列-02】RocketMq的架构解析和高性能设计

news 2026/4/28 1:52:56

RocketMq系列整体栏目

内容	链接地址
【一】RocketMq安装和基本概念	https://zhenghuisheng.blog.csdn.net/article/details/134486709
【二】RocketMq的架构解析和高性能设计/font>	https://zhenghuisheng.blog.csdn.net/article/details/134559514

RocketMq的架构解析和高性能设计

一，RocketMq的架构解析和高性能设计
- 2，rocketmq底层原理
- - 2.1，事务的底层实现
  - 2.2，如何保证消息不丢失
  - 2.3，rocketmq积压问题
  - 2.4，如何保证顺序消费
  - 2.5，rocketmq的持久化
  - 2.6，死信队列
  - 2.7，消息的幂等性
- 3，rocketmq高性能的设计
- - 3.1，零拷贝技术
  - 3.2，顺序写技术
  - 3.3，刷盘机制

一，RocketMq的架构解析和高性能设计

在rocketMq中，其整体架构如下，在RocketMqServer中，主要有NameServer，Broker，MessageQueue，Message等组件，并且存在Topic这种逻辑组件，表示一种主题

在这里插入图片描述

NameServer是topic的注册中心，NameServer会和topic建立长连接，将broker的信息通过topic注册到NameServer中，然后生产者和消费者都会先通过这个NameServer获取相关信息，再和对应的broker建立长连接。

在微服务中，有Nacos，zookeeper等作为注册中心：

但是zk很明显不适合作为这种高可用的注册的这中心，因为内部可能会因为选举出现脑裂问题，并且因为这个问题可能会导致整个服务出现一定时间的不可用的问题，而rocketmq主要就是高吞吐量，低延迟的特性，因此不可能去选择zk作为注册中心的；

而nacos和eureka也不适合作为rocketmq的注册中心，如nacos中会记录很多信息，如心跳信息，端口，host等信息，而Nameserver中只需要记录这个Broker的信息，如果使用nacos来做的话，有点大材小用了。并且如果引用nacos，还要考虑版本冲突这些，做一些适配器等，相对来说是更加复杂的

在topic中的Consumer配置中，每个topic都会对应一个或者多个消费者组，topic主题和消费者组是多对多的关系，一个consumer消费者组，代表的是一组逻辑相同的消费者，一个message消息，只能被消费者组中的一个消费者消费，这个和kafka中的消息消费是一样的

上面提到了消费者组的概念，在生产者中，也有生产者组。在事务机制中，当生产者给broker发送数据之后，broker需要给生产者一个数据回调，那么就需要指定生产者名字，那么此时生产者组就能发挥其作用

生产者producer在本地会有一个缓存存储Nameserver中存储的broker，在往broker投递之前，会向注册中心中发起一个请求判断是否需要拉取最新的配置，然后再往对应的broker发送数据

2，rocketmq底层原理

2.1，事务的底层实现

rocketmq的事务实现，相当于一个简单的分布式事务，主要是保证生产者本地事务和发送到broker事务的原子性。而broker到consumer端是一定可以保证消息消费成功的，如果一个消费者失败，那么可以往别的消费者里面推送，如果最终依旧失败，那么可以先重试，最后加入到死信队列里面

事务消息的底层实现如下图，首先生产者会发送一个half消息给Broker，Broker在接收到这个half消息之后，就会向broker返回一个确认的标志，然后事务的发送者就会执行本地事务，通过这个execute去执行本地事务。如果本地事务执行成功，那么生产者会返回一个提在交的状态给Broker，随后Broker将消息投递到消费者中；如果是回滚状态，那么消息会直接丢掉；如果是在4的时候，本地事务需要的时间过长，那么本地会先返回一个unknow的未知状态，然后broker会等一段时间，随后再回生产者中定时回查，消息生产者会去检查事务，默认是回查15次，如果是15次之后检查还是没有完成，那么消息就会直接丢弃掉

half消息有点类似于建立tcp连接，主要是做为一种嗅探机制，判断当前broker服务是否正常，如果broker服务挂了，那么连本地事务，也可以直接不执行了。

在这里插入图片描述

如一个订单场景，30s检查一次是否支付，那么就可以直接通过这种事务去实现，通过execute方法去执行本地事务，然后通过这个check的方式去银行进行对账。如果最终超时，那么最终将消息放入到死信队列中，在私信队列中写对应的逻辑，如将库存加回等。

2.2，如何保证消息不丢失

在mq中，消息丢失主要有四个地方，分别是生产者到broker、broker到消费者，broker的master到slave以及操作系统自身的缓存。

生产者到broker的解决方案可以如下：可以选择最简单的同步+多次试错的方式，或者可以直接选择事务消息
broker到消费者之间：消费者本身具有重试功能，消费者不应答就会往别的消费者投递
操作系统主要是因为数据在缓存，如果出现断电而未来得及刷盘导致，因此应该采用同步刷盘解决
broker到的master到slave之间：也可以采用同步的方式，来一条消息就往slave写入，或者通过Dledger集群

操作系统和主从之间保证消息不丢失，主要是通过同步的方式解决，但是在保证安全的情况下，会在一定的程度上影响吞吐量和性能

2.3，rocketmq积压问题

在rocketmq中，其处理数据积压问题时比其他mq的能力强的，如果出现积压，那么可以直接通过控制台上面的topic，通过内部的代理者位点和消费者位点所产生的差值查看，如果差值为0，则表示有消息积压未处理。

在这里插入图片描述

在rocketmq内部，一个MessageQueue队列的消息只能由一个消费者组中的一个消费者去消费，其底层实现和kafka是一样的，因此如果出现消息积压，那么首先可以查看消费者组中的消费者个数和队列的个数是否相同，如果消费者个数小于队列的个数，那么可以增加消费者个数，直到和队列的个数一致，如默认队列的个数为4，那么将消费者组中的消费者个数设置成4

当然，消费者个数调大是没有用的，因为最大只能和topic中的队列一致，那么就可以通过重写一个topic，调大topic中队列的数量，如原来的队列个数只有4，那么可以创建一个新的topic，设置队列的个数为8，并且原来的消费者对消息不消费，而是做一个转发功能，将4个队列的topic的数据转发到8个队列的topic中，那么在消费者组中，其个数就可以设置成8，那么这样子就很好的处理消息积压的问题了。

数据的搬运可以在具体的消费者代码里面去编写，主要功能有接收四个topic队列的数据，然后转发到八个topic的队列中，最后再写一个消费者去消费八个队列topic的消息

2.4，如何保证顺序消费

这里的顺序消息只能保证局部有序，而不是全局有序。在rocketmq内部，在生产者端，消息会根据id做一个取模运算，会将同一个区取模运算的值放入一个队列里面，在消费者端，会锁定队列消费，就是会先消费完一个队列再消费下一个队列，从而保证单个队列消费的有序性

2.5，rocketmq的持久化

rocketmq为了保证消息的安全性，在broker内部都会做一个持久化的操作，首先当生产者将消息发送到broker之后，会现将消息存储到 coimmit 文件中，每个topic都会有对应的commit文件，每个文件大小为1g，如果消息满了则会创建新的文件，文件的格式为二进制格式。

在消费者中，会有一个 comsumeQueue 文件，改文件不存数据，只存索引信息，如存一些偏移量等，在消费时可以更快的定位到commit文件中的数据，随后去消费里面的数据，并且可以通过Tag标签去过滤消息

在这里插入图片描述

除了上面两个文件之外，还有维护一个index文件，内部会记录Commit日志的偏移量等

2.6，死信队列

当broker和consumer之间重试16次之后，消息依旧没能被消费，那么消息就会加入到死信队列中。一个私信队列会对应一个消费者组，其perm对应的权限值为2。死信队列的消息默认不会被消费，而是需要开发者自身去处理该队列中的数据。

并且私信队列中消息的有效期也是三天，可以在broker.conf配置文件设置，当超过这个时间，消息都会被删除。

2.7，消息的幂等性

在rocketmq中，消息的幂等性为 at least once 至少被消费一次。官方建议使用里面的key去做幂等性，key是一个唯一值，就是一个唯一id。除了这些方式之外，在分布式场景下，也可以开率分布式锁这些做幂等。

3，rocketmq高性能的设计

3.1，零拷贝技术

零拷贝是操作系统层面的一种加速文件读写的操作机制，可以通过这种零拷贝的形式提升IO操作的性能。在java中，主要是通过这种 fileChannel 的方式实现零拷贝，其具体实现由 mmap和sendFile 两种形式

以一个文件的拷贝为例，正常来说，需要从用户态切换到内核态，然后再去执行io操作，并且需要通过cpu的调度，从磁盘中将文件加载到内存，再加载到网卡。而在引入零拷贝技术之后，可以让channel代替cpu去做io操作，cpu只需要给channel对应的权限即可。在操作系统层面，就是利用这种DMA技术，将原来四次的cpu拷贝，变成了两次，从而提高整体性能。

3.2，顺序写技术

本人在写过一个顺序io和随机io的文章:https://zhenghuisheng.blog.csdn.net/article/details/129080088 ，顺序写可以减少磁头的移动去寻址，不管是插入数据还是查询数据，都可以提升其性能，并且可以减少磁盘的碎片。

3.3，刷盘机制

rocketmq为了保证数据的安全性，在broker中会持久化到commitlog中，在刷盘时有两种方式，分别是：同步刷盘和异步刷盘 ，默认采用的刷盘机制时异步刷盘

flushDiskType=ASYNC_FLUSH

【RocketMq系列-02】RocketMq的架构解析和高性能设计

RocketMq系列整体栏目内容链接地址【一】RocketMq安装和基本概念https://zhenghuisheng.blog.csdn.net/article/details/134486709【二】RocketMq的架构解析和高性能设计/font>https://zhenghuisheng.blog.csdn.net/article/details/134559514 RocketMq的架构解析和高性能设…...

编程日记 2023/11/24 4:57:29

【数据结构/C++】线性表_单链表的基本操作

#include <iostream> using namespace std; // 2. 单链表 // ElemType 的定义 typedef int ElemType; typedef struct LNode {ElemType data;struct LNode *next; } LNode, *LinkList; // 初始化单链表 bool InitList(LinkList &L) {L (LNode *)malloc(sizeof(LNode…...

编程日记 2023/11/24 4:56:27

flink1.13.6版本的应用程序（maven版）

问题想要一个指定flink版本的java计算任务hello world最简工程。解决 mvn archetype:generate \-DarchetypeGroupIdorg.apache.flink \-DarchetypeArtifactIdflink-quickstart-java \-DarchetypeVersion1.13.6这里直接使用官方mave模版工程，指…...

编程日记 2023/11/24 4:55:25

深度学习之四（循环神经网络Recurrent Neural Networks，RNNs）

概念循环神经网络（Recurrent Neural Networks，RNNs）是一类专门用于处理序列数据的神经网络，它在处理时考虑了序列数据的顺序和上下文信息。RNNs 在自然语言处理、时间序列分析、语音识别等领域得到广泛应用。 1. 基本结构： RNN 的基本结构包含一个或多个循环单元，每个…...

编程日记 2023/11/24 4:54:24

【论文精读】HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face

HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face 前言Abstract1 Introduction2 Related Works3 HuggingGPT3.1 Task PlanningSpecification-based InstructionDemonstration-based Parsing 3.2 Model SelectionIn-context Task-model Assignment 3…...

编程日记 2023/11/24 4:53:22

安装gitlab

安装gitlab 环境关闭防火墙以及selinux，起码4核8G 内存至少 3G 不然启动不了下载环境 gitlab官网：GitLab下载安装_GitLab最新中文基础版下载安装-极狐GitLab rpm包下载地址： [Yum - Nexus Repository Manager (gitlab.cn)](https://pack…...

编程日记 2023/11/24 4:52:20

Nginx模块开发之http handler实现流量统计（1）

文章目录一、handler简介二、Nginx handler模块开发2.1、示例代码2.2、编写config文件2.3、编译模块到Nginx源码中2.4、修改conf文件2.5、执行效果三、Nginx的热更新总结一、handler简介 Handler模块就是接受来自客户端的请求并产生输出的模块。配置文件中使用location指令…...

编程日记 2023/11/24 4:50:18

JSP编写自己的第一个WebServlet实现客户端与服务端交互

我们在项目中找到java目录下面有一个包路径然后我们在下面创建一个类我这里叫 TransmissionTest 当然名字是顺便取的参考代码如下 package com.example.dom;import javax.servlet.ServletException; import javax.servlet.annotation.WebServlet; import javax.servlet…...

编程日记 2023/11/24 4:49:16

三、Keil安装芯片包、下载固件库、建立STM32工程模板

目录一、首先在Keil软件上安装好芯片包二、下载官方固件库三、建立基于固件库的Keil5工程模板一、首先在Keil软件上安装好芯片包 STM32有很多系列的芯片，我们平常用的最多的是STM32F1系列的，因此安装F1系列的芯片包在我们初学时，只按照…...

编程日记 2023/11/24 4:45:12

微信相框M1-03花屏抢救照片数据

故障现象相册屏幕花屏，无法显示，拔掉电源黑屏（内部自带锂电池的） 问题排查开始怀疑屏幕故障，拆开看到内部，发现是锂电池时间长鼓包后，顶到PCB，PCB板已经翘曲了，导致花…...

编程日记 2023/11/24 4:44:11

小程序可拖拽按钮

你有没有遇到过在页面中有一个固定在某个位置的按钮，永远的挡住了你想要看的区域？ 在小程序的列表页面中，常常会有一个提报的入口固定在右下角，如果这个按钮不可拖动的话，可能会挡住下面的事件，让用户操作起…...

编程日记 2023/11/24 4:43:10

ARM裸机-19（NandFlash和iNand）

1、NandFlash的接口 1.1、Nand的型号与命名 (1)、Nand的型号命名都有含义，就拿K9F2G08来示例分析一下：K9F表示是三星公司的NandFlash系列。2G表示Nand的大小是2Gbit (256MB)。08表示Nand是8位的 (8位就是数据线有8根)。 (2)、Nand命名中可以看出&#x…...

编程日记 2023/11/24 4:42:08

机器学习/sklearn笔记：MeanShift

1 算法介绍一种基于质心的算法通过更新候选质心使其成为给定区域内点的均值候选质心的位置是通过一种称为“爬山”技术迭代调整的，该技术找到估计的概率密度的局部最大值 1.1 基本形式给定d维空间的n个数据点集X，那么对于空间中的任意点x的均值漂移…...

编程日记 2023/11/24 4:41:06

opencv-简单图像处理

图像像素存储形式　对于只有黑白颜色的灰度图，为单通道，一个像素块对应矩阵中一个数字，数值为0到255, 其中0表示最暗（黑色） ，255表示最亮（白色） 对于采用RGB模式的彩色图片&#…...

编程日记 2023/11/24 4:39:04

Linux(Kali\Ubuntu\CentOS\arm-Linux)安装Powershell

文章目录 Linux(Kali\Ubuntu\CentOS\arm-Linux)安装Powershell启动PowershellKaliUbuntuCentOSarm-Linux离线安装参考链接 Linux(Kali\Ubuntu\CentOS\arm-Linux)安装Powershell 启动Powershell pwshKali apt update && apt -y install powershellUbuntu # 更新包列…...

编程日记 2023/11/24 4:38:04

ubuntu20.04安装多版本cuda,切换版本

1. 安装cuda toolkit: 下载网站 https://developer.nvidia.com/cuda-11.3.0-download-archive 选择版本，这里选择11.3 wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run给cuda权限: chmod x…...

编程日记 2023/11/24 4:37:03

网络渗透测试（wireshark 抓取QQ图片）

1.打开wireshark 这里我用的wifi连接所以点开wifi就好打开wifi之后就开始在本机上进行抓包了我们先给我们的QQ发送一张图片，用自己的手机发送给电脑然后点击左上角的正方形，停止捕获抓包 QQ的关键词是oicq，所以我们直接找打开oicq …...

编程日记 2023/11/24 4:36:02

gRPC之gRPC负载均衡(客户端负载均衡)(etcd)

1、gRPC负载均衡(客户端负载均衡)(etcd) 本篇将基于etcd的服务发现前提下，介绍如何实现gRPC客户端负载均衡。 1.1 gRPC负载均衡 gRPC官方文档提供了关于gRPC负载均衡方案Load Balancing in gRPC https://github.com/grpc/grpc/blob/master/doc/load-balancing.m…...

编程日记 2023/11/24 4:35:00

语音识别技术paddlespeech的安装和使用

PaddleSpeech 介绍 PaddleSpeech是百度飞桨（PaddlePaddle）开源深度学习平台的其中一个项目，它基于飞桨的语音方向模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型。PaddleSpe…...

编程日记 2023/11/24 4:33:59

【机器学习】034_多层感知机Part.2_从零实现多层感知机

一、解决XOR问题 1. 回顾XOR问题： 如图，如何对XOR面进行分割以划分四个输入对应的输出呢？ 思路：采用两个分类器分类，每次分出两个输入 ，再借助这两个分类从而分出。即采用同或运算，当两…...

编程日记 2023/11/24 4:31:56

企业数字化转型智能客服系统源码，降本增效+微信集成+对话分析

温馨提示：文末有资源获取方式最近走访了几家做电商和本地生活的朋友，大家不约而同提到一个痛点：客服成本太高，响应速度又跟不上。白天人工客服忙不过来，晚上和节假日又没人值班。客户发一张产品问题图，客服…...

编程新知 2026/4/28 1:51:43

40天极限通关｜6月PMP“末班车”呼啸而来，最后冲刺指南请收好

大家好，我是那个考前42天、书都没拆封就极限上岸的大头。今天是4月27日。说个吓人的事实——距离6月14日PMP考试，只剩40天出头了。再掰开算一算，五一假期还想出去玩？去掉假期、去掉工作日加班、去掉你必须休息回血的时间&#xff…...

编程新知 2026/4/28 1:49:34

动态切换标题图片的顶部边距：基于导航栏状态的 CSS 样式控制

本文介绍如何通过 JavaScript 动态检测导航栏是否启用 navbar-fixed 类，并据此为 .title-img 元素添加或移除 margin-top: 20%，实现响应式布局适配。核心在于精准监听类名变化并执行样式切换，避免硬编码与冗余逻辑。本文介绍如何通过 j…...

编程新知 2026/4/28 1:09:59

【末轮截稿、快速发表、SPIE出版】第六届中国膜计算论坛暨2026年人工智能、大数据与电气自动化国际学术会议（CWMCAIBDEA 2026）

第六届中国膜计算论坛暨2026年人工智能、大数据与电气自动化国际学术会议（CWMC&AIBDE 2026）拟定于2026年5月12-14日在中国重庆举行。本次会议由重庆城市科技学院主办，重庆城市科技学院人工智能与大数据学院、重庆城市科技学院电气工程与智…...

编程新知 2026/4/28 1:05:54

PoseFormerV2 训练完全指南：理论与实战

PoseFormerV2 训练完全指南：理论与实战目录引言：从 PoseFormer 到 PoseFormerV2 PoseFormerV2 核心技术原理环境配置与项目结构数据集准备与预处理论文基线精度复现目标精度 9.0 的优化策略模型架构的定制与实现训练配置的精细调优完整训练代码详解评估与验证常见…...

编程新知 2026/4/28 0:55:42

【2026最新】五一假期远程办公神器：3分钟搞定企业内网接入的终极指南

五一假期倒计时！远程办公必备神器EasyConnect全攻略随着五一假期临近，你是否也在盘算着如何优雅地提前离开办公室，或是晚几天再回到工位？别急！今天要介绍的这款企业级远程接入神器EasyConnect，将让你实现…...

编程新知 2026/4/28 0:02:45

Salesforce智能体框架：基于LLM工具调用实现企业CRM自动化

1. 项目概述：一个面向Salesforce生态的智能体框架最近在探索企业级AI应用落地时，我深度体验了Synter-Media-AI团队开源的salesforce-agent项目。这并非一个简单的脚本或工具，而是一个旨在将大型语言模型（LLM）能力深度、…...

编程新知 2026/4/27 23:04:44

告别软件模拟！用STC8H的硬件PWM同时驱动多个SG90舵机做个小机械臂

用STC8H硬件PWM构建多舵机协同控制系统在机器人开发领域，多关节协同控制一直是创客们热衷探索的方向。传统基于软件PWM的方案往往面临资源占用高、时序精度不足等问题，而STC8H系列单片机内置的硬件PWM模块为这些问题提供了优雅的解决方案。本文将深入探…...

编程新知 2026/4/27 22:33:47

如何用CompressO轻松压缩视频和图片：免费开源跨平台终极指南

如何用CompressO轻松压缩视频和图片：免费开源跨平台终极指南【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mirrors/co/compr…...

编程新知 2026/4/27 21:52:28

智能桌面革命：3步构建高效数字工作空间的完整指南

智能桌面革命：3步构建高效数字工作空间的完整指南【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 你是否每天在混乱的桌面图标中寻找文件，浪费宝贵的几…...

编程新知 2026/4/27 21:50:27

RocketMq的架构解析和高性能设计

一，RocketMq的架构解析和高性能设计

2，rocketmq底层原理

2.1，事务的底层实现

2.2，如何保证消息不丢失

2.3，rocketmq积压问题

2.4，如何保证顺序消费

2.5，rocketmq的持久化

2.6，死信队列

2.7，消息的幂等性

3，rocketmq高性能的设计

3.1，零拷贝技术

3.2，顺序写技术

3.3，刷盘机制

相关文章：