RocketMQ 可观测性最佳实践
RocketMQ 概述
Apache RocketMQ 是一个开源的分布式消息传递和流处理平台,由阿里巴巴团队最初开发并捐赠给 Apache 软件基金会。它主要用于处理大规模消息的发送和接收,支持高吞吐量、可扩展性强且具有高可用性的消息服务。
RocketMQ 的优势有以下几点:
- 高性能: RocketMQ 能够支持每秒处理百万级消息的高吞吐量,满足企业级应用的需求。
- 高可用性: 支持故障转移和消息冗余,保证消息不丢失,实现99.999%的高可用性。
- 可扩展性: 结构支持水平扩展,无需停机即可增加节点,极大地提高了系统的灵活性和可扩展性。
- 多语言客户端支持: 除了Java,RocketMQ 还提供了 C++、Python、Go 等多种语言的客户端,满足不同开发需求。
- 易于监控和维护: 提供了丰富的监控指标和管理工具,帮助运维人员轻松管理和监控消息系统的状态。
RocketMQ 是一个功能强大的消息中间件,适用于需要高可靠性、高性能和高可扩展性的现代互联网、金融和电信等领域的企业级应用。
观测云
部署 DataKit
DataKit 是一个开源的、跨平台的数据收集和监控工具,由观测云开发并维护。它旨在帮助用户收集、处理和分析各种数据源,如日志、指标和事件,以便进行有效的监控和故障排查。DataKit 支持多种数据输入和输出格式,可以轻松集成到现有的监控系统中。
登录观测云控制台,在「集成」 - 「DataKit」选择对应安装方式,当前采用 Linux 主机部署 DataKit。

安装 RocketMQ Exporter
通过 RocketMQ Exporter 可以采集 RocketMQ 的指标信息并对外暴露。
- 拉取 rocketmq-exporter
git clone https://github.com/apache/rocketmq-exporter.git
进入安装目录
cd rocketmq-exporter/
- 构建安装包(2选1)
1)构建 jar 包方式
mvn clean package
构建完成,进入 target 目录
cd target
启动 jar 包 (替换命令行中 nameserverip 地址)
nohup java -jar target/rocketmq-exporter-0.0.2-SNAPSHOT.jar --rocketmq.config.namesrvAddr=nameserverip:9876 &
2)构建 Docker 镜像方式
mvn package -Dmaven.test.skip=true docker:build
使用镜像启动 Docker (替换命令行中 nameserverip 地址)
docker run -d --net="host" --name rocketmq-exporter -p 5557:5557 docker.io/rocketmq-exporter --rocketmq.config.namesrvAddr=nameserverip:9876
- 测试 rocketmq-exporter 是否正常
curl http://127.0.0.1:5557/metrics
采集 RocketMQ 指标
RocketMQ Exporter 暴露指标端口为:5557,可以直接通过 prom 采集器进行采集。进入 DataKit 安装目录 /usr/local/datakit/conf.d ,复制 prom 目录下的配置文件并命名为 rocketmq.conf 。 示例如下:
开启 DataKit Prometheus 插件,复制 sample 文件
cd /usr/local/datakit/conf.d/prom
cp prom.conf.sample rocketmq.conf
修改配置文件 rocketmq.conf
[[inputs.prom]]urls = ["http://127.0.0.1:5557/metrics"]ignore_req_err = falsesource = "rocketmq"
# metric_types 需要选择空,rocketmq-exporter 没有指定数据类型metric_types = []interval = "60s"
重启 DataKit
datakit service restart
监控视图
登录观测云控制台,点击「场景」 -「新建仪表板」,输入 “RocketMQ”, 选择“RocketMQ 监控视图”,点击“确定”。


关键指标
| 序号 | 指标名称 | 指标描述 |
|---|---|---|
| 1 | rocketmq_broker_tps | broker每秒生产消息数量 |
| 2 | rocketmq_broker_qps | broker每秒消费消息数量 |
| 3 | rocketmq_producer_tps | 某个topic每秒生产的消息数量 |
| 4 | rocketmq_producer_message_size | 某个生产者发送消息的平均消息大小(字节) |
| 5 | rocketmq_producer_offset | 某个topic的生产消息的进度 |
| 6 | rocketmq_consumer_tps | 某个消费组每秒消费的消息数量 |
| 7 | rocketmq_consumer_message_size | 某个消费者拉取消息的平均消息大小(字节) |
| 8 | rocketmq_consumer_offset | 某个消费组的消费消息的进度 |
| 9 | rocketmq_group_get_latency_by_storetime | 某个消费组的消费延时时间 |
| 10 | rocketmq_group_diff | 消费组的消息积压量 |
rocketmq_broker_tps ( broker 每秒生产消息数量)
- 这个指标显示了每秒中 Broker 接收的消息数量,是衡量消息生产活动高低的直接指标。监控这一指标可以帮助运维团队了解系统当前的负载能力和处理能力。
rocketmq_broker_qps ( broker 每秒消费消息数量)
- 相对于生产消息数量,这个指标显示的是 Broker 每秒处理的消费请求数量。这不仅反映了消费者的活跃程度,还可以用来评估 Broker 处理消费请求的效率。
rocketmq_producer_tps (某个 topic 每秒生产的消息数量)
- 特定 Topic 的生产速率能够帮助运维团队识别特定业务流的压力情况。通过监控这一指标,可以及时发现某个业务线可能存在的问题或者性能瓶颈。
rocketmq_consumer_tps (某个消费组每秒消费的消息数量)
- 这个指标展示了消费组的消费能力,通过监控可以了解消费组的处理效率和及时性。若消费速度跟不上生产速度,可能需要扩展消费者数量或优化消费逻辑。
rocketmq_group_diff (消费组堆积量指标)
- 这个指标展示了消费组的消息积压量,通过监控可以了解某个消费组对指定 Topic 的未消费消息数量,监控消费组的消费能力是否正常。
rocketmq_group_get_latency_by_storetime (某个消费组的消费延时时间)
- 这个指标显示了消息从存储到被消费组消费的延时。它是衡量消息系统响应能力的关键指标,对于要求实时性较高的应用尤其重要。
监控器
1)rocketmq_broker_tps ( broker 每秒生产消息数量)
阈值建议: 如果您的系统通常运行在每秒1000条消息,可以设置一个上限阈值为1500条,下限阈值为500条。
监控告警:
- 高阈值告警: 如果 TPS 超过1500条/秒,发送告警,因为可能出现生产过载。
- 低阈值告警: 如果 TPS 低于500条/秒,发送告警,可能存在生产中断或性能下降。

2)rocketmq_group_diff (消费组堆积量指标)
阈值建议:根据实际业务的吞吐量和消息处理需求设置阈值告警。

3)rocketmq_consumer_tps (某个消费组每秒消费的消息数量)
阈值建议: 如果正常消费速度为每秒800条,可以设置一个阈值下限为400条。
监控告警:
- 低阈值告警: 如果消费 TPS 低于400条/秒,发出告警。这可能意味着消费者处理能力不足或存在系统故障。

4)rocketmq_group_get_latency_by_storetime (某个消费组的消费延时时间)
阈值建议: 如果延时通常在5秒以内,可以设置告警阈值为10秒。
监控告警:如果延时超过10秒,发送告警。高延时可能影响业务操作的实时性,需检查并解决问题。

相关文章:
RocketMQ 可观测性最佳实践
RocketMQ 概述 Apache RocketMQ 是一个开源的分布式消息传递和流处理平台,由阿里巴巴团队最初开发并捐赠给 Apache 软件基金会。它主要用于处理大规模消息的发送和接收,支持高吞吐量、可扩展性强且具有高可用性的消息服务。 RocketMQ 的优势有以下几点…...
P9420 [蓝桥杯 2023 国 B] 子 2023
P9420 [蓝桥杯 2023 国 B] 子 2023 题目 分析代码 题目 分析 刚拿到这道题,我大脑简单算了一下,这个值太大了,直观感觉就很难!! 但是,你仔仔细细的一看,先从最简单的第一步入手,再…...
OpenAI开放Deep Research权限,AI智能体大战升级,DeepSeek与Claude迎来新对决
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…...
学习笔记04——JMM内存模型
一、Java内存模型(JMM)是什么? Java内存模型(Java Memory Model, JMM)是Java多线程编程中共享内存的访问规则,定义了线程如何与主内存(Main Memory)和工作内存(Work Mem…...
将VsCode变得顺手好用(1
目录 设置中文 配置调试功能 提效和增强相关插件 主题和图标相关插件 创建js文件 设置中文 打开【拓展】 输入【Chinese】 下载完成后重启Vs即可变为中文 配置调试功能 在随便一个位置新建一个文件夹,用于放置调试文件以及你未来写的代码,随便命名但…...
Fisher信息矩阵(Fisher Information Matrix,简称FIM)
Fisher信息矩阵简介 Fisher信息矩阵(Fisher Information Matrix,简称FIM)是统计学和信息理论中的一个重要概念,广泛应用于参数估计、统计推断和机器学习领域。它以统计学家罗纳德费希尔(Ronald Fisher)的名…...
Vue2+Three.js加载并展示一个三维模型(提供Gitee源码)
目录 一、案例截图 二、安装Three.js 三、代码实现 四、Gitee源码 一、案例截图 二、安装Three.js npm install three 三、代码实现 模型资源我是放在public文件夹下面的: 完整代码: <template><div><div ref"container&qu…...
Linux红帽:RHCSA认证知识讲解(三)Linux基础指令与Vim编辑器的使用
Linux红帽:RHCSA认证知识讲解(三)Linux基础指令与Vim编辑器的使用 前言一、Linux基础指令二、Linux 文件系统层次结构概念三、通过路径指定文件四、使用命令行工具管理文件五、Vim 的安装方式六、Vim 的操作模式七、红帽建议掌握的 Vim 键和命…...
python读取sqlite温度数据,并画出折线图
需求: 在Windows下请用python画出折线图,x轴是时间,y轴是温度temperature 和体感温度feels_like_temperature 。可以选择县市近1小时,近1天,近1个月的。sqlite文件weather_data.db当前目录下,建表结构如下…...
《论企业集成平台的理解与应用》审题技巧 - 系统架构设计师
企业集成平台的理解与应用——论文写作框架 一、考点概述 本论题“企业集成平台的理解与应用”主要考察的是计算机软件测试工程师对于企业集成平台(EIP)的深入理解以及在实际项目中的应用能力。论题涵盖了以下几个核心内容: 首先ÿ…...
UE Python笔记
插件 官方 商城 Python Editorhttps://www.fab.com/listings/f4c99ba0-1a86-4f6a-b19d-2fd13f15961b GitHUB 好像只更新到了2020年4.2x的版本。可能有大佬改了5.x的版本。也希望分享给我一份。谢谢 https://github.com/20tab/UnrealEnginePython 学习笔记 网上教程一大堆。…...
使用django调用deepseek api,搭建ai网站
一、deepseek简介 DeepSeek是一家人工智能公司,专注于开发先进的人工智能模型和技术。以下是关于DeepSeek的一些详细介绍: 1.公司背景 DeepSeek由杭州深度求索人工智能基础技术研究有限公司开发,致力于通过创新的技术和算法,推…...
YOLOv12 ——基于卷积神经网络的快速推理速度与注意力机制带来的增强性能结合
概述 实时目标检测对于许多实际应用来说已经变得至关重要,而Ultralytics公司开发的YOLO(You Only Look Once,只看一次)系列一直是最先进的模型系列,在速度和准确性之间提供了稳健的平衡。注意力机制的低效阻碍了它们在…...
两台互通的服务器使用Docker部署一主两从MySQL8.0.35
文章目录 1. 使用Docker Overlay网络(需Swarm模式)在服务器1(172.25.0.19)上:在服务器2(172.25.0.20)上:创建 overlay 网络(172.25.0.19): 2. 部署…...
Java23种设计模式案例
目录 一、概述 二、创建型模式 (Creational Patterns) 单例模式 (Singleton Pattern) 工厂方法模式 (Factory Method Pattern) 抽象工厂模式 (Abstract Factory Pattern) 建造者模式 (Builder Pattern) 原型模式 (Prototype Pattern) 三、结构型模式 (Structu…...
stm32hal库寻迹+蓝牙智能车(STM32F103C8T6)
简介: 这个小车的芯片是STM32F103C8T6,其他的芯片也可以照猫画虎,基本配置差不多,要注意的就是,管脚复用,管脚的特殊功能,(这点不用担心,hal库每个管脚的功能都会给你罗列,很方便的.)由于我做的比较简单,只是用到了几个简单外设.主要是由带霍尔编码器电机的车模,电机…...
JavaScript知识点4
1.解释一下这段JavaScript代码 var fruits ["Apple", "Orange", "Apple", "Mango"]; var a fruits.indexOf("Apple",-1); console.log("index"a); 输出的a值为-1,indexOf的第二个参数是-1…...
形式化数学编程在AI医疗中的探索路径分析
一、引言 1.1 研究背景与意义 在数字化时代,形式化数学编程和 AI 形式化医疗作为前沿领域,正逐渐改变着我们的生活和医疗模式。形式化数学编程是一种运用数学逻辑和严格的形式化语言来描述和验证程序的技术,它通过数学的精确性和逻辑性,确保程序的正确性和可靠性。在软件…...
QT 引入Quazip和Zlib源码工程到项目中,无需编译成库,跨平台,加密压缩,带有压缩进度
前言 最近在做项目时遇到一个需求,需要将升级的文件压缩成zip,再进行传输; 通过网络调研,有许多方式可以实现,例如QT私有模块的ZipReader、QZipWriter;或者第三方库zlib或者libzip或者quazip等࿱…...
Ubuntu 安装 Nginx并配置反向代理
Ubuntu版本:Ubuntu 24.04.2 LTS 一、安装Nginx 更新系统软件包 安装前需确保系统处于最新状态,避免依赖冲突 sudo apt update && sudo apt upgrade -y 安装Nginx主程序 Ubuntu官方仓库已包含稳定版Nginx,直接安装即可 sudo…...
DeepSeek代码质量评估实战手册:7步完成从混沌到可度量的质变跃迁
更多请点击: https://kaifayun.com 第一章:DeepSeek代码质量评估的底层逻辑与核心价值 DeepSeek代码质量评估并非简单地统计行数或检测语法错误,而是基于多维语义理解构建的推理系统。其底层逻辑融合了静态分析、符号执行与大语言模型生成式…...
从入门到上岗,Java+AI 复合型人才养成攻略
当下编程行业格局正在悄然改变,纯 Java 后端岗位内卷日趋严重,薪资增长逐步放缓;纯粹的 AI 算法岗门槛居高不下,对学历、数理功底要求严苛,普通开发者很难入局。 而Java+AI 复合型开发顺势成为行业刚需岗位,既依托成熟的 Java 体系承接业务开发,又能融入人工智能技术实…...
亚马逊 Rufus 关停,Alexa 正式上线:卖家必须读懂的6条新规则
2026年5月13日,亚马逊官方正式宣布,下线Rufus,推出全新AI购物助手:Alexa for Shopping。但是,这不是粗暴地直接下线 Rufus,而是一次购物AI底层架构的重组 —— 将 Rufus 的商品专长 与 Alexa的用户理解力&a…...
第3篇:系统透视——信息部门如何构建“税务友好型”IT架构
本篇导读:如果你是信息总监或IT负责人,请通读全文,尤其是“系统合规设计的三必须”和“现场检查SOP”;如果你是财税人员,请重点阅读“研产供销全链条的系统对接要求”和“与IT部门的协作要点”;如果你是老板…...
Log4Shell漏洞深度解析:Spring Boot日志注入原理与四层修复方案
1. 这个漏洞不是“远程执行代码”那么简单——它是一次对Java生态信任链的系统性击穿Log4j CVE-2021-44228,业内常简称为“Log4Shell”,2021年12月爆发时,我正在给一家金融客户的Spring Boot微服务集群做灰度发布前的安全加固。凌晨三点收到告…...
保姆级教程:手把手教你为ESXi 6.7配置主板BIOS(VT-x/VT-d/AES全开)
从零开始:ESXi 6.7主板BIOS设置完全指南当你第一次接触企业级虚拟化平台时,那种既兴奋又忐忑的心情我完全理解。作为过来人,我清楚地记得自己第一次为ESXi配置BIOS时的迷茫——那些专业术语像天书一样,生怕设置错误导致服务器无法…...
理想二极管控制器:用MOSFET实现毫伏级压降的电源管理方案
1. 理想二极管控制器:告别传统二极管的压降损耗 在电源设计、电池保护、太阳能板并联这些领域里,二极管是个再常见不过的元件。我们用它来防反接、做整流、实现“或”逻辑供电,几乎不假思索。但如果你设计过一个需要处理大电流、低电压的系统…...
企业级Veo 2提示词治理框架(含合规校验/版本回溯/效果归因三模块)——仅限首批500名开发者开放》
更多请点击: https://intelliparadigm.com 第一章:Veo 2提示词治理框架的核心定位与演进逻辑 Veo 2提示词治理框架并非单纯的技术工具升级,而是面向AIGC生产环境规模化、合规化与可审计化需求的战略性基础设施重构。其核心定位在于将离散、经…...
对比直接调用厂商API使用Taotoken聚合调用的延迟体感差异
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比直接调用厂商API使用Taotoken聚合调用的延迟体感差异 在将应用从直接调用单一厂商的模型API迁移到Taotoken平台后,…...
yuzu模拟器:在PC上完美运行Switch游戏的终极解决方案
yuzu模拟器:在PC上完美运行Switch游戏的终极解决方案 【免费下载链接】yuzu 任天堂 Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/yu/yuzu 想要在电脑上体验任天堂Switch游戏的魅力吗?yuzu模拟器作为目前最成熟的开源Switch模拟…...
