Spring Boot微服务架构(八):开发之初就引入APM工具监控
使用 APM(Application Performance Management)工具监控 Spring Boot 应用,可以帮助开发者实时追踪性能瓶颈、分析调用链路、监控资源使用情况,并快速定位故障。以下是详细的步骤和常用工具的选择指南:
一、常用 APM 工具及特点
工具名称 | 类型 | 特点 |
---|---|---|
SkyWalking | 分布式追踪 + 指标监控 | 开源、支持 Java Agent、自动链路追踪、可视化仪表盘 |
Zipkin | 分布式追踪 | 轻量级、需手动埋点、适合简单场景 |
Prometheus | 指标监控 | 多维数据模型、灵活告警、结合 Grafana 可视化 |
Elastic APM | 全链路监控 | 基于 OpenTelemetry,集成日志、指标、链路追踪,适合 Elastic 生态 |
New Relic | 商业全栈监控 | 功能全面、支持多语言、商业版功能强大 |
Datadog | 云原生监控 | 支持 APM、基础设施监控、日志,适合混合云环境 |
二、监控 Spring Boot 的核心步骤
1. 指标监控(Metrics)
目标:监控 JVM、HTTP 请求、数据库连接池等指标。
工具:Spring Boot Actuator + Prometheus + Grafana
步骤:
-
添加依赖(
pom.xml
):<!-- Actuator 暴露指标 --> <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId> </dependency> <!-- Micrometer Prometheus 导出器 --> <dependency><groupId>io.micrometer</groupId><artifactId>micrometer-registry-prometheus</artifactId> </dependency>
-
配置
application.yml
:management:endpoints:web:exposure:include: prometheus, health # 暴露 Prometheus 和健康检查端点metrics:export:prometheus:enabled: true
-
启动应用,访问
http://localhost:8080/actuator/prometheus
,可以看到暴露的指标数据。 -
部署 Prometheus:配置抓取目标(指向 Spring Boot 的
/actuator/prometheus
端点)。 -
使用 Grafana 可视化:导入 Spring Boot 的仪表盘模板(如 Grafana Spring Boot Dashboard)。
2. 分布式链路追踪(Tracing)
目标:追踪微服务间的调用链路,分析请求耗时。
工具:SkyWalking、Zipkin、Elastic APM
以 SkyWalking 为例:
- 下载 SkyWalking Agent:从 官网 获取 JAR 包。
- 启动 Spring Boot 应用时附加 Agent:
java -javaagent:/path/to/skywalking-agent.jar \-Dskywalking.agent.service_name=my-spring-boot-app \-Dskywalking.collector.backend_service=127.0.0.1:11800 \-jar your-application.jar
- 访问 SkyWalking UI(默认
http://localhost:8080
),查看链路追踪和性能分析。
3. 日志与错误监控
目标:关联日志与链路追踪,捕获异常和错误。
工具:ELK Stack(Elasticsearch + Logstash + Kibana)、Loki + Grafana
步骤:
- 在 Spring Boot 中集成 Logback 或 Log4j2,添加 Trace ID 到日志中(通过 SkyWalking 或 Sleuth 自动注入)。
- 配置日志输出到 Elasticsearch/Loki:使用 Filebeat 或 Fluentd 收集日志。
- 通过 Kibana/Loki Dashboard 分析日志,结合链路追踪快速定位问题。
4. 商业工具集成(可选)
New Relic:
- 添加 Java Agent:下载 New Relic Java Agent。
- 配置
newrelic.yml
:设置 License Key 和应用名称。 - 启动应用:通过
-javaagent
参数加载 Agent。 - 在 New Relic 控制台查看应用性能数据。
三、关键监控指标
- JVM 指标:堆内存、GC 时间、线程状态。
- HTTP 请求:响应时间、错误率、QPS。
- 数据库:慢查询、连接池使用率。
- 外部服务调用:Feign/RestTemplate 的耗时和成功率。
- 系统资源:CPU、内存、磁盘 I/O。
四、最佳实践
- 合理配置采样率:避免链路追踪数据量过大(如 Zipkin 可设置
spring.sleuth.sampler.probability=0.1
)。 - 设置告警规则:在 Prometheus 或 Grafana 中配置阈值告警(如 HTTP 5xx 错误率 > 1%)。
- 结合日志与链路:通过 Trace ID 关联日志和调用链,快速定位问题根源。
- 定期优化:根据监控数据优化慢查询、调整 JVM 参数、扩容资源。
五、工具选择建议
- 简单场景:Spring Boot Actuator + Prometheus + Grafana(免费、轻量)。
- 分布式追踪:SkyWalking(国产开源,社区活跃)或 Zipkin(轻量级)。
- 全栈监控:Elastic APM(集成日志、指标、链路)或 New Relic(商业级功能)。
- 云原生环境:Datadog 或 Prometheus + Grafana(支持 Kubernetes 监控)。
通过以上步骤,可以实现对 Spring Boot 应用的全方位监控,快速发现性能瓶颈并提升系统稳定性。
相关文章:

Spring Boot微服务架构(八):开发之初就引入APM工具监控
使用 APM(Application Performance Management)工具监控 Spring Boot 应用,可以帮助开发者实时追踪性能瓶颈、分析调用链路、监控资源使用情况,并快速定位故障。以下是详细的步骤和常用工具的选择指南: 一、常用 A…...

大规模真实场景 WiFi 感知基准数据集
一段话总结 本文提出CSI-Bench,首个大规模真实场景WiFi感知基准数据集,覆盖26个室内环境、35名用户、16种商用设备,包含461小时有效数据,支持跌倒检测、呼吸监测、定位、运动源识别等单任务及用户身份、活动、 proximity联合标注的多任务学习。通过标准化评估协议和基线模…...

Python实现HPSO-TVAC优化算法优化支持向量机SVC分类模型项目实战
说明:这是一个机器学习实战项目(附带数据代码文档),如需数据代码文档可以直接到文章最后关注获取。 1.项目背景 在当今数据驱动的时代,支持向量机(SVM)作为一种经典的机器学习算法,…...

ck-editor5的研究 (3):初步使用 CKEditor5 的事件系统和API
前言 在上一篇文章中—— ck-editor5的研究(2):对 CKEditor5 进行设计,并封装成一个可用的 vue 组件 ,我已经把 CKEditor5 封装成了一个通用vue组件,并且成功在nuxt中运行,并具备一定的通用性&…...
使用ReactNative加载HarmonyOS Svga动画
这是一款使用ReactNative 加载HarmonyOS Svga动画的播放器插件 三端Svga动画统一使用点击这里 版本:v1.1.5 react-native-ohos-svgaplayer [!TIP] Github 地址 安装与使用 npm npm install react-native-ohos-svgaplayer yarn yarn add react-native-ohos-svgaplayer下面…...

WPS快速排版
论文包括(按顺序):封面(含题目)、摘 要、关键词、Abstract(英文摘要)、Keywords、目录、正文、参考文献、在读期间发表的学术论文及研究成果,致 谢 题目(黑小一加粗&…...

Java实现命令行图书管理系统(附完整源码)
一、项目概述 本文将介绍如何使用Java实现一个基于命令行的图书管理系统。系统支持管理员和普通用户两种角色,提供图书的增删改查、借阅归还等功能。项目采用面向对象设计原则,代码结构清晰,适合Java初学者学习。 二、系统功能架构 graph T…...
使用Docker-NVIDIA-GPU开发配置:解决 Docker NVIDIA 运行时错误方法
问题描述 运行 Docker 命令时,系统提示 docker: Error response from daemon: unknown or invalid runtime name: nvidia,表明 Docker 无法识别 NVIDIA 运行时。这一错误通常出现在使用 --runtime=nvidia 和 --gpus 参数时,意味着 NVIDIA 容器运行时未正确安装或配置。NVID…...
如何更好的理解云计算和云原生?
本文介绍什么是云计算、什么是云原生、怎么理解云相关概念,如有问题,欢迎指正。 一、云计算 定义:云计算是通过互联网(即“云”)按需提供计算资源(如服务器、存储、数据库、网络、软件等)的服…...

【数据结构】顺序表和链表详解(上)
前言:上期我们介绍了算法的复杂度,知道的算法的重要性同时也了解到了评判一个算法的好与坏就去看他的复杂度(主要看时间复杂度),这一期我们就从顺序表和链表开始讲起。 文章目录 一,顺序表1,线性表2,顺序表…...

唯创WT2606B TFT显示灵动方案,重构电子锁人机互动界面,赋能智能门锁全场景交互!
在智能家居的浪潮中,门锁搭载显示屏已成为行业创新的焦点。据行业数据显示,2023年全球智能门锁出货量中,搭载显示屏的型号占比已突破40%,且年复合增长率达25%。而2024年国内智能门锁销量突破2200万套,预计2025年市场规…...
WPF的UI交互基石:数据绑定基础
数据绑定基础 1 Binding的Path属性2 ElementName绑定3 DataContext的作用4 绑定模式(Binding Mode)5 实用技巧集合1. 默认值处理2. 设计时数据3. 绑定验证4. 多级路径监控 6 常见错误排查 数据绑定是WPF的核心特性之一,它实现了界面ÿ…...

智能穿戴新标杆:SD NAND (贴片式SD卡)与 SOC 如何定义 AI 眼镜未来技术路径
目录 一、SD NAND:智能眼镜的“记忆中枢”突破空间限制的存储革命性能与可靠性的双重保障 二、SOC芯片:AI眼镜的“智慧大脑”从性能到能效的全面跃升多模态交互的底层支撑 三、SD NANDSOC:11>2的协同效应数据流水线的高效协同端侧…...
TCP/IP四层模型
TCP/IP四层模型 TCP/IP四层模型将网络通信分为四个层次: 1. 网络接口层:负责计算机与网络硬件间的数据传输,在物理网络上发送/接收数据帧(如以太网、Wi-Fi协议)。 2. 互联网层(网络层)&…...
深入浅出Nacos:微服务架构中的服务发现与配置管理利器
在当今的软件开发领域,随着微服务架构的普及,如何有效地进行服务治理和服务配置管理成为了开发者面临的重要挑战之一。阿里巴巴开源的 Nacos(Dynamic Naming and Configuration Service)应运而生,旨在帮助开发者更轻松地构建云原生应用。本文将详细介绍 Nacos 的核心功能、…...

node_modules包下载不下来
如果项目里面的package-lock.json有resolved ,就指向了包的下载来源,如果这个网址挂了,那npm i 就会一直卡着。而且,在终端去修改 npm的镜像是没有用的 解决办法是:把项目里面的 lock文件 .npmrc都删了 然后重新下载就可以了...

yolo个人深入理解
卷积层的理解,通过云端服务器训练模型,模型构建的重要性,针对极低像素的处理,模型训练召回率提高技巧,卷积层2,4,8,16,32的小模型与大模型的理解 一.关于backbone,neck,head深入理解 1,backbone的主要组成部分是sppf和conv,这是backbone的核心,其中yolov5和yolov8…...
Go语言中的布尔类型详解
布尔类型是Go语言中最基本的数据类型之一,用于表示逻辑值。下面详细介绍Go语言中的布尔类型。 1. 基本概念 Go语言中的布尔类型用关键字bool表示,它只有两个预定义的常量值: true // 真 false // 假 2. 声明布尔变量 var b1 bool …...
三方接口设计注意事项
前言 随着业务系统间集成需求的增加,三方接口设计已成为现代软件架构中的关键环节。一个设计良好的三方接口不仅能够提供稳定可靠的服务,还能确保数据安全、提升系统性能并支持业务的持续发展。 一、设计原则 1. 统一接口原则 三方接口设计应遵循统一…...

从0开始学vue:Element Plus详解
一、核心架构解析二、技术实现指南三、高级特性实现四、性能优化方案五、生态扩展方案六、调试与测试七、版本演进路线 Element Plus 是专为 Vue 3 设计的桌面端 UI 组件库,基于 Vue 3 的 Composition API 重构,在保持与 Element UI 兼容性的同时&#x…...

互联网向左,区块链向右
2008年,中本聪首次提出了比特币的设想,这打开了去中心化的大门。 比特币白皮书清晰的描述了去中心化支付的解决方案,并分别从以下几个方面阐述了他的理念: 一、由转账双方点对点的通讯,而不通过中心化的第三方…...

Python6.1打卡(day33)
DAY 33 MLP神经网络的训练 知识点回顾: 1.PyTorch和cuda的安装 2.查看显卡信息的命令行命令(cmd中使用) 3.cuda的检查 4.简单神经网络的流程 1.数据预处理(归一化、转换成张量) 2.模型的定义 …...
金融全业务场景的系统分层与微服务域架构切分
构建一个支持金融全业务场景的会员账户体系,是一项复杂但极具战略价值的工程。为了支持跨国收付款、供应链金融、信用账户、票据、银行卡发卡等场景,需要采用清晰的分层架构和服务划分策略,确保系统具备可扩展性、合规性、安全性和高可用性。…...
POJO、DTO和VO:Java应用中的三种关键对象详解
在软件开发特别是Java开发中,常常会遇到POJO、DTO和VO这三类对象。它们在不同场景下扮演着重要角色,有助于优化代码结构、增强系统安全性和提升性能。本文将全面解析这三者的定义、区别及常见使用场景,帮助你更好地理解和应用。 1. POJO&…...

论文阅读笔记——Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
I3D 论文 UCF-101(13000多个视频)和 HMDB-51(7000多个视频)数据集过小,提出了 Kinetics 数据集,并且在其之上预训练之后能够迁移到其他小的数据集。 2DLSTM:使用2D CNN的好处是可以直接从 Ima…...
IDEA,Spring Boot,类路径
在 IDEA 中开发 Spring Boot 项目时,类路径 (classpath) 的正确配置至关重要,它直接影响项目的编译、运行和依赖管理。以下是关于此问题的关键知识点: IDEA 与 Spring Boot 类路径核心概念 类路径定义: 类路径是 JVM 用来搜索类文件 (.class…...

vscode编辑器怎么使用提高开发uVision 项目的效率,如何编译Keil MDK项目?
用vscode编译uVision 项目只需要安装一个Keil Assistant插件,即可用vscode开发“keil 项目”。极大提高开发速度! 1.安装Keil Assistant插件 安装插件成功之后,应该会让安装一个东西,点击安装即可 2.配置安装包路径 3.打开 uVi…...
Beta分布Dirichlet分布
目录 Beta分布Dirichlet分布Beta分布&Dirichlet分布从Dirichlet分布生成Beta样本Beta分布&Dirichlet分布应用 Beta分布 Beta分布是定义在区间 [ 0 , 1 ] [0, 1] [0,1]上的连续概率分布,通常用于模拟概率或比例的随机变量。Beta分布的概率密度函数ÿ…...

AR测量工具:精准测量,多功能集成
在日常生活中,我们常常会遇到需要测量物体长度、距离或角度的情况。无论是装修房屋、制作家具,还是进行户外活动,一个精准的测量工具都能大大提高我们的工作效率。AR测量工具就是这样一款集多种功能于一体的实用测量软件,它利用增…...

【Go-补充】Sync包
并发编程-Sync包 sync.WaitGroup 在代码中生硬的使用time.Sleep肯定是不合适的,Go语言中可以使用sync.WaitGroup来实现并发任务的同步。 sync.WaitGroup有以下几个方法: 方法名功能(wg * WaitGroup) Add(delta int)计数器delta(wg *WaitGroup) Done()…...