当前位置: 首页 > news >正文

Grails应用http.server.requests指标数据采集问题排查及解决

问题

遇到的问题:同一个应用,Spring Boot(Java)和Grails(Groovy)混合编程,常规的Spring Controller,可通过Micromete + Pushgateway,
在这里插入图片描述
采集到http.server.requests指标数据,注意下面的指标名称是点号(请忽略下面截图里的接口的uri并不是上面的截图里的)
在这里插入图片描述
在Prometheus页面,会发现指标名称已经变成下划线命名,且增加后缀_seconds_sum
在这里插入图片描述
为啥Grails的UrlMappings和controller,无法采集到http_server_requests指标数据?(请忽略下面的截图是另一个应用)
在这里插入图片描述

源码分析

一开始,我只知道MeterRegistry.registerMeterIfNecessary方法,打个断点,调试可进入断点:
在这里插入图片描述
截图如上,tag里的uri全部变成root,也就是上面截图4中看到的所有接口全变成root,不同的是method方法。

为啥会变成root呢?

只能断点调试。

断点调试的前提是熟悉框架代码。想一想,如果不知道方法调用层级关系,怎么打断点呢?

如何熟悉代码?花时间。或者反复询问ChatGPT、DeepSeek、GitHub Copilot。

总之,这里直接给出原因。

WebMvcMetricsFilter类相关方法如下:

@Override
protected void doFilterInternal(HttpServletRequest request, HttpServletResponse response, FilterChain filterChain)throws ServletException, IOException {TimingContext timingContext = TimingContext.get(request);if (timingContext == null) {timingContext = startAndAttachTimingContext(request);}try {filterChain.doFilter(request, response);if (!request.isAsyncStarted()) {// Only record when async processing has finished or never been started.// If async was started by something further down the chain we wait until the second filter invocation (but we'll be using the TimingContext that was attached to the first)Throwable exception = fetchException(request);record(timingContext, request, response, exception);}} catch (Exception ex) {response.setStatus(HttpStatus.INTERNAL_SERVER_ERROR.value());record(timingContext, request, response, unwrapNestedServletException(ex));throw ex;}
}private void record(TimingContext timingContext, HttpServletRequest request, HttpServletResponse response,Throwable exception) {try {Object handler = getHandler(request);Set<Timed> annotations = getTimedAnnotations(handler);Timer.Sample timerSample = timingContext.getTimerSample();AutoTimer.apply(this.autoTimer, this.metricName, annotations,(builder) -> timerSample.stop(getTimer(builder, handler, request, response, exception)));}catch (Exception ex) {logger.warn("Failed to record timer metrics", ex);// Allow request-response exchange to continue, unaffected by metrics problem}
}private Timer getTimer(Builder builder, Object handler, HttpServletRequest request, HttpServletResponse response,Throwable exception) {return builder.description("Duration of HTTP server request handling").tags(this.tagsProvider.getTags(request, response, handler, exception)).register(this.registry);
}

DefaultWebMvcTagsProvider类的相关方法如下:

@Override
public Iterable<Tag> getTags(HttpServletRequest request, HttpServletResponse response, Object handler,Throwable exception) {Tags tags = Tags.of(WebMvcTags.method(request), WebMvcTags.uri(request, response, this.ignoreTrailingSlash),WebMvcTags.exception(exception), WebMvcTags.status(response), WebMvcTags.outcome(response));for (WebMvcTagsContributor contributor : this.contributors) {tags = tags.and(contributor.getTags(request, response, handler, exception));}return tags;
}

WebMvcTags类的相关方法如下:

// 这才是我们最终想要定位的代码行,
private static final Tag URI_ROOT = Tag.of("uri", "root");public static Tag uri(HttpServletRequest request, HttpServletResponse response, boolean ignoreTrailingSlash) {if (request != null) {String pattern = getMatchingPattern(request);if (pattern != null) {if (ignoreTrailingSlash && pattern.length() > 1) {pattern = TRAILING_SLASH_PATTERN.matcher(pattern).replaceAll("");}if (pattern.isEmpty()) {return URI_ROOT;}return Tag.of("uri", pattern);}if (response != null) {HttpStatus status = extractStatus(response);if (status != null) {if (status.is3xxRedirection()) {return URI_REDIRECTION;}if (status == HttpStatus.NOT_FOUND) {return URI_NOT_FOUND;}}}String pathInfo = getPathInfo(request);if (pathInfo.isEmpty()) {return URI_ROOT;}}return URI_UNKNOWN;
}private static String getPathInfo(HttpServletRequest request) {String pathInfo = request.getPathInfo();String uri = StringUtils.hasText(pathInfo) ? pathInfo : "/";uri = MULTIPLE_SLASH_PATTERN.matcher(uri).replaceAll("/");return TRAILING_SLASH_PATTERN.matcher(uri).replaceAll("");
}private static String getMatchingPattern(HttpServletRequest request) {PathPattern dataRestPathPattern = (PathPattern) request.getAttribute(DATA_REST_PATH_PATTERN_ATTRIBUTE);if (dataRestPathPattern != null) {return dataRestPathPattern.getPatternString();}return (String) request.getAttribute(HandlerMapping.BEST_MATCHING_PATTERN_ATTRIBUTE);
}

如下截图所示,在HttpServletRequest类里根本就没有pathInfo字段:
在这里插入图片描述
以及
在这里插入图片描述
代码为啥会走到getPathInfo方法呢,那是因为getMatchingPattern方法返回为空。

一个常规的Spring Boot Controller接口是可以获取到pattern的:
在这里插入图片描述
但是Grails框架下的Groovy Controller接口,pattern为null:
在这里插入图片描述
继续看看getMatchingPattern方法:
在这里插入图片描述
这里面尝试从request里获取两个key都失败,都返回null:

  • org.springframework.data.rest.webmvc.RepositoryRestHandlerMapping.EFFECTIVE_REPOSITORY_RESOURCE_LOOKUP_PATH
  • org.springframework.web.servlet.HandlerMapping.bestMatchingPattern

总结一下:Spring Boot Actuator的Filter类WebMvcMetricsFilter类doFilterInternal方法,调用内部方法record,继续调用内部方法getTimer,然后调用DefaultWebMvcTagsProvider的getTags方法,然后调用WebMvcTags的uri方法,调用内部方法getMatchingPattern,获取不到接口的uri信息,则走到内部方法getPathInfo,而HttpServletRequest.getPathInfo方法,也是返回null。导致最后记录到的tag为private static final Tag URI_ROOT = Tag.of("uri", "root");

如果不熟悉框架原理,全局搜索root关键词,根本就定位不到WebMvcTags类的URI_ROOT字段。

自定义指标采集

既然Grails框架下,Micrometer采集http.server.requests数据有问题,DeepSeek等工具告诉我,可以自定义指标数据。

下面的代码片段是DeepSeek给出的:

import io.micrometer.core.instrument.MeterRegistry;
import io.micrometer.core.instrument.Timer;
import org.springframework.stereotype.Component;import javax.servlet.*;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.io.IOException;/*** @author johnny*/
@Component
class CustomMetricsFilter implements Filter {private final MeterRegistry meterRegistry;CustomMetricsFilter(MeterRegistry meterRegistry) {this.meterRegistry = meterRegistry;}@Overridepublic void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException {HttpServletRequest httpRequest = (HttpServletRequest) request;HttpServletResponse httpResponse = (HttpServletResponse) response;// 开始计时Timer.Sample sample = Timer.start(meterRegistry);try {// 继续处理请求chain.doFilter(request, response);} finally {// 结束计时并记录指标// DeepSeek给出的是http.server.requests.custom自定义名称sample.stop(meterRegistry.timer("http.server.requests","method", httpRequest.getMethod(),"uri", httpRequest.getRequestURI(),"status", String.valueOf(httpResponse.getStatus())));}}
}

FilterConfig配置类:

package com.johnny.config;import io.micrometer.core.instrument.MeterRegistry;
import org.springframework.boot.web.servlet.FilterRegistrationBean;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.core.Ordered;/*** @author johnny*/
@Configuration
public class FilterConfig {@Beanpublic FilterRegistrationBean<CustomMetricsFilter> customMetricsFilter(MeterRegistry meterRegistry) {FilterRegistrationBean<CustomMetricsFilter> bean = new FilterRegistrationBean<>();bean.setFilter(new CustomMetricsFilter(meterRegistry));bean.addUrlPatterns("/*");bean.setOrder(Ordered.HIGHEST_PRECEDENCE);return bean;}
}

我没有使用自定义名称,而是使用期望推送的指标名称,http.server.requests。通过断点调试,上面的代码是生效的,但在Prometheus页面并不能看到我请求的接口,也就是说为啥不能覆盖默认的指标名。

原因,经过分析,在Timer类的register方法上:

/*** Add the timer to a single registry, or return an existing timer in that* registry. The returned timer will be unique for each registry, but each* registry is guaranteed to only create one timer for the same combination of* name and tags.* @param registry A registry to add the timer to, if it doesn't already exist.* @return A new or existing timer.*/
public Timer register(MeterRegistry registry) {// the base unit for a timer will be determined by the monitoring system// implementationreturn registry.timer(new Meter.Id(name, tags, null, description, Type.TIMER),distributionConfigBuilder.build(),pauseDetector == null ? registry.config().pauseDetector() : pauseDetector);
}

猜测下来,对于已存在的指标名称http.server.requests,会直接返回,并不会。

既然上面的代码可以断点调试,说明逻辑没有什么问题,为了进一步验证,使用自定义的指标名称http.server.requests.custom

浏览器打开:http://localhost:8867/actuator/metrics
在这里插入图片描述
如上图,除了组件默认采集到的http.server.requests,还有一条自定义的http.server.requests.custom。
打开Prometheus,查询新增的自定义指标,PromQL为:http_server_requests_custom_seconds_sum{job="agent-document"}
在这里插入图片描述
确实有数据。

问题来了:我想要在Grafana页面查询,查询范围当然是所有的应用。

DeepSeek给出的答案:

// 移除默认的 http.server.requests 指标
meterRegistry.remove(meterRegistry.find("http.server.requests").tags().timer());
// 结束计时并记录指标
// 省略代码

确实可以解决问题。

但是,如果一段时间内没有请求,组件自带的默认指标http.server.requests还是会覆盖我推送的。
在这里插入图片描述
代码里定时将数据通过Pushgateway推送到Prometheus(已经保存下来),Grafana可以查询到数据,哪怕被覆盖也没有问题??

另一方面,前面刚刚使用meterRegistry.remove()方法移除,后一脚又采集meterRegistry.timer("http.server.requests")数据,感觉怪怪的。

那能不能禁用默认的http.server.requests指标呢?

Grails

Grails框架下对HttpServletRequest做了各种不知道的封装。
在这里插入图片描述
主要是下面这个:
在这里插入图片描述
以及GrailsDispatcherServlet:
在这里插入图片描述
看到上面这么多Grails的Jar包,是不是要疯掉。

禁用默认指标

management:metrics:enable:http.server.requests: falsehttp: false

不管是http: false,还是http.server.requests: false,并不能将Micrometer默认的http.server.requests指标给屏蔽掉。

真正可以实现屏蔽的配置如下:

management:metrics:web:server:request:autotime:enabled: false

重启应用,请求http://localhost:8867/actuator/metrics,再随便请求一个其他接口,发现不再有http.server.requests指标,即实现禁用。

方案

最终的方案:禁用默认指标,加上CustomMetricsFilter,和FilterConfig配置类。

写在最后

本文如果行文思路还算清晰的话,请一定不要以为排查问题的过程也是思路清晰的。

实际上,在排查问题时,由于对Micrometer组件的源码不熟悉,浪费不少时间。

参考

  • GitHub Copilot
  • DeepSeek
  • ChatGPT

相关文章:

Grails应用http.server.requests指标数据采集问题排查及解决

问题 遇到的问题&#xff1a;同一个应用&#xff0c;Spring Boot(Java)和Grails(Groovy)混合编程&#xff0c;常规的Spring Controller&#xff0c;可通过Micromete Pushgateway&#xff0c; 采集到http.server.requests指标数据&#xff0c;注意下面的指标名称是点号&#…...

开源临床试验软件OpenClinica的安装

本文是为帮网友 A萤火虫 解决安装问题做的记录&#xff1b; 简介 什么是 OpenClinica &#xff1f; OpenClinica 是世界上第一个商业开源临床试验软件&#xff0c;主要用于电子数据捕获&#xff08;EDC&#xff09;和临床数据管理&#xff08;CDM&#xff09;。它的设计旨在优…...

网络安全 | 网络安全法规:GDPR、CCPA与中国网络安全法

网络安全 | 网络安全法规&#xff1a;GDPR、CCPA与中国网络安全法 一、前言二、欧盟《通用数据保护条例》&#xff08;GDPR&#xff09;2.1 背景2.2 主要内容2.3 特点2.4 实施效果与影响 三、美国《加利福尼亚州消费者隐私法案》&#xff08;CCPA&#xff09;3.1 背景3.2 主要内…...

深入学习 Python 爬虫:从基础到实战

深入学习 Python 爬虫&#xff1a;从基础到实战 前言 Python 爬虫是一个强大的工具&#xff0c;可以帮助你从互联网上抓取各种数据。无论你是数据分析师、机器学习工程师&#xff0c;还是对网络数据感兴趣的开发者&#xff0c;爬虫都是一个非常实用的技能。在本文中&#xff…...

element plus 使用 upload 组件达到上传数量限制时隐藏上传按钮

最近在重构项目&#xff0c;使用了 element plus UI框架&#xff0c;有个功能是实现图片上传&#xff0c;且限制只能上传一张图片&#xff0c;结果&#xff0c;发现&#xff0c;可以限制只上传一张图片&#xff0c;但是上传按钮还在&#xff0c;如图&#xff1a; 解决办法&…...

音频DSP的发展历史

音频数字信号处理&#xff08;DSP&#xff09;的发展历史是电子技术、计算机科学和音频工程共同进步的结果。这个领域的进展不仅改变了音乐制作、音频后期制作和通信的方式&#xff0c;也影响了音频设备的设计和功能。以下是对音频DSP发展历史的概述&#xff1a; 早期概念和理论…...

2025低代码与人工智能AI新篇

在当今数字化浪潮汹涌澎湃的时代&#xff0c;低代码开发与人工智能&#xff08;AI&#xff09;犹如两颗璀璨的星辰&#xff0c;正逐渐交汇融合&#xff0c;为企业解锁前所未有的智能业务解决方案。今天&#xff0c;咱们就深入探讨一下低代码平台是如何集成 AI 技术&#xff0c;…...

【HarmonyOS Next NAPI 深度探索1】Node.js 和 CC++ 原生扩展简介

【HarmonyOS Next NAPI 深度探索1】Node.js 和 CC 原生扩展简介 如果你用过 Node.js&#xff0c;应该知道它强大的地方在于能处理各种场景&#xff0c;速度还很快。但你有没有想过&#xff0c;Node.js 的速度秘密是什么&#xff1f;今天我们来聊聊其中一个幕后英雄——原生扩展…...

redis的学习(四)

13. 渐进式遍历 通过渐进式遍历能够获取当前所有的key&#xff0c;又不会讲当前的服务器卡死。不是一个命令将所有的key获取&#xff0c;而是每执行一次命令&#xff0c;只获取到其中的一部分。所以想要获取到所有的key就需要多次遍历&#xff0c;即化整为零的思想。 渐进式遍历…...

C# winform 多线程 UI更新数据 报错:无法访问已释放的对象。

System.ObjectDisposedException HResult0x80131622 Message无法访问已释放的对象。 ObjectDisposed_ObjectName_Name SourceSystem.Windows.Forms StackTrace: at System.Windows.Forms.Control.MarshaledInvoke(Control caller, Delegate method, Object[] args, …...

error: linker `link.exe` not found

开始学习rust&#xff0c;安装好rust的环境&#xff0c;开始从hello world开始&#xff0c;结果用在win10环境下&#xff0c;使用vs code或cmd窗口编译rust报错&#xff1a; PS E:\study_codes\rust-demo\chart01> rustc hello.rs error: linker link.exe not found| note:…...

Vue.js组件开发-如何使用moment.js

在Vue.js组件开发中&#xff0c;需要处理日期和时间&#xff0c;moment.js 是一个非常有用的库。moment.js 提供了丰富的API来解析、验证、操作和显示日期和时间。 步骤&#xff1a; 1. 安装moment.js 首先&#xff0c;需要通过npm或yarn安装moment.js。在项目根目录下运行以…...

Linux第二课:LinuxC高级 学习记录day01

0、大纲 0.1、Linux 软件安装&#xff0c;用户管理&#xff0c;进程管理&#xff0c;shell 命令&#xff0c;硬链接和软连接&#xff0c;解压和压缩&#xff0c;功能性语句&#xff0c;结构性语句&#xff0c;分文件&#xff0c;make工具&#xff0c;shell脚本 0.2、C高级 …...

《DOM NodeList》

《DOM NodeList》 介绍 DOM&#xff08;文档对象模型&#xff09;是HTML和XML文档的编程接口&#xff0c;它允许开发者在JavaScript等编程语言中操作文档的结构、样式和内容。在DOM中&#xff0c;NodeList是一个重要的接口&#xff0c;它表示一个包含节点&#xff08;如元素、…...

Nginx代理同域名前后端分离项目的完整步骤

前后端分离项目&#xff0c;前后端共用一个域名。通过域名后的 url 前缀来区别前后端项目。 以 vue php 项目为例。直接上 server 模块的 nginx 配置。 server{ listen 80; #listen [::]:80 default_server ipv6onlyon; server_name demo.com;#二配置项目域名 index index.ht…...

uniapp页面高度设置(铺满可视区域、顶部状态栏高度、底部导航栏高度)

这里说几种在uniapp开发中,关于页面设置高度的几种情况。宽度就不说了哈,宽度设置百分比都会生效。 首先我们要知道平时开发中,如果说没在uniapp做特殊处理,即正常情况下,所有的页面(.vue文件)中都是没有高度的(和vue一样),也就是说给最外层的的view标签设置高度为1…...

解锁 RAG 技术:从原理、论文研读走向实战应用RAG

亲爱的小伙伴们&#x1f618;&#xff0c;在求知的漫漫旅途中&#xff0c;若你对深度学习的奥秘、Java 与 Python 的奇妙世界&#xff0c;亦或是读研论文的撰写攻略有所探寻&#x1f9d0;&#xff0c;那不妨给我一个小小的关注吧&#x1f970;。我会精心筹备&#xff0c;在未来…...

HTML5实现好看的中秋节网页源码

HTML5实现好看的中秋节网页源码 前言一、设计来源1.1 网站首页界面1.2 登录注册界面1.3 节日由来界面1.4 节日习俗界面1.5 节日文化界面1.6 节日美食界面1.7 节日故事界面1.8 节日民谣界面1.9 联系我们界面 二、效果和源码2.1 动态效果2.2 源代码 源码下载结束语 HTML5实现好看…...

数字孪生笔记 1 工业数字孪生的意义

什么是工业数字孪生&#xff1f; 很多在做这个工作研究的同学最开始都想问的一个问题。到底什么才是数字孪生&#xff1f;我在五年前做数字孪生的时候也在思考这个问题。五年时间从数字孪生兴起&#xff0c;到元宇宙爆发&#xff0c;再到数字孪生和元宇宙没人提起&#xff0c;…...

013:深度学习之神经网络

本文为合集收录&#xff0c;欢迎查看合集/专栏链接进行全部合集的系统学习。 合集完整版请参考这里。 深度学习是机器学习中重要的一个学科分支&#xff0c;它的特点就在于需要构建多层且“深度”的神经网络。 人们在探索人工智能初期&#xff0c;就曾设想构建一个用数学方式…...

【力扣数据库知识手册笔记】索引

索引 索引的优缺点 优点1. 通过创建唯一性索引&#xff0c;可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度&#xff08;创建索引的主要原因&#xff09;。3. 可以加速表和表之间的连接&#xff0c;实现数据的参考完整性。4. 可以在查询过程中&#xff0c;…...

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介 对于社交类软件的功能&#xff0c;我们需要对它的功能特点进行分析&#xff1a; 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具&#xff1a; mysql&#xff1a;关系型数据库&am…...

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

一、开发环境准备 ​​工具安装​​&#xff1a; 下载安装DevEco Studio 4.0&#xff08;支持HarmonyOS 5&#xff09;配置HarmonyOS SDK 5.0确保Node.js版本≥14 ​​项目初始化​​&#xff1a; ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

【论文阅读28】-CNN-BiLSTM-Attention-(2024)

本文把滑坡位移序列拆开、筛优质因子&#xff0c;再用 CNN-BiLSTM-Attention 来动态预测每个子序列&#xff0c;最后重构出总位移&#xff0c;预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵&#xff08;S…...

【Oracle】分区表

个人主页&#xff1a;Guiat 归属专栏&#xff1a;Oracle 文章目录 1. 分区表基础概述1.1 分区表的概念与优势1.2 分区类型概览1.3 分区表的工作原理 2. 范围分区 (RANGE Partitioning)2.1 基础范围分区2.1.1 按日期范围分区2.1.2 按数值范围分区 2.2 间隔分区 (INTERVAL Partit…...

RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程

本文较长&#xff0c;建议点赞收藏&#xff0c;以免遗失。更多AI大模型应用开发学习视频及资料&#xff0c;尽在聚客AI学院。 本文全面剖析RNN核心原理&#xff0c;深入讲解梯度消失/爆炸问题&#xff0c;并通过LSTM/GRU结构实现解决方案&#xff0c;提供时间序列预测和文本生成…...

AspectJ 在 Android 中的完整使用指南

一、环境配置&#xff08;Gradle 7.0 适配&#xff09; 1. 项目级 build.gradle // 注意&#xff1a;沪江插件已停更&#xff0c;推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

基于Java+MySQL实现(GUI)客户管理系统

客户资料管理系统的设计与实现 第一章 需求分析 1.1 需求总体介绍 本项目为了方便维护客户信息为了方便维护客户信息&#xff0c;对客户进行统一管理&#xff0c;可以把所有客户信息录入系统&#xff0c;进行维护和统计功能。可通过文件的方式保存相关录入数据&#xff0c;对…...

Netty从入门到进阶(二)

二、Netty入门 1. 概述 1.1 Netty是什么 Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients. Netty是一个异步的、基于事件驱动的网络应用框架&#xff0c;用于…...

Linux 中如何提取压缩文件 ?

Linux 是一种流行的开源操作系统&#xff0c;它提供了许多工具来管理、压缩和解压缩文件。压缩文件有助于节省存储空间&#xff0c;使数据传输更快。本指南将向您展示如何在 Linux 中提取不同类型的压缩文件。 1. Unpacking ZIP Files ZIP 文件是非常常见的&#xff0c;要在 …...