当前位置: 首页 > article >正文

从HikariCP连接泄漏告警到业务逻辑耗时优化实战

1. 从告警日志到问题定位那天早上刚到公司就收到运维同事发来的告警截图。日志里赫然写着Apparent connection leak detected后面跟着一堆堆栈信息。作为负责这个微服务的老司机我第一反应就是HikariCP又在报连接泄漏了。不过这次有点特殊泄漏发生在处理Excel文件上传的异步线程TyFileOpsThread-Attachworker-5上。打开日志文件仔细看发现关键线索都在报错信息里线程名明确指向SupplierProductFileOpsAppService.readDataFromExcelAttach方法事务开始的堆栈轨迹清晰可见最后跟着的业务处理耗时显示整整271秒这里有个细节很有意思。HikariCP的泄漏检测机制是通过leak-detection-threshold参数工作的我们配置的是6000毫秒6秒。当连接被占用超过这个阈值就会触发警告。但实际业务处理耗时271秒远超这个阈值难怪会报警。2. 深入分析连接泄漏的根源2.1 事务注解的隐形陷阱查看代码发现这个Excel处理方法被Transactional注解包裹着。这意味着方法开始时会获取数据库连接整个方法执行期间都会持有这个连接方法结束时才会释放连接问题就出在这里。当方法执行时间过长特别是处理大数据量Excel时连接被占用的时间就会超出HikariCP的泄漏检测阈值。虽然实际上连接最终会被正确释放但长时间的占用会被误判为泄漏。2.2 业务逻辑的耗时分析通过添加详细日志我们发现耗时主要分布在三个环节Excel解析POI库处理大型Excel文件本身就比较吃资源数据校验对每行数据都要进行复杂的业务规则校验状态更新最后还要更新文件处理状态特别是当供应商上传的Excel包含上万行数据时这个链条式的处理过程就会变得异常缓慢。我见过最夸张的一个文件处理了将近5分钟数据库连接自然会被长时间占用。3. 双管齐下的解决方案3.1 业务逻辑优化实战针对发现的性能瓶颈我们实施了以下优化措施分批次处理Excel数据// 原代码一次性读取所有行 ListRow rows sheet.getRows(); // 优化后分批读取 int batchSize 500; for(int i0; itotalRows; ibatchSize){ ListRow batch sheet.getRows(i, Math.min(batchSize, totalRows-i)); processBatch(batch); }异步化耗时操作// 将校验逻辑放入线程池 CompletableFutureVoid validationFuture CompletableFuture.runAsync(() - { validateData(batch); }, validationExecutor); // 等待所有校验完成 validationFuture.get();缓存重复查询结果// 使用Guava Cache缓存常用数据 LoadingCacheLong, ProductInfo productCache CacheBuilder.newBuilder() .maximumSize(1000) .build(new ProductInfoLoader());3.2 HikariCP参数调优指南在优化业务代码的同时我们也调整了连接池配置参数名原值新值说明leak-detection-threshold6000ms60000ms适当放宽泄漏检测阈值maximum-pool-size2030增加最大连接数connection-timeout60000ms120000ms延长连接等待时间特别注意leak-detection-threshold不是越大越好。设置过长会失去泄漏检测的意义建议根据业务实际情况调整。4. 长事务处理的进阶技巧4.1 事务拆分策略对于这种长时间运行的任务我推荐使用小事务策略将大事务拆分为多个小事务每个批次处理完成后立即提交使用状态表记录处理进度Transactional(propagation Propagation.REQUIRES_NEW) public void processBatch(ListRow batch) { // 处理逻辑... }4.2 连接持有时间监控我们开发了一个简单的监控工具用于跟踪连接持有时间public class ConnectionHoldTimeMonitor { private static final ThreadLocalLong startTime new ThreadLocal(); public static void start() { startTime.set(System.currentTimeMillis()); } public static void end() { long duration System.currentTimeMillis() - startTime.get(); if(duration 5000) { // 超过5秒警告 log.warn(Long connection hold detected: {}ms, duration); } } }5. 典型场景的避坑指南在实际项目中我遇到过不少由长事务引发的连接问题这里分享几个典型案例案例一报表生成服务问题月度报表生成耗时20分钟导致连接池耗尽解决改用文件存储中间状态分阶段生成案例二数据迁移工具问题百万级数据迁移时频繁报连接泄漏解决采用分页查询批量插入每1000条提交一次案例三第三方API集成问题等待外部API响应时连接被占用解决设置合理超时将调用移出事务边界这些案例都说明了一个道理事务范围应该与业务操作的实际需求相匹配。不是所有操作都需要放在事务里特别是那些耗时较长的IO操作。

相关文章:

从HikariCP连接泄漏告警到业务逻辑耗时优化实战

1. 从告警日志到问题定位 那天早上刚到公司,就收到运维同事发来的告警截图。日志里赫然写着"Apparent connection leak detected",后面跟着一堆堆栈信息。作为负责这个微服务的老司机,我第一反应就是:HikariCP又在报连…...

LinkSwift网盘直链下载助手:2025年高效下载终极解决方案

LinkSwift网盘直链下载助手:2025年高效下载终极解决方案 【免费下载链接】Online-disk-direct-link-download-assistant 可以获取网盘文件真实下载地址。基于【网盘直链下载助手】修改(改自6.1.4版本) ,自用,去推广&am…...

格密码学入门:从基础定义到核心困难问题解析

1. 格密码学:当数学遇上信息安全 第一次听说"格密码学"这个词时,我正盯着电脑屏幕上一堆三维点阵图发呆。那是我在密码学实验室实习的第三天,导师随手画了两个相交的菱形,说:"这就是未来可能取代RSA的数…...

构建专属数字分身:Duix-Avatar本地化部署与应用全指南

构建专属数字分身:Duix-Avatar本地化部署与应用全指南 【免费下载链接】Duix-Avatar 项目地址: https://gitcode.com/GitHub_Trending/he/Duix-Avatar 在数字化时代,拥有一个能够自主生成视频内容的AI助手已成为提升创作效率的关键。Duix-Avatar…...

Java中调用PyTorch模型总失败?深度解析JNI桥接、序列化协议与内存泄漏的4重陷阱

第一章:Java AI 推理引擎集成示例在 Java 生态中集成 AI 推理能力,关键在于选择轻量、可嵌入且支持主流模型格式的推理引擎。本章以 Deep Java Library (DJL) 为例,演示如何在标准 Java 应用中加载 ONNX 模型并执行文本分类推理。环境准备与依…...

颈源性耳鸣,别当成耳部疾病治

耳朵里嗡嗡响、耳鸣不止,听力不受影响,去耳鼻喉科检查却查不出问题,吃药、调理也没有效果,这种耳鸣很可能不是耳部本身的问题,而是颈椎病变引发的颈源性耳鸣,也是极易被误诊的颈椎并发症。颈椎两侧分布着椎…...

TripoSR:0.5秒从单图到3D模型,开源3D重建的革命性工具

TripoSR:0.5秒从单图到3D模型,开源3D重建的革命性工具 【免费下载链接】TripoSR 项目地址: https://gitcode.com/GitHub_Trending/tr/TripoSR TripoSR是一款由Tripo AI与Stability AI联合开发的开源单图像3D重建模型,能够在短短0.5秒…...

毕业设计实战:基于SSM的学生宿舍设备报修管理系统设计与实现全攻略

毕业设计实战:基于SSM的学生宿舍设备报修管理系统设计与实现全攻略 在开发“学生宿舍设备报修管理系统”这套毕设时,我曾因“故障上报与维修派单流程脱节”踩过一个关键坑。初期设计时,我将“学生报修”和“维修人员接单”视为两个独立的模块…...

Fastfetch:超越 Neofetch 的系统信息获取新利器

【导语:Fastfetch 作为一款类似 neofetch 的工具,以 C 语言编写,注重性能与可定制性,支持多平台。它在速度、功能、准确性等方面超越竞品,为用户带来全新系统信息获取体验。】多平台适配的系统信息工具Fastfetch 是一款…...

FreeFileSync 14.9更新:多维度优化提升使用体验

FreeFileSync 14.9:核心功能更新亮点FreeFileSync作为一款适用于Windows、macOS和Linux的开源文件夹对比和同步软件,在14.9版本有了诸多重要更新。在Linux系统方面,支持高DPI显示器上的200%显示缩放,这对于使用高分辨率显示器的用…...

Linux 内核中的文件系统实现:从 VFS 到具体文件系统

Linux 内核中的文件系统实现:从 VFS 到具体文件系统 引言 作为一名前产品经理,我深知数据管理的重要性。在产品开发中,良好的数据管理可以提高系统的可靠性和可用性。在 Linux 内核中,文件系统是一个核心组件,它负责管…...

SAP BTP新手避坑指南:从零开始创建Directory和Subaccount(附Region选择建议)

SAP BTP新手避坑指南:从零开始创建Directory和Subaccount(附Region选择建议) 第一次登录SAP BTP Cockpit时,面对Global Account、Directory、Subaccount的层级关系,很多新手会感到无从下手。这就像刚拿到一套乐高积木却…...

不止于画图:用@antv/g6-editor的Command系统打造可撤销/重做的智能流程设计器

超越基础绘图:利用antv/g6-editor构建企业级智能流程设计器 在当今快速发展的数字化时代,流程设计工具已成为企业数字化转型的核心组件。从简单的审批流程到复杂的业务编排,一个功能完备的流程设计器不仅能提升工作效率,更能确保…...

TikTok音乐提取全攻略:3分钟学会用DouK-Downloader分离音频

TikTok音乐提取全攻略:3分钟学会用DouK-Downloader分离音频 【免费下载链接】TikTokDownloader JoeanAmier/TikTokDownloader: 这是一个用于从TikTok下载视频和音频的工具。适合用于需要从TikTok下载视频和音频的场景。特点:易于使用,支持多种…...

Windows 11 零基础搞定 Coze Studio 本地部署:Docker 配置 + 豆包模型实战

Windows 11 零基础搞定 Coze Studio 本地部署:Docker 配置 豆包模型实战 1. 环境准备与Docker安装 对于Windows 11用户来说,Docker是运行Coze Studio的基础环境。与Linux或macOS不同,Windows平台需要特别注意虚拟化支持和镜像源配置。 硬…...

5分钟掌握防撤回神器:让重要消息无处可逃

5分钟掌握防撤回神器:让重要消息无处可逃 【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁(我已经看到了,撤回也没用了) 项目地址: https://gitcode.com/GitHub_Tre…...

10天掌握Python编程(附20节实战视频),网盘资源速领

1. 为什么选择Python作为编程入门首选? 如果你正在寻找一门适合零基础学习的编程语言,Python绝对是你的不二之选。作为一门解释型高级语言,Python以其简洁优雅的语法和强大丰富的生态圈闻名。我十年前刚开始接触编程时,就是从Pyth…...

大麦抢票神器:3步轻松实现演唱会门票自动化抢购终极指南

大麦抢票神器:3步轻松实现演唱会门票自动化抢购终极指南 【免费下载链接】ticket-purchase 大麦自动抢票,支持人员、城市、日期场次、价格选择 项目地址: https://gitcode.com/GitHub_Trending/ti/ticket-purchase 还在为抢不到心仪演唱会门票而烦…...

摆脱论文困扰!盘点2026年口碑爆棚的的AI论文写作软件

一天写完毕业论文在2026年已不再是天方夜谭。最新测评显示,2026年AI论文写作软件凭借强大功能,彻底颠覆传统写作方式,覆盖选题、查重、润色、排版等全流程,实测效率提升超300%,让你高效搞定论文,轻松应对学…...

GLM-OCR与IDEA开发环境联动:打造智能代码注释与文档生成插件

GLM-OCR与IDEA开发环境联动:打造智能代码注释与文档生成插件 想象一下这个场景:你正在一个技术分享会上,看到屏幕上闪过一段精妙的代码片段,你赶紧用手机拍了下来。回到工位,你不再需要对着照片一个字一个字地敲键盘&…...

3倍效能革命:ComfyUI-TeaCache智能缓存技术重构AI创作流程

3倍效能革命:ComfyUI-TeaCache智能缓存技术重构AI创作流程 【免费下载链接】ComfyUI-TeaCache 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-TeaCache 在AI创作领域,每一秒的等待都可能错失灵感迸发的瞬间。ComfyUI-TeaCache作为一款基…...

RTKLIB源码解析(五)数据流融合:RINEX、RTCM、NMEA与接收机原始数据的协同处理

1. 多源GNSS数据流融合的核心挑战 在RTKLIB的实际应用中,处理来自不同数据源的GNSS观测数据时,开发者常会遇到三个关键问题:格式差异、时间基准不统一和数据质量参差不齐。以RINEX、RTCM、NMEA和接收机原始数据为例,这些数据源的…...

ICP配准遇到点云尺度不一致?3步搞定相似变换矩阵(附OpenCV代码)

ICP配准中处理点云尺度不一致的实战指南 在三维视觉开发领域,点云配准是SLAM、三维重建等应用中的基础操作。但当我们面对来自不同传感器或采集条件的点云数据时,经常会遇到一个棘手问题——两组点云的尺度不一致。这就像试图用厘米尺和英寸尺测量同一物…...

手把手教你用STM32F103C8T6和ESP8266搭建智能温室大棚(附完整源码和PCB)

从零构建基于STM32与ESP8266的智能温室系统实战指南 1. 项目概述与核心设计思路 想象一下,在自家后院搭建一个能自动调节温湿度、精准灌溉的迷你温室,而成本不到一顿火锅的钱。这就是我们今天要实现的STM32F103C8T6ESP8266智能温室系统的魅力所在。不同于…...

ESP8266 入门指南 — 从零开始烧录AT固件

1. 为什么需要烧录AT固件 第一次拿到ESP8266模块时,很多朋友会直接尝试用串口发送AT指令,结果发现模块毫无反应。这种情况我遇到过太多次了,根本原因在于模块没有预装AT固件。虽然部分商家会预先烧录好,但根据我的经验&#xff0c…...

Halcon读取条形码和二维码

读取条形码1创建条形码句柄create_bar_code_model(: : GenOaramName,GenParamValue: BarCodeHandle)2设置条形码参数GenParamName 设置的参数element_size_min 条形码最小单位,黑条之间的最小间距barcode_width_min条形码的最小宽度persistence 设置条形码的查找精度…...

从实例出发:宏平均、微平均与权重平均的计算与应用解析

1. 从混淆矩阵说起:理解评估指标的基础 在机器学习分类任务中,我们经常需要评估模型的性能。这时候就离不开混淆矩阵这个基础工具。假设我们有一个二分类问题,类别分别是"是"和"否"。混淆矩阵会告诉我们模型预测的正确和…...

如何高效获取Twitter社交数据:学术研究的实战指南

如何高效获取Twitter社交数据:学术研究的实战指南 【免费下载链接】getting-started-with-the-twitter-api-v2-for-academic-research A course on getting started with the Twitter API v2 for academic research 项目地址: https://gitcode.com/gh_mirrors/ge/…...

别再乱设target_frame了!深度解读ROS2 pointcloud_to_laserscan源码,搞懂tf转换与消息过滤器的正确用法

别再乱设target_frame了!深度解读ROS2 pointcloud_to_laserscan源码,搞懂tf转换与消息过滤器的正确用法 在机器人感知系统中,将三维点云数据转换为二维激光扫描数据是常见的降维处理手段。ROS2的pointcloud_to_laserscan功能包看似简单&…...

源码编译实战:定制rpath与interpreter实现高版本glibc程序向下兼容部署

1. 为什么需要高版本glibc程序向下兼容 最近在给客户部署AI推理服务时遇到一个典型问题:开发环境用的是Ubuntu 20.04(glibc 2.31),而生产环境是CentOS 7(glibc 2.17)。直接拷贝编译好的程序运行时&#xff…...