当前位置: 首页 > news >正文

一种SpringBoot下Scheduler定时任务优雅退出方案

背景

近期业务中有一个定时任务发现每次服务部署时,偶发性的会触发问题,这里记录一下问题的跟进解决。

分析现象

该定时任务每2分钟执行一次,完成数据的更新处理。同时服务部署了多个服务器节点,为保证每次只有一个服务器节点上的任务在跑,引入了基于Redis缓存的分布式锁。
示例源码

@Scheduled(cron = "10 */2 * * * ?")
public void execute() {String jobName = getJobName();DistributeLock lock = distributeLock.newLock(getJobKey(), 5 * 60);if (!lock.tryLock()) {logger.info(" {} execute get lock faild......", jobName);return;}try {logger.info("execute start........ {}", jobName);long startTime = System.currentTimeMillis();doExecute();long endTime = System.currentTimeMillis();logger.info("execute end........,time:{} ms", (endTime - startTime));} catch (Exception e) {logger.error("execute error", e);} finally {lock.unlock();}
}

当服务部署时,分析日志发现存在以下异常。

  • 任务存在开始日志,但是缺少执行结束时候的日志。
  • 新服务启动后,会存在空的运行周期,所有的节点获取锁失败。

原因: 我们假设任务在具体执行doExecute方法时,服务器节点收到了重新部署的命令。

  • 那么此时JVM进程会被kill,由于JVM直接被kill,并没有任何优雅退出的处理,此时也就不会有任务执行结束的日志.
  • 同样的,上述代码中的finally语句也不会被执行到,所以锁就不会被释放。
  • 由于锁未被及时释放,当下一个2分钟执行周期来到时,我们看到上一个锁的时间是5*60s,此时是无法获取锁的,导致空了一个定时任务周期。

解决方案

方案1:缩短锁的持有时间

将锁的持有时间修改为2分钟,考虑到通常的节点部署时间是超过2分钟的,这样可以保证新服务部署的时候,上一个锁是已经过期的。

看似是可以解决问题的,那么实际可以的吗。其实不然,这种方案是有风险的,因为这里忽略了doExecute的实际执行时间。

原有的5分钟是确定任务最长执行时间不会超过5分钟,但是将锁过期时间设置2分钟实际是否风险的。

举个例子:

10:00 任务1开始执行,执行时间为3分钟,要到10:03才会结束。

10:02 任务2开始执行,此时任务1还在执行,但是由于锁已经过期了,此时任务2也开始执行,要到10:05才会结束。

这就会导致,同一时刻,会存在重叠的任务在执行。
所以不能冒然调整锁的持有时间。

方案2: 利用钩子在服务器停止的时候,将锁显示释放

该方案依赖Spring或者JVM的关闭钩子,在进程销毁的时候,进行一些清理工作。

比如可以依赖Spring的ApplicationListener监听ContextClosedEvent事件。

@Component
@Slf4j
public class DistributeLockShutdownHook implements ApplicationListener<ContextClosedEvent> {@Overridepublic void onApplicationEvent(ContextClosedEvent event) {log.info("shutdown hook, ContextClosedEvent");// 先判断当前节点是否持有定时任务的锁,如果持有// 利用redis缓存的api,直接删除定时任务持有的锁;// 如果不持有锁,不做处理。}
}

这样可以保证锁是清理掉的,后续启动的节点就可以成功获取锁了。

不过这里有一点要注意,在清理时,一定是当前节点之前持有了这把锁才清理。否则,如果不做判断直接清理,就会出现问题,这通常与我们服务部署时,是按照百分比部署有关系。

10:00 B节点正在执行任务,持有锁,任务执行3分钟。

10:01 A节点此时要重新部署服务,将锁删除

10:02 C节点开始执行任务,获取锁成功,也开始执行任务。

那么此时也会导致多个任务在重叠执行。

方案3: 通过定制化线程池,等待当前定时任务执行完成优雅退出

可以看到方案1和方案2,当前正在执行的任务都是直接被终止掉了,那是否有办法等待当前定时任务执行完成,再关闭JVM呢。可以尝试使用以下方案。

首先,我们给Spring Schedule定时任务指定了线程池,同时配置了线程池的关闭策略和关闭等待时间。

@Configuration
public class ThreadPoolTaskSchedulerConfig {@Beanpublic ThreadPoolTaskScheduler threadPoolTaskScheduler () {ThreadPoolTaskScheduler threadPoolTaskScheduler = new ThreadPoolTaskScheduler();//线程池大小为10threadPoolTaskScheduler.setPoolSize(10);//设置线程名称前缀threadPoolTaskScheduler.setThreadNamePrefix("scheduled-thread-test-");//关键点: 设置线程池关闭的时候等待所有任务都完成再继续销毁其他的BeanthreadPoolTaskScheduler.setWaitForTasksToCompleteOnShutdown(true);//关键点:设置线程池中任务的等待时间,如果超过这个时候还没有销毁就强制销毁,以确保应用最后能够被关闭,而不是阻塞住threadPoolTaskScheduler.setAwaitTerminationSeconds(60);threadPoolTaskScheduler.initialize();return threadPoolTaskScheduler;}
}
@Configuration
public class SchedulerConfig implements SchedulingConfigurer {@Resourceprivate ThreadPoolTaskScheduler threadPoolTaskScheduler;@Overridepublic void configureTasks(ScheduledTaskRegistrar scheduledTaskRegistrar) {scheduledTaskRegistrar.setTaskScheduler(threadPoolTaskScheduler);}
}

然后监听Spring的ContextClosedEvent,在其中触发线程池的shutdown方法。

@Component
@Slf4j
public class ShutdownHookDemo implements ApplicationListener<ContextClosedEvent> {@Resourceprivate ThreadPoolTaskScheduler threadPoolTaskScheduler;@Overridepublic void onApplicationEvent(ContextClosedEvent event) {log.info("shutdown hook, ContextClosedEvent");threadPoolTaskScheduler.destroy();}
}

对于ThreadPoolTaskScheduler的destroy方法,源码如下所示:
可以看到会触发ExecutorService的shutDown方法,等待任务执行完成。而awaitTerminationIfNecessary方法则是限时等待,如果超时,则将线程中断。

/*** Calls {@code shutdown} when the BeanFactory destroys* the task executor instance.* @see #shutdown()*/
@Override
public void destroy() {shutdown();
}/*** Perform a shutdown on the underlying ExecutorService.* @see java.util.concurrent.ExecutorService#shutdown()* @see java.util.concurrent.ExecutorService#shutdownNow()*/
public void shutdown() {if (logger.isInfoEnabled()) {logger.info("Shutting down ExecutorService" + (this.beanName != null ? " '" + this.beanName + "'" : ""));}if (this.executor != null) {if (this.waitForTasksToCompleteOnShutdown) {this.executor.shutdown();}else {for (Runnable remainingTask : this.executor.shutdownNow()) {cancelRemainingTask(remainingTask);}}awaitTerminationIfNecessary(this.executor);}
}private void awaitTerminationIfNecessary(ExecutorService executor) {if (this.awaitTerminationMillis > 0) {try {if (!executor.awaitTermination(this.awaitTerminationMillis, TimeUnit.MILLISECONDS)) {if (logger.isWarnEnabled()) {logger.warn("Timed out while waiting for executor" +(this.beanName != null ? " '" + this.beanName + "'" : "") + " to terminate");}}}catch (InterruptedException ex) {if (logger.isWarnEnabled()) {logger.warn("Interrupted while waiting for executor" +(this.beanName != null ? " '" + this.beanName + "'" : "") + " to terminate");}Thread.currentThread().interrupt();}}
}

这样我们可以根据任务最大的超时时间,设置线程池属性,在JVM关闭时等待线程池中的任务执行完成。
方案对比:

  • 方案3的实现会导致部署时间的增加,但是可以确保当前定时任务处理完成。
  • 方案1和方案2会对当前任务不做处理,同时方案1会存在一定的风险。

可以结合实际业务场景需要进行选择,当然这里只有方案3才是优雅退出。

补充

提到优雅退出,实际Spring有针对web的优雅退出。

修改application.properties配置文件,将server.shutdown从默认的immediate修改为graceful.同时设置等待时间为60s。

也就是说当收到退出请求时,如果此时有web请求还在处理,那么可最多等待60s后再退出。

server.shutdown=graceful
spring.lifecycle.timeout-per-shutdown-phase=60s
{"name": "server.shutdown","type": "org.springframework.boot.web.server.Shutdown","description": "Type of shutdown that the server will support.","sourceType": "org.springframework.boot.autoconfigure.web.ServerProperties","defaultValue": "immediate"
}{"name": "spring.lifecycle.timeout-per-shutdown-phase","type": "java.time.Duration","description": "Timeout for the shutdown of any phase (group of SmartLifecycle beans with the same 'phase' value).","sourceType": "org.springframework.boot.autoconfigure.context.LifecycleProperties","defaultValue": "30s"
}

当存在一个正在处理的耗时web请求,当进程关闭时,日志中会包含以下信息

2023-08-05 00:16:32.264 o.s.b.w.e.tomcat.GracefulShutdown : Commencing graceful shutdown. Waiting for active requests to complete
2023-08-05 00:17:32.278 o.s.b.w.e.tomcat.GracefulShutdown: Graceful shutdown aborted with one or more requests still active

最后再强调一次,这里无论哪一种优雅退出,都是针对的kil -15这种操作,这是操作系统给了应用进程优雅退出的机会,如果是kill -9那么就不存在优雅退出了,因为会被立即停止执行。

相关文章:

一种SpringBoot下Scheduler定时任务优雅退出方案

背景 近期业务中有一个定时任务发现每次服务部署时&#xff0c;偶发性的会触发问题&#xff0c;这里记录一下问题的跟进解决。 分析现象 该定时任务每2分钟执行一次&#xff0c;完成数据的更新处理。同时服务部署了多个服务器节点&#xff0c;为保证每次只有一个服务器节点上…...

DNS部署与安全详解(上)

文章目录 一、DNS二、域名组成1. 域名组成概述2. 域名组成 三、监听端口四、DNS解析种类1. 按照查询方式分类&#xff1a;2. 按照查询内容分类&#xff1a; 五、DNS服务器搭建过程1. 先确保服务器的IP地址是固定的2. 安装DNS软件 一、DNS DNS全称Domain Name Service&#xff0…...

【51单片机】晨启科技,酷黑版,音乐播放器

四、音乐播放器 任务要求&#xff1a; 设计制作一个简易音乐播放器&#xff08;通过手柄板上的蜂鸣器发声&#xff0c;播放2到4首音乐&#xff09;&#xff0c;同时LED模块闪烁&#xff0c;给人视、听觉美的感受。 评分细则&#xff1a; 按下播放按键A6开始播放音乐&#xff0…...

基于SPSSPRO实现层次分析法(AHP)

层次分析法&#xff0c;简称AHP&#xff0c;是指将与决策总是有关的元素分解成目标、准则、方案等层次&#xff0c;在此基础之上进行定性和定量分析的决策方法。&#xff08;摘自百度百科&#xff09; 层次分析法有着广泛使用&#xff0c;涉及到的平台也多种多样&#xff0c;今…...

Spring Test中使用MockMvc进行上传文件单元测试时,报NullPointerException

问题&#xff1a; MockMvc peform在集成测试中返回nullPointerException 原因&#xff1a; springboot-2.x版本以上&#xff0c;当你添加依赖spring_boot_starter_test后&#xff0c;可以在内部看到自带了jupiter测试核心模块&#xff0c;也就是 junit5&#xff0c;junit5&am…...

HTTP常用状态码及其含义

HTTP常用状态码及其含义 1XX&#xff1a;信息&#xff0c;服务器收到请求&#xff0c;需要请求者继续执行操 状态码状态码英文名称中文描述100Continue继续。客户端应继续其请求101Switching Protocols切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议&…...

FFmpeg中AVIOContext的使用

通过FFmpeg对视频进行编解码时&#xff0c;如果输入文件存在本机或通过USB摄像头、笔记本内置摄像头获取数据时&#xff0c;可通过avformat_open_input接口中的第二个参数直接指定即可。但如果待处理的视频数据存在于内存块中时&#xff0c;该如何指定&#xff0c;可通过FFmpeg…...

【react】react中BrowserRouter和HashRouter的区别:

文章目录 1.底层原理不一样:2.path衣现形式不一样3.刷新后对路山state参数的影响4.备注: HashRouter可以用于解决一些路径错误相关的问题 1.底层原理不一样: BrowserRouter使用的是H5的history API&#xff0c;不兼容IE9及以下版不。 HashRouter使用的是URL的哈希值。 2.path衣…...

机器学习常用Python库安装

机器学习常用Python库安装 作者日期版本说明Dog Tao2022.06.16V1.0开始建立文档 文章目录 机器学习常用Python库安装Anaconda简介使用镜像源配置 Pip简介镜像源配置 CUDAPytorch安装旧版本 TensorFlowGPU支持说明 DGL简介安装DGLLife RDKitscikit-multilearn Anaconda 简介 …...

HTTP 劫持、DNS 劫持与 XSS

HTTP 劫持、DNS 劫持与 XSS http 劫持是指攻击者在客户端和服务器之间同时建立了连接通道&#xff0c;通过某种方式&#xff0c;让客户端请求发送到自己的服务器&#xff0c;然后自己就拥有了控制响应内容的能力&#xff0c;从而给客户端展示错误的信息&#xff0c;比如在页面中…...

bash引用-Quoting详细介绍

bash引用-Quoting详细介绍 概述 引用的字面意思就是&#xff0c;用引号括住一个字符串。这可以保护字符串中的特殊字符不被shell或shell脚本重新解释或扩展。(如果一个字有不同于其字面意思的解释&#xff0c;它就是“特殊的”。例如&#xff1a;星号*除了本身代表*号以外还表…...

powershell几句话设置环境变量

设置环境变量比较繁琐&#xff0c;现在用这段话&#xff0c;在powershell中就可以轻松完成。 $existingPath [Environment]::GetEnvironmentVariable("Path", "Machine") $newPath "C:\Your\Path\Here"if ($existingPath -split ";"…...

Javascript 数据结构[入门]

作者&#xff1a;20岁爱吃必胜客&#xff08;坤制作人&#xff09;&#xff0c;近十年开发经验, 跨域学习者&#xff0c;目前于海外某世界知名高校就读计算机相关专业。荣誉&#xff1a;阿里云博客专家认证、腾讯开发者社区优质创作者&#xff0c;在CTF省赛校赛多次取得好成绩。…...

IO(JavaEE初阶系列8)

目录 前言&#xff1a; 1.文件 1.1认识文件 1.2结构和目录 1.3文件路径 1.4文本文件vs二进制文件 2.文件系统的操作 2.1Java中操作文件 2.2File概述 2.2.1构造File对象 2.2.2File中的一些方法 3.文件内容的操作 3.1字节流 3.1.1InPutStream的使用方法 3.1.2OutPu…...

React Native 样式表的基础知识

在 React Native 中我们要使用组件元素进行样式设置的话&#xff0c;我们需要使用StyleSheet组件才能制定样式。useColorScheme是为 APP 定义颜色主题的。在此笔记中我们只是简单做一个介绍和使用。 使用StyleSheet定义样式 当我们要使用StyleSheet的话&#xff0c;我们需要引…...

【JS 解构赋值】

JS 解构赋值是 ES6 中一种简洁、高效的赋值方式&#xff0c;它可以将数组和对象中的值拆分出来并赋值给变量。 解构赋值 解构数组解构对象嵌套解构结语 解构数组 解构数组时&#xff0c;需要使用方括号 [] 包围变量名&#xff0c;并用逗号 , 将变量名隔开。 let [a, b, c] …...

Vue3状态管理库Pinia——自定义持久化插件

个人简介 &#x1f440;个人主页&#xff1a; 前端杂货铺 &#x1f64b;‍♂️学习方向&#xff1a; 主攻前端方向&#xff0c;正逐渐往全干发展 &#x1f4c3;个人状态&#xff1a; 研发工程师&#xff0c;现效力于中国工业软件事业 &#x1f680;人生格言&#xff1a; 积跬步…...

il汇编整数相加

在这里尝试了IL汇编字符串连接&#xff1b; IL汇编字符串连接_bcbobo21cn的博客-CSDN博客 下面来看一下IL汇编整数相加&#xff1b; 大概的看一下一些资料&#xff0c;下面语句&#xff0c; ldc.i4 20 ldc.i4 30 add 看上去像是&#xff0c;装载整数20到一个类似于…...

RabbitMQ 事务

事务简介 就像我们了解的MySQL中的事务一样&#xff0c;RabbiMQ的事务也具备原子性和一致性&#xff0c;并且RabbiMQ的事务是针对消息从生产者发送到RabbitMQ中提供的支持&#xff0c;因此不同事务可以同时给同一个队列发送信息。   可通过channel.txSelect&#xff0c;chann…...

vue前端 让年月日 加上23:59:59

yyyy/MM/dd HH:mm:ss 格式 // 获取 lateCreateTime 的原始时间戳 const timestamp new Date(this.queryAO.lateCreateTime).getTime();// 将时间戳转换为指定格式的字符串 const formattedDateTime new Date(timestamp).toLocaleString("zh-CN", {year: "num…...

终极解决方案:5分钟完成DOCX到LaTeX的专业转换指南 [特殊字符]

终极解决方案&#xff1a;5分钟完成DOCX到LaTeX的专业转换指南 &#x1f680; 【免费下载链接】docx2tex Converts Microsoft Word docx to LaTeX 项目地址: https://gitcode.com/gh_mirrors/do/docx2tex 还在为Word文档转换LaTeX格式而烦恼吗&#xff1f;docx2tex就是你…...

实时口罩检测-通用镜像效果展示:绿色框已戴,红色框未戴,一目了然

实时口罩检测-通用镜像效果展示&#xff1a;绿色框已戴&#xff0c;红色框未戴&#xff0c;一目了然 1. 开箱即用的口罩检测方案 在公共场所管理中&#xff0c;快速识别人员是否佩戴口罩一直是个实际需求。传统方法要么需要专业设备&#xff0c;要么准确率不高。今天要介绍的…...

使用MATLAB进行DeOldify结果的后处理与定量分析

使用MATLAB进行DeOldify结果的后处理与定量分析 如果你是一位习惯在MATLAB环境中工作的研究人员或工程师&#xff0c;当你想对DeOldify这类AI图像上色工具的输出结果进行更深入的评估时&#xff0c;可能会觉得缺少趁手的分析工具。直接看效果图固然直观&#xff0c;但如何量化…...

Wan2.2-I2V-A14B企业级部署案例:单卡24GB显存实现高并发视频API服务

Wan2.2-I2V-A14B企业级部署案例&#xff1a;单卡24GB显存实现高并发视频API服务 1. 企业级视频生成解决方案概述 在数字内容创作领域&#xff0c;视频生成技术正经历革命性变革。Wan2.2-I2V-A14B作为新一代文生视频模型&#xff0c;通过私有化部署方案&#xff0c;为企业提供…...

Java 26 FFM API进阶:零JNI调用TensorRT/OpenVINO,AI端到端延迟砍半

文章目录一、JNI&#xff0c;AI时代的"文言文写作"二、FFM API&#xff1a;Java调用原生代码的"现代白话文"1. Arena&#xff1a;比try-with-resources还狠的内存管理2. Linker&#xff1a;C函数的"Java身份证"3. jextract&#xff1a;头文件自动…...

Vivado项目文件太多分不清?这份FPGA开发必备的‘文件后缀速查手册’请收好

Vivado项目文件管理终极指南&#xff1a;从后缀识别到高效工作流 当你第一次打开一个成熟的Vivado项目文件夹时&#xff0c;那种面对几十种陌生文件后缀的茫然感&#xff0c;相信每个FPGA开发者都记忆犹新。就像走进了一个满是神秘符号的仓库&#xff0c;每个文件似乎都在向你发…...

Deepin系统远程桌面实战:从零配置xrdp服务到Windows无缝连接

Deepin系统远程桌面实战&#xff1a;从零配置xrdp服务到Windows无缝连接 在跨平台协作成为常态的今天&#xff0c;远程桌面技术让不同操作系统间的无缝协作成为可能。对于使用Deepin系统的用户而言&#xff0c;如何高效地通过Windows设备远程访问和控制Deepin桌面&#xff0c;是…...

从原理到代码:深入解析UniFormer的多头关系聚合器(MHRA)设计

从原理到代码&#xff1a;深入解析UniFormer的多头关系聚合器(MHRA)设计 视频理解领域近年来经历了从3D卷积网络到视觉Transformer的范式转变&#xff0c;但两者在时空特征提取上各有限制。3D CNN擅长捕捉局部时空特征却受限于固定感受野&#xff0c;而视觉Transformer虽能建模…...

ClawdBot代码实例:修改clawdbot.json实现模型热切换实操

ClawdBot代码实例&#xff1a;修改clawdbot.json实现模型热切换实操 1. 引言&#xff1a;你的个人AI助手&#xff0c;想换模型就换模型 想象一下&#xff0c;你有一个24小时在线的AI助手&#xff0c;它能帮你写代码、回答问题、整理文档。但用久了&#xff0c;你可能会想&…...

Phi-4-mini-reasoning实操手册:针对数学题优化的token长度设置技巧

Phi-4-mini-reasoning实操手册&#xff1a;针对数学题优化的token长度设置技巧 1. 模型特点与适用场景 Phi-4-mini-reasoning是一个专为推理任务优化的文本生成模型&#xff0c;特别适合处理需要多步分析的数学题和逻辑题。与通用聊天模型不同&#xff0c;它被设计为直接输出…...