一种SpringBoot下Scheduler定时任务优雅退出方案
背景
近期业务中有一个定时任务发现每次服务部署时,偶发性的会触发问题,这里记录一下问题的跟进解决。
分析现象
该定时任务每2分钟执行一次,完成数据的更新处理。同时服务部署了多个服务器节点,为保证每次只有一个服务器节点上的任务在跑,引入了基于Redis缓存的分布式锁。
示例源码
@Scheduled(cron = "10 */2 * * * ?")
public void execute() {String jobName = getJobName();DistributeLock lock = distributeLock.newLock(getJobKey(), 5 * 60);if (!lock.tryLock()) {logger.info(" {} execute get lock faild......", jobName);return;}try {logger.info("execute start........ {}", jobName);long startTime = System.currentTimeMillis();doExecute();long endTime = System.currentTimeMillis();logger.info("execute end........,time:{} ms", (endTime - startTime));} catch (Exception e) {logger.error("execute error", e);} finally {lock.unlock();}
}
当服务部署时,分析日志发现存在以下异常。
- 任务存在开始日志,但是缺少执行结束时候的日志。
- 新服务启动后,会存在空的运行周期,所有的节点获取锁失败。
原因: 我们假设任务在具体执行doExecute方法时,服务器节点收到了重新部署的命令。
- 那么此时JVM进程会被kill,由于JVM直接被kill,并没有任何优雅退出的处理,此时也就不会有任务执行结束的日志.
- 同样的,上述代码中的finally语句也不会被执行到,所以锁就不会被释放。
- 由于锁未被及时释放,当下一个2分钟执行周期来到时,我们看到上一个锁的时间是5*60s,此时是无法获取锁的,导致空了一个定时任务周期。
解决方案
方案1:缩短锁的持有时间
将锁的持有时间修改为2分钟,考虑到通常的节点部署时间是超过2分钟的,这样可以保证新服务部署的时候,上一个锁是已经过期的。
看似是可以解决问题的,那么实际可以的吗。其实不然,这种方案是有风险的,因为这里忽略了doExecute的实际执行时间。
原有的5分钟是确定任务最长执行时间不会超过5分钟,但是将锁过期时间设置2分钟实际是否风险的。
举个例子:
10:00 任务1开始执行,执行时间为3分钟,要到10:03才会结束。
10:02 任务2开始执行,此时任务1还在执行,但是由于锁已经过期了,此时任务2也开始执行,要到10:05才会结束。
这就会导致,同一时刻,会存在重叠的任务在执行。
所以不能冒然调整锁的持有时间。
方案2: 利用钩子在服务器停止的时候,将锁显示释放
该方案依赖Spring或者JVM的关闭钩子,在进程销毁的时候,进行一些清理工作。
比如可以依赖Spring的ApplicationListener监听ContextClosedEvent事件。
@Component
@Slf4j
public class DistributeLockShutdownHook implements ApplicationListener<ContextClosedEvent> {@Overridepublic void onApplicationEvent(ContextClosedEvent event) {log.info("shutdown hook, ContextClosedEvent");// 先判断当前节点是否持有定时任务的锁,如果持有// 利用redis缓存的api,直接删除定时任务持有的锁;// 如果不持有锁,不做处理。}
}
这样可以保证锁是清理掉的,后续启动的节点就可以成功获取锁了。
不过这里有一点要注意,在清理时,一定是当前节点之前持有了这把锁才清理。否则,如果不做判断直接清理,就会出现问题,这通常与我们服务部署时,是按照百分比部署有关系。
10:00 B节点正在执行任务,持有锁,任务执行3分钟。
10:01 A节点此时要重新部署服务,将锁删除
10:02 C节点开始执行任务,获取锁成功,也开始执行任务。
那么此时也会导致多个任务在重叠执行。
方案3: 通过定制化线程池,等待当前定时任务执行完成优雅退出
可以看到方案1和方案2,当前正在执行的任务都是直接被终止掉了,那是否有办法等待当前定时任务执行完成,再关闭JVM呢。可以尝试使用以下方案。
首先,我们给Spring Schedule定时任务指定了线程池,同时配置了线程池的关闭策略和关闭等待时间。
@Configuration
public class ThreadPoolTaskSchedulerConfig {@Beanpublic ThreadPoolTaskScheduler threadPoolTaskScheduler () {ThreadPoolTaskScheduler threadPoolTaskScheduler = new ThreadPoolTaskScheduler();//线程池大小为10threadPoolTaskScheduler.setPoolSize(10);//设置线程名称前缀threadPoolTaskScheduler.setThreadNamePrefix("scheduled-thread-test-");//关键点: 设置线程池关闭的时候等待所有任务都完成再继续销毁其他的BeanthreadPoolTaskScheduler.setWaitForTasksToCompleteOnShutdown(true);//关键点:设置线程池中任务的等待时间,如果超过这个时候还没有销毁就强制销毁,以确保应用最后能够被关闭,而不是阻塞住threadPoolTaskScheduler.setAwaitTerminationSeconds(60);threadPoolTaskScheduler.initialize();return threadPoolTaskScheduler;}
}
@Configuration
public class SchedulerConfig implements SchedulingConfigurer {@Resourceprivate ThreadPoolTaskScheduler threadPoolTaskScheduler;@Overridepublic void configureTasks(ScheduledTaskRegistrar scheduledTaskRegistrar) {scheduledTaskRegistrar.setTaskScheduler(threadPoolTaskScheduler);}
}
然后监听Spring的ContextClosedEvent,在其中触发线程池的shutdown方法。
@Component
@Slf4j
public class ShutdownHookDemo implements ApplicationListener<ContextClosedEvent> {@Resourceprivate ThreadPoolTaskScheduler threadPoolTaskScheduler;@Overridepublic void onApplicationEvent(ContextClosedEvent event) {log.info("shutdown hook, ContextClosedEvent");threadPoolTaskScheduler.destroy();}
}
对于ThreadPoolTaskScheduler的destroy方法,源码如下所示:
可以看到会触发ExecutorService的shutDown方法,等待任务执行完成。而awaitTerminationIfNecessary方法则是限时等待,如果超时,则将线程中断。
/*** Calls {@code shutdown} when the BeanFactory destroys* the task executor instance.* @see #shutdown()*/
@Override
public void destroy() {shutdown();
}/*** Perform a shutdown on the underlying ExecutorService.* @see java.util.concurrent.ExecutorService#shutdown()* @see java.util.concurrent.ExecutorService#shutdownNow()*/
public void shutdown() {if (logger.isInfoEnabled()) {logger.info("Shutting down ExecutorService" + (this.beanName != null ? " '" + this.beanName + "'" : ""));}if (this.executor != null) {if (this.waitForTasksToCompleteOnShutdown) {this.executor.shutdown();}else {for (Runnable remainingTask : this.executor.shutdownNow()) {cancelRemainingTask(remainingTask);}}awaitTerminationIfNecessary(this.executor);}
}private void awaitTerminationIfNecessary(ExecutorService executor) {if (this.awaitTerminationMillis > 0) {try {if (!executor.awaitTermination(this.awaitTerminationMillis, TimeUnit.MILLISECONDS)) {if (logger.isWarnEnabled()) {logger.warn("Timed out while waiting for executor" +(this.beanName != null ? " '" + this.beanName + "'" : "") + " to terminate");}}}catch (InterruptedException ex) {if (logger.isWarnEnabled()) {logger.warn("Interrupted while waiting for executor" +(this.beanName != null ? " '" + this.beanName + "'" : "") + " to terminate");}Thread.currentThread().interrupt();}}
}
这样我们可以根据任务最大的超时时间,设置线程池属性,在JVM关闭时等待线程池中的任务执行完成。
方案对比:
- 方案3的实现会导致部署时间的增加,但是可以确保当前定时任务处理完成。
- 方案1和方案2会对当前任务不做处理,同时方案1会存在一定的风险。
可以结合实际业务场景需要进行选择,当然这里只有方案3才是优雅退出。
补充
提到优雅退出,实际Spring有针对web的优雅退出。
修改application.properties配置文件,将server.shutdown从默认的immediate修改为graceful.同时设置等待时间为60s。
也就是说当收到退出请求时,如果此时有web请求还在处理,那么可最多等待60s后再退出。
server.shutdown=graceful
spring.lifecycle.timeout-per-shutdown-phase=60s
{"name": "server.shutdown","type": "org.springframework.boot.web.server.Shutdown","description": "Type of shutdown that the server will support.","sourceType": "org.springframework.boot.autoconfigure.web.ServerProperties","defaultValue": "immediate"
}{"name": "spring.lifecycle.timeout-per-shutdown-phase","type": "java.time.Duration","description": "Timeout for the shutdown of any phase (group of SmartLifecycle beans with the same 'phase' value).","sourceType": "org.springframework.boot.autoconfigure.context.LifecycleProperties","defaultValue": "30s"
}
当存在一个正在处理的耗时web请求,当进程关闭时,日志中会包含以下信息
2023-08-05 00:16:32.264 o.s.b.w.e.tomcat.GracefulShutdown : Commencing graceful shutdown. Waiting for active requests to complete
2023-08-05 00:17:32.278 o.s.b.w.e.tomcat.GracefulShutdown: Graceful shutdown aborted with one or more requests still active
最后再强调一次,这里无论哪一种优雅退出,都是针对的kil -15这种操作,这是操作系统给了应用进程优雅退出的机会,如果是kill -9那么就不存在优雅退出了,因为会被立即停止执行。
相关文章:
一种SpringBoot下Scheduler定时任务优雅退出方案
背景 近期业务中有一个定时任务发现每次服务部署时,偶发性的会触发问题,这里记录一下问题的跟进解决。 分析现象 该定时任务每2分钟执行一次,完成数据的更新处理。同时服务部署了多个服务器节点,为保证每次只有一个服务器节点上…...
DNS部署与安全详解(上)
文章目录 一、DNS二、域名组成1. 域名组成概述2. 域名组成 三、监听端口四、DNS解析种类1. 按照查询方式分类:2. 按照查询内容分类: 五、DNS服务器搭建过程1. 先确保服务器的IP地址是固定的2. 安装DNS软件 一、DNS DNS全称Domain Name Service࿰…...
【51单片机】晨启科技,酷黑版,音乐播放器
四、音乐播放器 任务要求: 设计制作一个简易音乐播放器(通过手柄板上的蜂鸣器发声,播放2到4首音乐),同时LED模块闪烁,给人视、听觉美的感受。 评分细则: 按下播放按键A6开始播放音乐࿰…...
基于SPSSPRO实现层次分析法(AHP)
层次分析法,简称AHP,是指将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。(摘自百度百科) 层次分析法有着广泛使用,涉及到的平台也多种多样,今…...
Spring Test中使用MockMvc进行上传文件单元测试时,报NullPointerException
问题: MockMvc peform在集成测试中返回nullPointerException 原因: springboot-2.x版本以上,当你添加依赖spring_boot_starter_test后,可以在内部看到自带了jupiter测试核心模块,也就是 junit5,junit5&am…...
HTTP常用状态码及其含义
HTTP常用状态码及其含义 1XX:信息,服务器收到请求,需要请求者继续执行操 状态码状态码英文名称中文描述100Continue继续。客户端应继续其请求101Switching Protocols切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议&…...
FFmpeg中AVIOContext的使用
通过FFmpeg对视频进行编解码时,如果输入文件存在本机或通过USB摄像头、笔记本内置摄像头获取数据时,可通过avformat_open_input接口中的第二个参数直接指定即可。但如果待处理的视频数据存在于内存块中时,该如何指定,可通过FFmpeg…...
【react】react中BrowserRouter和HashRouter的区别:
文章目录 1.底层原理不一样:2.path衣现形式不一样3.刷新后对路山state参数的影响4.备注: HashRouter可以用于解决一些路径错误相关的问题 1.底层原理不一样: BrowserRouter使用的是H5的history API,不兼容IE9及以下版不。 HashRouter使用的是URL的哈希值。 2.path衣…...
机器学习常用Python库安装
机器学习常用Python库安装 作者日期版本说明Dog Tao2022.06.16V1.0开始建立文档 文章目录 机器学习常用Python库安装Anaconda简介使用镜像源配置 Pip简介镜像源配置 CUDAPytorch安装旧版本 TensorFlowGPU支持说明 DGL简介安装DGLLife RDKitscikit-multilearn Anaconda 简介 …...
HTTP 劫持、DNS 劫持与 XSS
HTTP 劫持、DNS 劫持与 XSS http 劫持是指攻击者在客户端和服务器之间同时建立了连接通道,通过某种方式,让客户端请求发送到自己的服务器,然后自己就拥有了控制响应内容的能力,从而给客户端展示错误的信息,比如在页面中…...
bash引用-Quoting详细介绍
bash引用-Quoting详细介绍 概述 引用的字面意思就是,用引号括住一个字符串。这可以保护字符串中的特殊字符不被shell或shell脚本重新解释或扩展。(如果一个字有不同于其字面意思的解释,它就是“特殊的”。例如:星号*除了本身代表*号以外还表…...
powershell几句话设置环境变量
设置环境变量比较繁琐,现在用这段话,在powershell中就可以轻松完成。 $existingPath [Environment]::GetEnvironmentVariable("Path", "Machine") $newPath "C:\Your\Path\Here"if ($existingPath -split ";"…...
Javascript 数据结构[入门]
作者:20岁爱吃必胜客(坤制作人),近十年开发经验, 跨域学习者,目前于海外某世界知名高校就读计算机相关专业。荣誉:阿里云博客专家认证、腾讯开发者社区优质创作者,在CTF省赛校赛多次取得好成绩。…...
IO(JavaEE初阶系列8)
目录 前言: 1.文件 1.1认识文件 1.2结构和目录 1.3文件路径 1.4文本文件vs二进制文件 2.文件系统的操作 2.1Java中操作文件 2.2File概述 2.2.1构造File对象 2.2.2File中的一些方法 3.文件内容的操作 3.1字节流 3.1.1InPutStream的使用方法 3.1.2OutPu…...
React Native 样式表的基础知识
在 React Native 中我们要使用组件元素进行样式设置的话,我们需要使用StyleSheet组件才能制定样式。useColorScheme是为 APP 定义颜色主题的。在此笔记中我们只是简单做一个介绍和使用。 使用StyleSheet定义样式 当我们要使用StyleSheet的话,我们需要引…...
【JS 解构赋值】
JS 解构赋值是 ES6 中一种简洁、高效的赋值方式,它可以将数组和对象中的值拆分出来并赋值给变量。 解构赋值 解构数组解构对象嵌套解构结语 解构数组 解构数组时,需要使用方括号 [] 包围变量名,并用逗号 , 将变量名隔开。 let [a, b, c] …...
Vue3状态管理库Pinia——自定义持久化插件
个人简介 👀个人主页: 前端杂货铺 🙋♂️学习方向: 主攻前端方向,正逐渐往全干发展 📃个人状态: 研发工程师,现效力于中国工业软件事业 🚀人生格言: 积跬步…...
il汇编整数相加
在这里尝试了IL汇编字符串连接; IL汇编字符串连接_bcbobo21cn的博客-CSDN博客 下面来看一下IL汇编整数相加; 大概的看一下一些资料,下面语句, ldc.i4 20 ldc.i4 30 add 看上去像是,装载整数20到一个类似于…...
RabbitMQ 事务
事务简介 就像我们了解的MySQL中的事务一样,RabbiMQ的事务也具备原子性和一致性,并且RabbiMQ的事务是针对消息从生产者发送到RabbitMQ中提供的支持,因此不同事务可以同时给同一个队列发送信息。 可通过channel.txSelect,chann…...
vue前端 让年月日 加上23:59:59
yyyy/MM/dd HH:mm:ss 格式 // 获取 lateCreateTime 的原始时间戳 const timestamp new Date(this.queryAO.lateCreateTime).getTime();// 将时间戳转换为指定格式的字符串 const formattedDateTime new Date(timestamp).toLocaleString("zh-CN", {year: "num…...
【Axure高保真原型】引导弹窗
今天和大家中分享引导弹窗的原型模板,载入页面后,会显示引导弹窗,适用于引导用户使用页面,点击完成后,会显示下一个引导弹窗,直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…...
深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...
Frozen-Flask :将 Flask 应用“冻结”为静态文件
Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是:将一个 Flask Web 应用生成成纯静态 HTML 文件,从而可以部署到静态网站托管服务上,如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...
CocosCreator 之 JavaScript/TypeScript和Java的相互交互
引擎版本: 3.8.1 语言: JavaScript/TypeScript、C、Java 环境:Window 参考:Java原生反射机制 您好,我是鹤九日! 回顾 在上篇文章中:CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...
相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...
LLM基础1_语言模型如何处理文本
基于GitHub项目:https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken:OpenAI开发的专业"分词器" torch:Facebook开发的强力计算引擎,相当于超级计算器 理解词嵌入:给词语画"…...
全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比
目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...
Rapidio门铃消息FIFO溢出机制
关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系,以下是深入解析: 门铃FIFO溢出的本质 在RapidIO系统中,门铃消息FIFO是硬件控制器内部的缓冲区,用于临时存储接收到的门铃消息(Doorbell Message)。…...
动态 Web 开发技术入门篇
一、HTTP 协议核心 1.1 HTTP 基础 协议全称 :HyperText Transfer Protocol(超文本传输协议) 默认端口 :HTTP 使用 80 端口,HTTPS 使用 443 端口。 请求方法 : GET :用于获取资源,…...
认识CMake并使用CMake构建自己的第一个项目
1.CMake的作用和优势 跨平台支持:CMake支持多种操作系统和编译器,使用同一份构建配置可以在不同的环境中使用 简化配置:通过CMakeLists.txt文件,用户可以定义项目结构、依赖项、编译选项等,无需手动编写复杂的构建脚本…...
