springboot实现异步导入Excel的注意点
springboot实现异步导入Excel
- 需求前言
- 异步导入面临的问题
- 实现异步
- 如何导入大Excel文件避免OOM?
- 异步操作后,如何通知导入结果?
- 如何加快导入效率?
- 将导入结果通知给用户后,如何避免重复通知?
- 优化点
- 完结撒花,如有需要收藏的看官,顺便也用发财的小手点点赞哈,如有错漏,也欢迎各位在评论区评论!
需求前言
前文介绍了使用断点续传优化同步导入Excel,即使并发上传分片,依然会因上传耗时对用户体验感不好,故上文只起到抛砖引玉的作用,生产上使用较多的还是异步导入的方式。
异步导入面临的问题
先说说流程:
1、异步导入Excel,后端使用springboot和easyExcel接收处理,并入库,同时异步导入结果会保存到消息通知表;
2、通知前端页面的收件箱有红点表示有导入结果,并且用户点击收件箱查看完,就会取消红点表示已查看过了,下次用户打开前端页面就不会有红点了;
面临的问题:
1、如何实现异步?
2、如何导入大Excel文件避免OOM?
3、异步操作后,如何通知导入结果?
4、如何加快导入效率?
5、将导入结果通知给用户后,如何避免重复通知?
往下看就知道如何解决上述问题了
实现异步
使用spring的Async注解实现异步,但要注意配置线程池,否则在并发导入时,创建多个线程处理异步容易出现OOM,代码如下:
@Configuration
@EnableAsync
public class AsyncConfig implements AsyncConfigurer {@Overridepublic Executor getAsyncExecutor() {ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();executor.setCorePoolSize(5);executor.setMaxPoolSize(10);executor.setQueueCapacity(100);executor.setThreadNamePrefix("ExcelImport-");executor.initialize();return executor;}
}@Service
@RequiredArgsConstructor
public class ExcelImportService {private final ImportTaskMapper taskMapper;private final ImportMessageMapper messageMapper;private final UserService userService;@Asyncpublic void asyncImport(String taskId, File excelFile) {.................}
}
如何导入大Excel文件避免OOM?
使用阿里的easyExcel工具即可避免,前文也介绍过其操作原理,这里就不多做解释了。
异步操作后,如何通知导入结果?
在导入的大Excel文件,处理数据是异步的,所以需要将处理是成功还是失败的结果保存到一个消息通知表中,供用户访问,示例如csdn有一个消息通知的功能
消息通知表设计:
CREATE TABLE import_message (id BIGINT AUTO_INCREMENT PRIMARY KEY,task_id VARCHAR(32) NOT NULL COMMENT '关联任务ID',user_id BIGINT NOT NULL COMMENT '用户ID',is_read TINYINT DEFAULT 0 COMMENT '是否已读(0:未读,1:已读)',create_time DATETIME DEFAULT CURRENT_TIMESTAMP
);
代码如下:
@Service
@RequiredArgsConstructor
public class ExcelImportService {private final ImportTaskMapper taskMapper;private final ImportMessageMapper messageMapper;private final UserService userService;@Asyncpublic void asyncImport(String taskId, File excelFile) {ImportTask task = taskMapper.selectById(taskId);try {// 使用EasyExcel解析ImportResult result = EasyExcel.read(excelFile).head(ExcelData.class).registerReadListener(new DataListener(task)).sheet().doRead();// 更新任务状态task.setStatus(1);task.setSuccessCount(result.getSuccessCount());task.setErrorCount(result.getErrorCount());if (result.hasErrors()) {task.setErrorFile(generateErrorFile(result));}} catch (Exception e) {task.setStatus(2);task.setErrorCount(-1); // 表示系统错误} finally {taskMapper.updateById(task);createMessage(task); // 创建通知消息}}private void createMessage(ImportTask task) {ImportMessage message = new ImportMessage();message.setTaskId(task.getId());message.setUserId(task.getUserId());messageMapper.insert(message);}
}// 数据监听器
public class DataListener extends AnalysisEventListener<ExcelData> {private final ImportTask task;private final List<ExcelData> cachedData = new ArrayList<>();private final List<ErrorRow> errors = new ArrayList<>();@Overridepublic void invoke(ExcelData data, AnalysisContext context) {// 数据校验逻辑...cachedData.add(data);if (cachedData.size() >= 100) {saveBatch(cachedData);cachedData.clear();}}@Overridepublic void doAfterAllAnalysed(AnalysisContext context) {if (!cachedData.isEmpty()) {saveBatch(cachedData);}}private void saveBatch(List<ExcelData> list) {try {// 批量入库逻辑} catch (Exception e) {// 记录错误行errors.add(new ErrorRow(/* 行信息 */));}}
}@RestController
@RequestMapping("/api/import")
@RequiredArgsConstructor
public class ImportController {private final ExcelImportService importService;// 获取未读消息数量@GetMapping("/unread-count")public ResponseEntity<Integer> getUnreadCount(@AuthenticationPrincipal User user) {int count = messageMapper.countUnread(user.getId());return ResponseEntity.ok(count);}// 标记消息已读@PostMapping("/mark-read")public ResponseEntity<?> markAsRead(@RequestBody List<Long> messageIds) {messageMapper.updateReadStatus(messageIds, 1);return ResponseEntity.ok().build();}// 启动异步导入@PostMappingpublic ResponseEntity<?> startImport(@RequestParam MultipartFile file) {String taskId = IdUtil.simpleUUID();File tempFile = saveToTemp(file); // 保存临时文件ImportTask task = new ImportTask();task.setId(taskId);task.setUserId(SecurityUtils.getCurrentUserId());task.setFileName(file.getOriginalFilename());task.setStatus(0);taskMapper.insert(task);importService.asyncImport(taskId, tempFile);return ResponseEntity.ok(Map.of("taskId", taskId));}
}
如何加快导入效率?
避免for循环每次与DB建立一个连接,应该使用MyBatis-Plus的批量插入
List<User> userList = new ArrayList<>();
User user;
for(int i = 0 ;i < 10000; i++) {user = new User();user.setUsername("name" + i);user.setPassword("password" + i);userList.add(user);
}
saveBatch(userList);
MyBatis-Plus的saveBatch方法默认是使用JDBC的addBatch()和executeBatch()方法实现批量插入。但是部分数据库的JDBC驱动并不支持addBatch(),这样每次插入都会发送一条SQL语句,严重影响了批量插入的性能。设置rewriteBatchedStatements=true后,MyBatis-Plus会重写插入语句,将其合并为一条SQL语句,从而减少网络交互次数,提高批量插入的效率。
将导入结果通知给用户后,如何避免重复通知?
前面也说过,导入Excel的结果会保存到消息表中,前端在登录后,通过访问“标记消息已读”接口标记为已读,至于前端如何发现有消息结果,直接使用定时轮训即可(csdn也是用这种来发现消息通知),前端访问代码如下:
<template><!-- 上传组件 --><el-uploadaction="/api/import":show-file-list="false":before-upload="beforeUpload"@success="handleSuccess"><el-button type="primary">导入Excel</el-button></el-upload><!-- 通知红点 --><el-badge :value="unreadCount" :max="99" class="notification-badge"><el-button icon="bell" @click="showMessages"></el-button></el-badge><!-- 消息弹窗 --><el-dialog v-model="messageVisible"><el-table :data="messages"><el-table-column prop="fileName" label="文件名"></el-table-column><el-table-column prop="status" label="状态"><template #default="{row}"><el-tag :type="statusType(row)">{{ statusText(row) }}</el-tag></template></el-table-column><el-table-column label="操作"><template #default="{row}"><el-button @click="downloadError(row)" v-if="row.errorFile">下载错误报告</el-button></template></el-table-column></el-table></el-dialog>
</template><script setup>
import { ref, onMounted } from 'vue'
import { ElMessage } from 'element-plus'const unreadCount = ref(0)
const messageVisible = ref(false)
const messages = ref([])// 初始化获取未读数量
onMounted(async () => {const res = await fetch('/api/import/unread-count')unreadCount.value = await res.json()
})// 显示消息弹窗
const showMessages = async () => {const res = await fetch('/api/import/messages')messages.value = await res.json()messageVisible.value = true// 标记所有消息为已读const ids = messages.value.map(m => m.id)await fetch('/api/import/mark-read', {method: 'POST',body: JSON.stringify(ids)})unreadCount.value = 0
}// 定时刷新未读数量
setInterval(async () => {const res = await fetch('/api/import/unread-count')unreadCount.value = await res.json()
}, 30000)
</script>
优化点
1、通知导入Excel的结果,如果是导入失败,需要知道是什么原因,例如是校验某一行数据的参数不合法之类的,那也要知道是哪一行数据才行,可能会有多行数据有问题,可以通过导出一个Excel的方式,生成导出的Excel路径保存到消息通知表,前端查看红点收件箱即可下载;
2、前端将定时访问优化成websocket,避免长时间轮训,浪费带宽,当然这种优化是看业务场景是否需要,如果需要频繁导入Excel频繁通知导入结果的场景;
完结撒花,如有需要收藏的看官,顺便也用发财的小手点点赞哈,如有错漏,也欢迎各位在评论区评论!
相关文章:
springboot实现异步导入Excel的注意点
springboot实现异步导入Excel 需求前言异步导入面临的问题实现异步如何导入大Excel文件避免OOM?异步操作后,如何通知导入结果?如何加快导入效率?将导入结果通知给用户后,如何避免重复通知? 优化点完结撒花&…...
Linux练习——有关硬盘、联网、软件包的管理
1、将你的虚拟机的网卡模式设置为nat模式,给虚拟机网卡配置三个主机位分别为100、200、168的ip地址 #使用nmtui打开文本图形界面配置网络 [rootrhcsa0306 ~]# nmtui #使用命令激活名为 ens160 的 NetworkManager 网络连接 [rootrhcsa0306 ~]# nmcli c up ens160 #通…...
论文阅读:GS-Blur: A 3D Scene-Based Dataset for Realistic Image Deblurring
今天介绍一篇 2024 NeurIPS 的文章,是关于真实世界去模糊任务的数据集构建的工作,论文作者来自韩国首尔大学 Abstract 要训练去模糊网络,拥有一个包含成对模糊图像和清晰图像的合适数据集至关重要。现有的数据集收集模糊图像的方式主要有两…...
经典动态规划问题:爬楼梯的多种解法详解
引言 今天我们要解决一个经典的算法问题——爬楼梯问题。这个问题看似简单,但蕴含了多种解法,从递归到动态规划,再到组合数学,每种方法都有其独特的思路和优化方式。本文将详细讲解四种解法,并通过代码和图解帮助大家…...
Kubernetes深度解析:云原生时代的容器编排引擎
一、背景与演进 1. 容器革命的必然产物 Kubernetes(K8s)诞生于2014年,是Google基于其内部Borg系统的开源实现。在传统单体应用向微服务架构转型的浪潮中,容器技术(如Docker)解决了应用打包和环境隔离问题…...
Cocos Creator Shader入门实战(七):RGB不同算法效果的实现,及渲染技术、宏定义、属性参数的延伸配置
引擎:3.8.5 您好,我是鹤九日! 回顾 上篇文章,讲解了Cocos Shader如何通过setProperty动态设置材质的属性,以及设置属性时候的一些注意事项,比如: 一、CCEffect部分properties参数的设定后&…...
leetcode102 二叉树的层次遍历 递归
(1) 找出重复的子问题。 层次遍历是每一层的节点从左到右的遍历,所以在遍历的时候我们可以先遍历左子树,再遍历右子树。 需要注意的是,在遍历左子树或者右子树的时候,涉及到向上或者向下遍历,为了让递归的过程中的同…...
Netty源码—10.Netty工具之时间轮二
大纲 1.什么是时间轮 2.HashedWheelTimer是什么 3.HashedWheelTimer的使用 4.HashedWheelTimer的运行流程 5.HashedWheelTimer的核心字段 6.HashedWheelTimer的构造方法 7.HashedWheelTimer添加任务和执行任务 8.HashedWheelTimer的完整源码 9.HashedWheelTimer的总结…...
算法学习记录:递归
递归算法的关键在于回复现场,dfs()函数返回值、结束条件、它的作用。 目录 1.综合练习 2. 二叉树的深搜 1.综合练习 39. 组合总和 - 力扣(LeetCode) 关键在画出的决策树当中,前面使用过的2、3,…...
启山智软实现b2c单商户商城对比传统单商户的优势在哪里?
启山智软实现 B2C 单商户商城具有以下对比优势: 技术架构方面 先进的框架选型:基于 SpringCloud 等主流框架开发,是百万真实用户沉淀并检验的商城系统,技术成熟稳定,能应对高并发场景,保证系统在大流量访…...
可发1区的超级创新思路(python\matlab实现):MPTS+Lconv+注意力集成机制的Transformer时间序列模型
首先声明,该模型为原创!原创!原创!且该思路还未有成果发表,感兴趣的小伙伴可以借鉴! 应用场景 该模型主要用于时间序列数据预测问题,包含功率预测、电池寿命预测、电机故障检测等等。 一、模型整体架构(本文以光伏功率预测为例) 本模型由多尺度特征提取模块(MPTS)…...
三、分类模块,通用组件顶部导航栏Navbar
1.封装通用组件顶部导航栏Navbar 不同效果 Component export struct MkNavbar {Prop title: string Prop leftIcon: ResourceStr $r("app.media.ic_public_left")ProprightIcon: ResourceStr $r("app.media.ic_public_more")PropshowLeftIcon: boolean…...
PHY——LAN8720A 寄存器读写 (二)
文章目录 PHY——LAN8720A 寄存器读写 (二)工程配置引脚初始化代码以太网初始化代码PHY 接口实现LAN8720 接口实现PHY 接口测试 PHY——LAN8720A 寄存器读写 (二) 工程配置 这里以野火电子的 F429 开发板为例,配置以太网外设 这里有一点需要注意原理图 RMII_TXD0…...
Flutter_学习记录_AppBar中取消leading的占位展示
将leading设置为null将automaticallyImplyLeading设置为false 看看automaticallyImplyLeading的说明: Controls whether we should try to imply the leading widget if null. If true and [AppBar.leading] is null, automatically try to deduce what the leading…...
PHP泛型与集合的未来:从动态类型到强类型的演进
文章精选推荐 1 JetBrains Ai assistant 编程工具让你的工作效率翻倍 2 Extra Icons:JetBrains IDE的图标增强神器 3 IDEA插件推荐-SequenceDiagram,自动生成时序图 4 BashSupport Pro 这个ides插件主要是用来干嘛的 ? 5 IDEA必装的插件&…...
未来派几何风格包装徽标品牌海报标牌logo设计无衬线英文字体安装包 Myfonts – Trakya Sans Font Family
Trakya Sans 是一种具有几何风格的现代无衬线字体。Futura、Avant Garde 等。它具有现代条纹,这是宽度和高度协调的结果,尤其是在小写字母中,以支持易读性。 非常适合广告和包装、编辑和出版、徽标、品牌和创意产业、海报和广告牌、小文本、寻…...
C语言深度解析:从零到系统级开发的完整指南
一、C语言的核心特性与优势 1. 高效性与直接硬件控制 C语言通过编译为机器码的特性,成为系统级开发的首选语言。例如,Linux内核通过C语言直接操作内存和硬件寄存器,实现高效进程调度。 关键点: malloc/free直接管理内存&#…...
ctfshow WEB web8
首先确定注入点,输入以下payload使SQL恒成立 ?id-1/**/or/**/true 再输入一下payload 使SQL恒不成立 ?id-1/**/or/**/false 由于SQL恒不成立, 数据库查询不到任何数据, 从而导致页面空显示 由以上返回结果可知,该页面存在SQL注入,注入点…...
【Linux】U-Boot 加载并启动 Linux 系统程序
U-Boot 加载并启动 Linux 系统程序 零、介绍 最近在玩一些嵌入式的开发板,在引导操作系统时需要用到U-Boot,故此研究一下。 U-Boot(Universal Bootloader)是一款开源的通用引导加载程序,专为嵌入式系统设计ÿ…...
jarvisoj API调用 [JSON格式变XXE]
http://web.jarvisoj.com:9882/ 题目要求:请设法获得目标机器 /home/ctf/flag.txt 中的flag值 抓包得到: POST /api/v1.0/try HTTP/1.1 Host: web.jarvisoj.com:9882 Content-Length: 36 Accept-Language: zh-CN,zh;q0.9 User-Agent: Mozilla/5.0 (W…...
Spring学习笔记07——SpringBoot常用注解记录
一、Lombok 注解 Data:生成所有字段的 getter/setter、toString()、equals() 和 hashCode()。 Getter / Setter:单独为所有字段或指定字段生成 getter/setter。 import lombok.Data;Data public class User {private Long id;private String name; }编…...
深入解析最大公约数(GCD)与最小公倍数(LCM)的C++实现
深入解析最大公约数(GCD)与最小公倍数(LCM)的C实现 一、GCD与LCM的数学定义 1. 最大公约数(GCD) 两个或多个整数共有约数中最大的一个。 例如: GCD(12, 18) 6GCD(21, 14) 7 2. 最小公倍数…...
[Python] 贪心算法简单版
贪心算法-简单版 贪心算法的一般使用场景是给定一个列表ls, 让你在使用最少的数据的情况下达到或超过n. 我们就来使用上面讲到的这个朴素的例题来讲讲贪心算法的基本模板: 2-1.排序 既然要用最少的数据, 我们就要优先用大的数据拼, 为了实现这个效果, 我们得先给列表从大到小…...
机器学习的一百个概念(4)下采样
前言 本文隶属于专栏《机器学习的一百个概念》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见[《机器学习的一百个概念》 ima 知识库 知识库广场搜索&…...
NNI 适配 TensorRT10教程
引言 本文涉及两个框架及其版本分别为 NNI (Neural Network Intelligence) :3.0TensorRT:10.9.0.34 NNI 在文档 Speed Up Quantized Model with TensorRT里描述了如何使用 TensorRT 为NNI量化的模型实现加速,但是从NNI 的源代码https://gi…...
Docker, Docker 镜像是什么,怎么创建, Docker有什么用
Docker, Docker 镜像是什么,怎么创建, Docker有什么用 Docker 镜像的概念 Docker 镜像可以理解为一个只读的模板,它包含了运行应用程序所需的所有文件、依赖项、环境变量和配置信息等。就像制作蛋糕的模具,利用这个模具可以制作出多个相同的蛋糕(这里的蛋糕就好比 Dock…...
多路径 TCP 调度的另一面
参考前面的文章 一个原教旨的多路径 TCP 和 MP-BBR 公平性推演,一直都破而不立,不能光说怎样不好,还得说说现状情况下,该如何是好。 如果 receiver 乱序重排的能力有限(拜 TCP 所赐),如果非要在多路径上传输 TCP&…...
vcpkg安装指定版本的库
一.vcpkg安装 使用git将vcpkg源码克隆到本地制定目录(D:\vcpkg),并初始化 git clone https://github.com/microsoft/vcpkg.git cd vcpkg ./bootstrap-vcpkg.sh # Linux/macOS .\bootstrap-vcpkg.bat # Windows 如下图: 二.安…...
【工具变量】上市公司供应链稳定性数据两个维度(2013-2023年)
供应链稳定性是指供应链在面对各种内外部因素的冲击和不确定性时,能够保持持续、顺畅运作的能力,而供应链稳定性指数是用于评估企业在其供应链管理中保持稳定性的一个重要指标。本分享数据参考钟涛(2022)、董浩和闫晴(…...
Redis场景问题2:缓存击穿
Redis 缓存击穿是指在缓存系统中,大量请求(高并发访问)同时访问一个不存在于缓存中(一般是因为缓存过期或者数据未被加载到缓存)但在数据库中存在的热点数据,从而导致这些请求直接穿透缓存层,涌…...
