简历EasyExcel相关
系列博客目录
文章目录
- 系列博客目录
- 1.在easyExcel的基础上,应用多线程对数据进行分块有用吗
- 为什么使用多线程对数据进行分块有用?
- 实现方式
- 示例:多线程与 EasyExcel 导出结合的基本思路
- 解释:
- 注意事项:
- 总结:
1.在easyExcel的基础上,应用多线程对数据进行分块有用吗
在使用 EasyExcel 的基础上,应用多线程对数据进行分块 是有用的,尤其是在处理大规模数据导出时,它可以显著提高导出效率,减少内存占用和提高性能。
为什么使用多线程对数据进行分块有用?
-
提升导出速度:
- EasyExcel 本身已采用流式写入方式,避免了一次性将所有数据加载到内存中。但是,当数据量非常大时,单线程仍然会遇到性能瓶颈,特别是对于大数据集(如百万级别的记录)。使用多线程可以将数据分为多个小块并行写入,从而充分利用多核 CPU,显著提升写入速度。
-
减少内存消耗:
- EasyExcel 在导出数据时采用流式写入方式,内存消耗较低,避免了大规模数据处理时内存溢出的风险。当使用多线程时,每个线程处理不同的数据块,可以进一步避免将整个数据集加载到内存中,分担内存压力。
-
提高 CPU 利用率:
- 多线程可以并行处理不同的数据块,避免单个线程在大数据量处理时 CPU 占用过高,导致性能下降。通过合理调度和分块,可以有效地提高 CPU 利用率,减少空闲时间,从而提升导出速度。
实现方式
在 EasyExcel 中,结合 多线程 和 数据分块 可以采用以下方式:
-
数据分块:
- 可以将数据集分成多个部分,每个部分处理一个特定的数据范围。每个线程负责一个数据块的导出,最后将所有导出的部分合并成一个最终的 Excel 文件。
-
多线程的使用:
- 可以使用 Java 的 ExecutorService 来创建线程池,控制线程的数量和任务分配。每个线程负责导出一个数据块,完成后将结果汇总。
示例:多线程与 EasyExcel 导出结合的基本思路
假设我们要导出一份包含百万级别数据的 Excel 文件,可以按照以下方式实现:
import com.alibaba.excel.EasyExcel;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;public class MultiThreadExport {private static final int BATCH_SIZE = 100000; // 每个线程处理的记录数public static void main(String[] args) {ExecutorService executorService = Executors.newFixedThreadPool(4); // 使用线程池,假设使用4个线程// 假设数据总量是百万条int totalDataSize = 1000000;int totalThreads = (totalDataSize / BATCH_SIZE) + 1;for (int i = 0; i < totalThreads; i++) {final int start = i * BATCH_SIZE;final int end = Math.min((i + 1) * BATCH_SIZE, totalDataSize);executorService.submit(() -> {// 获取分块数据List<MyData> dataChunk = getData(start, end);// 使用 EasyExcel 写入文件String filePath = "output.xlsx";EasyExcel.write(filePath, MyData.class).sheet("Sheet1").doWrite(dataChunk);});}executorService.shutdown();}// 模拟获取数据的方法public static List<MyData> getData(int start, int end) {// 这里的 MyData 是一个自定义数据类,模拟从数据库或其他地方获取数据List<MyData> dataChunk = new ArrayList<>();for (int i = start; i < end; i++) {dataChunk.add(new MyData(i, "Data " + i));}return dataChunk;}
}
解释:
-
数据分块:我们通过
BATCH_SIZE将大数据集分割成多个小块,每个线程处理一个数据块。每个线程会调用getData方法获取自己负责的数据范围。 -
多线程池:我们使用
ExecutorService来创建一个线程池,并提交多个线程任务来并行处理数据块。线程池中的线程会各自独立执行,最后合并各个数据块的导出结果。 -
EasyExcel 导出:每个线程使用 EasyExcel 将自己的数据块导出到指定的 Excel 文件中。EasyExcel 会以流式写入的方式保存文件,不会将整个文件加载到内存中,减少内存消耗。
注意事项:
-
数据合并问题:
- 如果数据分块后,每个线程都写入不同的 Excel 文件片段,最终需要手动或程序化地合并各个文件片段成一个完整的文件。可以考虑通过线程间的协调,将所有线程的输出合并为一个文件。
-
线程数控制:
- 线程池大小需要根据机器的核心数和内存情况进行合理配置,避免过多线程导致的资源争用和性能下降。一般来说,线程数设置为 CPU 核心数的 1-2 倍较为合适。
-
I/O 性能瓶颈:
- 尽管多线程能够提高 CPU 使用率,但硬盘的 I/O 性能仍然可能成为瓶颈,尤其是在处理大文件写入时。如果数据量特别大,考虑将导出的文件分批次写入磁盘,避免单次写入超时或 I/O 阻塞。
总结:
多线程与 EasyExcel 的结合是有用的,特别是在处理大数据量导出时。通过多线程分块导出,可以提高数据写入的并行度,减少导出时间,提升系统的响应速度和用户体验。
相关文章:
简历EasyExcel相关
系列博客目录 文章目录 系列博客目录1.在easyExcel的基础上,应用多线程对数据进行分块有用吗为什么使用多线程对数据进行分块有用?实现方式示例:多线程与 EasyExcel 导出结合的基本思路解释:注意事项:总结:…...
C#调用Lua方法1+C#调用Lua方法2,3
xLua中Lua调用C#代码 原因:C#实现的系统,因为Lua可以调用,所以完全可以换成Lua实现,因为Lua可以即时更改,即时运行,所以游戏的代码逻辑就可以随时更改。 实现和C#相同效果的系统,如何实现&#…...
stable diffusion 量化加速点
文章目录 一、导出为dynamic shape1)函数讲解(函数导出、输出检查)2)代码展示二、导出为static shape1)函数讲解(略)2)代码展示三、序列化为FP32测速1)测速2)代码四、序列化为FP16测速1)测速2)代码同上五、发现并解决解决CLIP FP16溢出,并测速1)如何找到溢出的算子…...
NO.77十六届蓝桥杯备战|数据结构-单调队列|质量检测(C++)
什么是单调队列? 单调队列,顾名思义,就是存储的元素要么单调递增要么单调递减的队列。注意,这⾥的队列和普通的队列不⼀样,是⼀个双端队列。单调队列解决的问题 ⼀般⽤于解决滑动窗⼝内最⼤值最⼩值问题,以…...
通过发票四要素信息核验增值税发票真伪-iOS发票查验接口
发票是企业经济间往来的重要凭证,现如今,随着经济环境的日益复杂,发票造假现象屡禁不止,这使得增值税发票查验成为企业必须高度重视的工作。人工智能时代,发票查验接口犹如一道坚固的防线,助力企业财务守护…...
区块链是怎么存储块怎么找到前一个块
前言:学习区块链的过程中在想怎么管理区块链呢 📌 推荐项目回顾: 👉 Jeiwan 的 blockchain_go 项目 GitHub 地址:https://github.com/Jeiwan/blockchain_go ❓它是怎么存储区块 & 找前一个区块的? 项…...
超详解glusterfs部署
glusterfs部署 GlusterFS 是一个开源的分布式文件系统,旨在提供高性能、高可用性和可扩展性,适用于存储大量数据。它通过将多个存储节点组合成一个统一的文件系统,允许用户透明地访问分布在不同节点上的数据。 主要组件 存储砖块ÿ…...
总结一下常见的EasyExcel面试题
说一下你了解的POI和EasyExcel POI(Poor Obfuscation Implementation):它是 Apache 软件基金会的一个开源项目,为 Java 程序提供了读写 Microsoft Office 格式文件的功能,支持如 Excel、Word、PowerPoint 等多种文件格…...
【JAVA】十、基础知识“类和对象”干货分享~(三)
目录 1. 封装 1.1 封装的概念 1.2 访问限定符 public(公开访问) private(私有访问) 1.3 包 1.3.1 包的概念 1.3.2 导入包中的类 1.3.3 自定义包 2. static成员 2.1 static变量(类变量) 2.1.1 sta…...
DeepSeek+SpringAI家庭AI医生
文章目录 项目架构项目开发内容项目用户用例图项目地址开发环境大模型使用本地:Ollama部署DeepSeek离线与在线api大模型客户端使用 数据库脚本代码deepseek创建定制医生模型 内网互通原则云服务器类型 项目架构 项目开发内容 项目用户用例图 项目地址 FamilyAIDoct…...
PyTorch:解锁AI新时代的钥匙
(前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站)。 揭开PyTorch面纱 对于许多刚开始接触人工智能领域的朋友来说,PyTorch这个名字或许既熟悉又陌生。…...
C++第14届蓝桥杯b组学习笔记
1. 日期统计 小蓝现在有一个长度为 100100 的数组,数组中的每个元素的值都在 00 到 99 的范围之内。数组中的元素从左至右如下所示: 5 6 8 6 9 1 6 1 2 4 9 1 9 8 2 3 6 4 7 7 5 9 5 0 3 8 7 5 8 1 5 8 6 1 8 3 0 3 7 9 2 7 0 5 8 8 5 7 0 9 9 1 9 4 4…...
解锁工业通信:Profibus DP到ModbusTCP网关指南!
解锁工业通信:Profibus DP到ModbusTCP网关指南! 在工业自动化领域,随着技术的不断进步和应用场景的日益复杂,不同设备和系统之间的通讯协议兼容性问题成为了工程师们面临的一大挑战。尤其是在Profibus DP和Modbus/TCP这两种广泛应…...
每日一题(小白)字符串娱乐篇16
分析题意可以了解到本题要求在一串字符串中找到所有组合起来排序递增的字符串。我们可以默认所有字符在字符串中的上升序列是1,从第一个字符开始找,如果后面的字符大于前面的字符就说明这是一个上序列那么后面字符所在的数组加一,如果连接不上…...
面试算法高频01
题目描述 验证回文串 给定一个字符串,验证它是否是回文串,只考虑字母和数字字符,可以忽略字母的大小写。 示例 1: 输入: "A man, a plan, a canal: Panama" 输出: true示例 2: 输入: "race a car" 输出: falseimport…...
如何深刻理解Reactor和Proactor
前言: 网络框架的设计离不开 I/O 线程模型,线程模型的优劣直接决定了系统的吞吐量、可扩展性、安全性等。目前主流的网络框架,在网络 IO 处理层面几乎都采用了I/O 多路复用方案(又以epoll为主),这是服务端应对高并发的性能利器。 …...
java基础 数组Array的介绍
Array 数组定义一维数组多维数组动态数组常见方法Arrays排序1.sort() 排序 2.parallelSort() 排序 查找:binarySearch()填充:fill()比较:equals() 和 deepEquals()复制:copyOf() 和 copyOfRange()转换为列表:asList()转…...
Elixir语言的函数定义
Elixir语言的函数定义 Elixir是一种基于Erlang虚拟机(BEAM)的函数式编程语言,因其并发特性及可扩展性而受到广泛欢迎。在Elixir中,函数是程序的基本构建块,了解如何定义和使用函数对于掌握这门语言至关重要。本文将深…...
我的NISP二级之路-02
目录 一.数据库 二.TCP/IP协议 分层结构 三.STRIDE模型 四.检查评估与自评估 检查评估 自评估 五.信息安全应急响应过程 六.系统工程 七.SSE-CMM 八.CC标准 九.九项重点工作 记背: 一.数据库 关于数据库恢复技术,下列说法不正确的是:…...
k8s1.24升级1.28
0、简介 这里只用3台服务器来做一个简单的集群,当前版本是1.24.17目标升级到1.28.17 地址主机名192.168.160.40kuber-master-1192.168.160.41kuber-master-2192.168.160.42kuber-node-1 因为1.24已经更换过了容器运行时,所以之后的升级相对就会简单&am…...
常见的微信个人号二次开发功能
一、常见开发功能 1. 好友管理 好友列表维护 添加/删除好友 修改好友信息(备注、标签等) 分组管理 创建/编辑/删除标签 好友分类与筛选 2. 消息管理 信息发送 支持多类型内容:文本、图片、视频、文件、小程序、名片、URL链接等 附加功…...
unity的dots中instantiate克隆对象后,对象会在原位置闪现的原因和解决
原因 在Entity中有两个位置信息,一个是local transform。一个是local to world 其中local transform负责具体位置,local to world 负责渲染位置,即图像的渲染的位置是根据local to world的。 local to world 的更新是引擎自己控制的&#x…...
去中心化固定利率协议
核心机制与分类 协议类型: 借贷协议(如Yield、Notional):通过零息债券模型(如fyDai、fCash)锁定固定利率。 收益聚合器(如Saffron、BarnBridge):通过风险分级或博弈论…...
Java面试黄金宝典31
1. 什么是封锁协议 定义:封锁协议是在运用封锁机制时,为了保证事务的一致性和隔离性,对何时申请封锁、持锁时间以及何时释放封锁等问题制定的规则。它可防止并发操作引发的数据不一致问题,如丢失修改、不可重复读和读 “脏” 数据…...
R语言——绘制生命曲线图(细胞因子IL5)
绘制生命曲线图(根据细胞因子) 说明流程代码加载包读取Excel文件清理数据重命名列名处理IL-5中的"<"符号 - 替换为检测下限的一半首先找出所有包含"<"的值检查缺失移除缺失值根据IL-5中位数将患者分为高低两组 创建生存对象拟…...
在内网环境中为 Gogs 配置 HTTPS 访问
在内网环境中为 Gogs 配置 HTTPS 访问,虽然不需要公网域名,但仍需通过自签名证书或私有证书实现加密。以下是详细步骤和方案: 一、核心方案选择 方案适用场景优点缺点自签名证书快速测试、临时使用无需域名,快速生成浏览器提示“…...
神马系统8.5搭建过程,附源码数据库
项目介绍 神马系统是多年来流行的一款电视端应用,历经多年的发展,在稳定性和易用性方面都比较友好。 十多年前当家里的第一台智能电视买回家,就泡在某论坛,找了很多APP安装在电视上,其中这个神马系统就是用得很久的一…...
大模型论文:Improving Language Understanding by Generative Pre-Training
大模型论文:Improving Language Understanding by Generative Pre-Training OpenAI2018 文章地址:https://www.mikecaptain.com/resources/pdf/GPT-1.pdf 摘要 自然语言理解包括各种各样的任务,如文本蕴涵、问题回答、语义相似性评估和文…...
SDL视频显示函数
文章目录 1. **`SDL_Init()`**2. **`SDL_CreateWindow()`**3. **`SDL_CreateRenderer()`**4. **`SDL_CreateTexture()`**5. **`SDL_UpdateTexture()`**6. **`SDL_RenderCopy()`**7. **`SDL_RenderPresent()`**8. **`SDL_Delay()`**9. **`SDL_Quit()`**总结示例代码:代码说明:…...
[ctfshow web入门] web18
前置知识 js(javascript)语言用于前台控制,不需要知道他的语法是什么,以高级语言的阅读方式也能看懂个大概。 在JavaScript中,confirm()是一个用于显示确认对话框的内置函数,不用知道怎么使用。 信息收集 提示:不要…...
