Excel大数据量导入导出
文档:读Excel(文档已经迁移)
一、JAVA解析EXCEL工具EasyExcel
Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的AP可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。easyexcel重写了poi对07版Excel的解析,能够原本一个3M的excel用POl sax依然需要100M左右内存降低到几M,并且再大的excel不会出现内存溢出,03版依赖POl的sax模式。在上层做了模型转换的封装,让使用者更加简单方便
64M内存1分钟内读取75M(46W行25列)的Excel
二、EasyExcel的使用
EasyExcel的相关依赖
<!-- Alibaba Excel 依赖 -->
<!--它提供了高性能的读写功能,特别适合处理大型 Excel 文件 -->
<dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>3.3.4</version>
</dependency>
<!-- Apache POI 依赖 -->
<!--poi 是 Apache POI 项目的核心库,提供了读写 Microsoft Office 格式文件的基础功能,包括 .xls 文件 -->
<dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>4.1.2</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>4.1.2</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml-schemas</artifactId><version>4.1.2</version>
</dependency>
<!-- SLF4J 和 Logback 依赖 -->
<!-- 日志 -->
<dependency><groupId>ch.qos.logback</groupId><artifactId>logback-classic</artifactId><version>1.2.11</version>
</dependency> 三、写Excel
@NoArgsConstructor
@AllArgsConstructor
@Data
@Builder
public class User {@ExcelProperty(value = "用户编号")private Integer userId;@ExcelProperty(value = "姓名")private String userName;@ExcelProperty(value = "性别")private String gender;@ExcelProperty(value = "工资")private Double salary;@ExcelProperty(value = "入职时间")private Date hireDate;// lombok 会生成getter/setter方法
} 1.简单写入方法一
/*** 简单写方法一*/@Testpublic void text01(){//创建一个Excel文档String fileName = "D:\\excel\\user1.xlsx";//根据user模板构建数据List<User> users = new ArrayList<>();User user1 = new User(1,"张三","男",666.66,new Date());User user2 = new User(2,"张三","男",666.66,new Date());User user3 = new User(3,"张三","男",666.66,new Date());User user4 = new User(4,"张三","男",666.66,new Date());users.add(user1);users.add(user2);users.add(user3);users.add(user4);//向Excel表格中写数据EasyExcel.write(fileName,User.class).sheet("用户信息").doWrite(users);}
2.简单写入方法二
/*** 简单写方法二*/@Testpublic void text02(){//创建一个Excel文档String fileName = "D:\\excel\\user2.xlsx";//根据user模板构建数据List<User> users = new ArrayList<>();User user1 = new User(1,"张三","男",666.66,new Date());User user2 = new User(2,"张三","男",666.66,new Date());User user3 = new User(3,"张三","男",666.66,new Date());User user4 = new User(4,"张三","男",666.66,new Date());users.add(user1);users.add(user2);users.add(user3);users.add(user4);//向Excel表格中写数据//创建ExcelWriter对象ExcelWriter excelWriter = EasyExcel.write(fileName, User.class).build();//创建sheet对象WriteSheet writeSheet = EasyExcel.writerSheet("用户信息").build();excelWriter.write(users,writeSheet);//关闭ExcelWriter对象(一定要关闭,不然会导致内存溢出)excelWriter.finish();}
3.排除掉某些不想添加的字段
/*** 排除掉模板中的某几项属性*/@Testpublic void text03(){//创建一个Excel文档String fileName = "D:\\excel\\user3.xlsx";//根据user模板构建数据List<User> users = new ArrayList<>();User user1 = new User(1,"张三","男",666.66,new Date());User user2 = new User(2,"张三","男",666.66,new Date());User user3 = new User(3,"张三","男",666.66,new Date());User user4 = new User(4,"张三","男",666.66,new Date());users.add(user1);users.add(user2);users.add(user3);users.add(user4);//设置排除的属性Set<String> set = new HashSet<>();set.add("salary");set.add("hireDate");//向Excel表格中写数据EasyExcel.write(fileName, User.class).excludeColumnFiledNames(set).sheet("用户信息").doWrite(users);}
4.复杂头数据写入
/*** 复杂头实体类*/
@NoArgsConstructor
@AllArgsConstructor
@Data
@Builder
public class ComplexHeadUser {@ExcelProperty(value = {"group1", "用户编号"}, index = 0)private Integer userId;@ExcelProperty(value = {"group1", "姓名"}, index = 1)private String userName;@ExcelProperty(value = {"group2", "入职时间"}, index = 2)private Date hireDate;
} /*** 复杂头*/@Testpublic void text05(){//创建一个Excel文档String fileName = "D:\\excel\\user5.xlsx";//根据user模板构建数据List<ComplexHeadUser> users = new ArrayList<>();ComplexHeadUser user1 = new ComplexHeadUser(1,"张三",new Date());ComplexHeadUser user2 = new ComplexHeadUser(2,"张三",new Date());ComplexHeadUser user3 = new ComplexHeadUser(3,"张三",new Date());users.add(user1);users.add(user2);users.add(user3);//向Excel表格中写数据EasyExcel.write(fileName, ComplexHeadUser.class).sheet("用户信息").doWrite(users);} //或
@Test
public void testWriteExcel6() {String filename = "D:\\study\\user6.xlsx";List<ComplexHeadUser> users = new ArrayList<>();for (int i = 1; i <= 10; i++) {ComplexHeadUser user = ComplexHeadUser.builder().userId(i).userName("大哥" + i).hireDate(new Date()).build();users.add(user);}// 向Excel中写入数据EasyExcel.write(filename, ComplexHeadUser.class).sheet("用户信息").doWrite(users);
} 处理百万级批量数据
/*** 创建User类模板,通过User类模板向Excel表格中写数据* @ExcelProperty这个注解用于指定Excel表格中该字段的显示名称(起名字)*/
@NoArgsConstructor
@AllArgsConstructor
@Data
@Builder
public class User {@ExcelProperty(value = "用户编号")private Integer userId;@ExcelProperty(value = "姓名")private String userName;@ExcelProperty(value = "性别")private String gender;@ExcelProperty(value = "工资")private Double salary;@ExcelProperty(value = "入职时间")private Date hireDate;// lombok 会生成getter/setter方法} /*** 处理百万级批量数据*/@Testpublic void text06(){//创建一个Excel文档String fileName = "D:\\excel\\user6.xlsx";// 确保目录存在File directory = new File("D:\\excel");if (!directory.exists()) {directory.mkdirs();}// 分批大小int batchSize = 10000;// 创建 ExcelWriter 对象ExcelWriter excelWriter = EasyExcel.write(fileName, User.class).build();for (List<User> data : dataList(batchSize)) {// 创建 sheet 对象WriteSheet writeSheet = EasyExcel.writerSheet("用户信息").build();// 写数据excelWriter.write(data, writeSheet);}excelWriter.finish();System.out.println("Excel文件已成功创建!");}private List<List<User>> dataList(int batchSize) {List<List<User>> allData = new ArrayList<>();int totalRecords = 1000000; // 假设有 100 万条记录for (int i = 0; i < totalRecords; i += batchSize) {List<User> batch = new ArrayList<>();for (int j = 0; j < batchSize && i + j < totalRecords; j++) {User user = User.builder().userId(i + j + 1).userName("用户" + (i + j + 1)).gender(j % 2 == 0 ? "男" : "女").salary(10000.0 + (i + j) * 1000.0).hireDate(new Date()).build();batch.add(user);}allData.add(batch);}return allData;} 相关文章:
Excel大数据量导入导出
github源码 地址(更详细) : https://github.com/alibaba/easyexcel 文档:读Excel(文档已经迁移) B 站视频 : https://www.bilibili.com/video/BV1Ff4y1U7Qc 一、JAVA解析EXCEL工具EasyExcel Java解析、生成Excel比较…...
Linux系统命令无法使用(glib库相关问题)
1.背景描述 Yum强制安装了一些软件,安装软件成功无报错,完成后不久突然发现系统出问题了,所有的命令无法使用了,如ls、mv、cat等基本命令报错。 relocation error: /lib64/libpthread.so.0: symbol_libc_dl_error_tsd …...
Qt修仙之路2-1 仿QQ登入 法宝初成
widget.cpp #include "widget.h" #include<QDebug> //实现槽函数 void Widget::login1() {QString userusername_input->text();QString passpassword_input->text();//如果不勾选无法登入if(!check->isChecked()){qDebug()<<"xxx"&…...
DeepSeek-V3 论文解读:大语言模型领域的创新先锋与性能强者
论文链接:DeepSeek-V3 Technical Report 目录 一、引言二、模型架构:创新驱动性能提升(一)基本架构(Basic Architecture)(二)多令牌预测(Multi-Token Prediction…...
配置#include “nlohmann/json.hpp“,用于处理json文件
#include “nlohmann/json.hpp” // 需要安装 nlohmann/json.hpp 头文件 using json = nlohmann::json; 下载链接:https://github.com/nlohmann/json/tree/develop 1.下载并解压:首先,需要从nlohmann/json的GitHub仓库下载源代码,并解压得到的文件。 地址: nlohmann/json…...
索引失效的14种常见场景
在 MySQL 中,索引有时可能会失效,导致查询性能下降。以下是常见的 14 种场景,在这些场景下,索引可能会失效 1. 使用 OR 连接多个条件 场景: 当查询中包含 OR 时,如果 OR 连接的多个条件中有一个没有使用索引࿰…...
解决com.kingbase8.util.KSQLException: This _connection has been closed.
问题描述 一个消息管理系统,系统采用kingbase8数据库,数据库采用单体模式,后台应用也采用springboot单体模式。系统正式上线后,出现几个JDBC响应的异常信息: com.kingbase8.util.KSQLException: An I/O error occurred while sending to the backend.java.net.SocketTime…...
openAI官方prompt技巧(二)
1. 赋予 ChatGPT 角色 为 ChatGPT 指定一个角色,让其从特定的身份或视角回答问题。这有助于生成针对特定受众或场景的定制化回答。 例如: 你是一名数据分析师,负责我们的市场营销团队。请总结上个季度的营销活动表现,并强调与未…...
【非 root 用户下全局使用静态编译的 FFmpeg】
在非 root 用户下全局使用静态编译的 FFmpeg,可以按照以下方法操作: 1. 下载静态编译的 FFmpeg 如果你还没有下载静态编译的 FFmpeg,可以从官方网站获取: wget https://johnvansickle.com/ffmpeg/releases/ffmpeg-release-amd6…...
【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统
前言 本文主要介绍我最近开发的一个个人实战项目,“基于深度学习的人脸门禁 IPC 智能安防监控系统”,全程满帧流畅运行。这个项目我目前全网搜了一圈,还没发现有相关类型的开源项目。这个项目只要稍微改进下,就可以变成市面上目前…...
前端布局与交互实现技巧
前端布局与交互实现技巧 1. 保持盒子在中间位置 在网页设计中,经常需要将某个元素居中显示。以下是一种常见的实现方式: HTML 结构 <!doctype html> <html lang"en"> <head><meta charset"UTF-8"><m…...
idea 找不到或者无法加载主类
idea项目,之前一直是正常运行的,放假了之后再回来就遇到启动不了的问题。 WebApplication这个类右键运行的时候,也提示找不到主类。 对于这种之前运行没有问题,突然出问题的项目。 我的点是没有改动代码和数据的情况下项目就跑不起…...
Flink 调用海豚调度器 SQL 脚本实现1份SQL流批一体化的方案和可运行的代码实例
目录 一、流批一体化概述 二、Flink 与海豚调度器结合实现流批一体化的好处 2.1 代码复用性增强 2.2 开发和维护成本降低 2.3 数据一致性保证 2.4 提高系统的灵活性和可扩展性 三、实现思路步骤 3.1 环境准备 3.2 编写 SQL 脚本并上传到海豚调度器 3.3 实现资源下载功…...
ES6 Map 数据结构是用总结
1. Map 基本概念 Map 是 ES6 提供的新的数据结构,它类似于对象,但是"键"的范围不限于字符串,各种类型的值(包括对象)都可以当作键。Map 也可以跟踪键值对的原始插入顺序。 1.1 基本用法 // 创建一个空Map…...
go结构体详解
结构体简介 Golang 中没有“类”的概念,Golang 中的结构体和其他语言中的类有点相似。和其他面向对象语言中的类相比,Golang 中的结构体具有更高的扩展性和灵活性。 Golang 中的基础数据类型可以表示一些事物的基本属性,但是当我们想表达一…...
机器学习-关于线性回归的表示方式和矩阵的基本运算规则
最近在学习机器学习的过程中,发现关于线性回归的表示和矩阵的运算容易费解,而且随着学习的深入容易搞混,因此特意做了一些研究,并且记录下来和大家分享。 一、线性模型有哪些表示方式? 器学习中,线性模型…...
kafka 3.5.0 raft协议安装
前言 最近做项目,需要使用kafka进行通信,且只能使用kafka,笔者没有测试集群,就自己搭建了kafka集群,实际上笔者在很早之前就搭建了,因为当时还是zookeeper(简称ZK)注册元数据&#…...
后台管理系统网页开发
CSS样式代码 /* 后台管理系统样式文件 */ #container{ width:100%; height:100%; /* background-color:antiquewhite;*/ display:flex;} /* 左侧导航区域:宽度300px*/ .left{ width:300px; height: 100%; background-color:#203453; display:flex; flex-direction:column; jus…...
使用一个大语言模型对另一个大语言模型进行“调教”
使用一个大语言模型对另一个大语言模型进行“调教”(通常称为微调或适配),是一种常见的技术手段,用于让目标模型更好地适应特定的任务、领域或风格。以下是基于搜索结果整理的详细步骤和方法: 1.准备工作 安装必要的…...
golang使用sqlite3,开启wal模式,并发读写
因为sqlite是基于文件的,所以默认情况下,sqlite是不支持并发读写的,即写操作会阻塞其他操作,同时sqlite也很容易就产生死锁。 但是作为一个使用广泛的离线数据库,从sqlite3.7.0版本开始(SQLite Release 3.…...
AppImageLauncher:Linux桌面应用的3分钟智能管家
AppImageLauncher:Linux桌面应用的3分钟智能管家 【免费下载链接】AppImageLauncher Helper application for Linux distributions serving as a kind of "entry point" for running and integrating AppImages 项目地址: https://gitcode.com/gh_mirro…...
小红书数据采集终极指南:5种身份伪装策略破解反爬限制
小红书数据采集终极指南:5种身份伪装策略破解反爬限制 【免费下载链接】XHS-Downloader 小红书(XiaoHongShu、RedNote)链接提取/作品采集工具:提取账号发布、收藏、点赞、专辑作品链接;提取搜索结果作品、用户链接&…...
C#调用C++ DLL报错‘找不到指定的模块’根因与精准排查指南
1. 这个报错不是“找不到文件”,而是“找不到依赖”——C#调用C DLL时最典型的认知陷阱 “无法加载 DLL ‘xxx.dll’: 找不到指定的模块”——这行红色错误信息,几乎每个在Windows平台做混合编程的C#开发者都见过。它第一次出现时,很多人会本…...
硬件-软件协同设计:原理、优化与应用实践
1. 硬件-软件协同设计的本质与挑战现代科学仪器正变得越来越复杂,特别是在基础物理和相关领域。想象一下,你正在设计一台粒子探测器或天体物理观测站,这不仅仅是一堆硬件零件的简单组装,而是一个由传感器、电子设备、冷却系统、触…...
卡方检验筛选高质量样本,提升小样本学习在机器文本检测中的性能
1. 项目概述与核心价值在自然语言处理的实际工作中,我们常常会遇到一个令人头疼的困境:手头的数据标注成本高昂,或者特定领域的样本本身就极其稀缺。这时候,小样本学习(Few-Shot Learning)就成了我们的“救…...
手把手教你用Python监控自己的ETH钱包地址是否‘被碰撞’(含简易脚本)
用Python构建ETH钱包安全监控系统:从API调用到风险预警实战最近在整理自己的数字资产时,突然意识到一个问题:我们平时使用的ETH钱包地址,是否可能因为公开交易记录而暴露在风险中?这个问题让我开始研究如何通过技术手段…...
量子机器学习优化:无陷阱损失函数景观的理论与实践
1. 项目概述与核心价值在量子计算领域,无论是进行量子模拟、量子态制备还是实现量子优化算法,我们最终都需要通过调整一组可控参数,让一个参数化的量子电路(或称量子神经网络)的输出逼近某个目标。这个过程,…...
Attention Is All You Need作者再出手:Transformer 99%稀疏,还能更快?
本文约2000字,建议阅读5分钟稀释不止省 FLOPs2017 年,《Attention Is All You Need》将 Transformer 推上深度学习主舞台。如今,几乎所有主流大模型都站在这套架构之上,推理、训练、显存和能耗成本也随模型规模一路上涨。大模型运…...
5分钟解锁全皮肤:R3nzSkin国服特供版完全指南
5分钟解锁全皮肤:R3nzSkin国服特供版完全指南 【免费下载链接】R3nzSkin-For-China-Server Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3/R3nzSkin-For-China-Server 你是否曾为心仪的限定皮肤望而却步࿱…...
NCMDump工具:3步轻松解密网易云音乐NCM加密文件
NCMDump工具:3步轻松解密网易云音乐NCM加密文件 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经在网易云音乐下载了喜欢的歌曲,却发现只能在官方客户端播放?NCM加密格式的限制让你无法在…...
