Java解析Excel文件
目录
背景
技术选型
开源Java框架选型
1. Apache POI
2. EasyExcel
收费Java框架选型
1. Spire.XLS for java
2. Aspose
总结
背景
在低代码产品的研发过程中,为用户提供数据导入导出的能力时,无法避免的就是对EXCEL解析的能力,所以本篇通过介绍部分开源框架以及收费框架的相关技术,来介绍低代码产品中与Excel解析相关的知识。
技术选型
开源Java框架选型
在Java中,解析Excel文件的技术选择多种多样,但最为流行和广泛使用的莫过于Apache POI和EasyExcel。
1. Apache POI
Apache POI是Apache软件基金会下的一个开源项目,提供了对Microsoft Office格式文件的读写支持,包括Excel、Word和PowerPoint等。对于Excel文件,Apache POI支持.xls(Excel 2003及之前版本)和.xlsx(Excel 2007及之后版本)两种格式。
Apache POI基于DOM(Document Object Model)方式解析Excel文件,即将整个文件加载到内存中,然后构建成一个树状结构,便于通过编程方式访问和操作。这种方式在处理小型Excel文件时非常高效,但如果文件过大,可能会导致内存溢出。
代码示例:
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;public class ExcelParser {public static void main(String[] args) {String excelFilePath = "path/to/your/excel/file.xlsx";try (FileInputStream fileInputStream = new FileInputStream(new File(excelFilePath));Workbook workbook = new XSSFWorkbook(fileInputStream)) {Sheet sheet = workbook.getSheetAt(0); // 获取第一个工作表for (Row row : sheet) { // 迭代行for (Cell cell : row) { // 迭代列// 获取单元格数据,根据单元格类型使用相应的方法switch (cell.getCellTypeEnum()) {case STRING:System.out.print(cell.getStringCellValue() + "\t");break;case NUMERIC:System.out.print(cell.getNumericCellValue() + "\t");break;case BOOLEAN:System.out.print(cell.getBooleanCellValue() + "\t");break;case FORMULA:System.out.print(cell.getCellFormula() + "\t");break;default:System.out.print("\t");break;}}System.out.println();}} catch (IOException e) {
e.printStackTrace();}}
}
2. EasyExcel
EasyExcel是阿里巴巴开源的一个基于Java的快速、简洁、解决大文件内存溢出的Excel处理工具。与Apache POI不同,EasyExcel采用了SAX(Simple API for XML)模式来解析Excel文件,实现了逐行读取,大大减少了内存的占用。
EasyExcel特别适用于处理大数据量的Excel文件,能够显著提高处理速度和降低内存消耗。同时,EasyExcel还提供了丰富的API来简化Excel的读写操作,使得开发者能够更加专注于业务逻辑的实现。
import com.alibaba.excel.EasyExcel;public class TestEasyExcel {public static void main(String[] args) {String fileName = "test.xlsx";EasyExcel.write(fileName, Object.class).sheet("Sheet1").doWrite(data());}private static List<Object> data() {List<Object> list = new ArrayList<>();
list.add(new YourDataClass("data1", "data2"));// ... 添加更多数据return list;}
}
收费Java框架选型
1. Spire.XLS for java
Spire.XLS是成都冰蓝科技有限公司为.NET开发人员提供的一款功能强大的Excel操作组件。它以其独立性、广泛的支持性和高效的操作性能,赢得了众多开发者的青睐。无论是在企业级的报表生成、数据分析还是其他需要处理Excel文件的场景中,Spire.XLS for .NET都能为开发者提供强有力的支持。
使用Spire.XLS对于文件类型的转换提供了几行代码即可解析excel甚至将其在离线linux环境中解析甚至转换低版本excel的能力。这在开源框架中是几乎无法完美做到的。
import com.spire.xls.*;public class ParseExcel {public static void main(String[] args) {//加载Excel文档Workbook workbook = new Workbook();
workbook.loadFromFile("路径到Excel文件.xlsx");//获取工作表Worksheet worksheet = workbook.getWorksheets().get(0);//遍历工作表中的所有单元格for (int i = 0; i < worksheet.getLastRow(); i++) {for (int j = 0; j < worksheet.getLastColumn(); j++) {//获取单元格并打印值Cell cell = worksheet.getCellRange(i, j);Object value = cell.getValue();System.out.print(value + "\t");}System.out.println();}}
}
2. Aspose
Aspose于2002年3月在澳大利亚悉尼创建,与Spire框架类似是一个更加成熟的以及老牌的收费java框架,Aspose以其强大的文件转换能力、丰富的文档处理功能、灵活的图像处理选项以及便捷的邮件处理功能,在多个领域得到了广泛应用。无论是需要处理复杂文档的企业,还是希望实现数据整合和自动化的开发者,Aspose都是一个值得考虑的选择。当然因为他是一个国外的收费软件,所以如果使用其来支撑产品功能性价比会很低。但是他也是少数可以做到在离线的linux环境中解析xls以及doc以及转换的能力。
import com.aspose.cells.Workbook;
import com.aspose.cells.Worksheet;
import com.aspose.cells.Cell;public class ParseExcel {public static void main(String[] args) {// 加载 Excel 文件Workbook workbook = new Workbook("path/to/your/excel/file.xlsx");// 获取第一个工作表Worksheet worksheet = workbook.getWorksheets().get(0);// 遍历工作表中的所有行和列for (int row = 0; row < worksheet.getCells().getMaxRow(); row++) {for (int column = 0; column < worksheet.getCells().getMaxColumn(); column++) {// 获取单元格Cell cell = worksheet.getCells().get(row, column);// 读取单元格内容System.out.print(cell.getStringValue() + "\t");}System.out.println();}}
}
总结
在一个成熟的java产品中,如果需要手撸一个解析excel的功能其实有诸多的限制,因为服务器需要部署在linux中,导致无法调用windows自带的一些类库来实现office文件的转换以及修改编辑。而大部分开源的框架中又无法对低版本的excel进行很好的支持,往往需要大量编码时间来做到支撑,并且会经常出现BUG。所以如果遇到这种卡点时,可以考虑使用部分收费的框架来达到这方面的效果。如果是仅支持excel高版本的解析大部分的开源框架都能支持这部分功能。
效率优先 | 解析低版本excel | 需要转换到其他格式 | 开源 | |
Apache POI | 推荐sxssf | 不推荐 | 不推荐 | 是 |
EasyExcel | 推荐 | 较推荐 | 不推荐 | 是 |
Spire.XLS for java | 推荐 | 推荐 | 推荐 | 否 |
Aspose | 推荐 | 推荐 | 推荐 | 否 |
最后附上七巧的资料参考:https://qiqiao.do1.com.cn/
点击关注,更多内容下期继续分享!
相关文章:
Java解析Excel文件
目录 背景 技术选型 开源Java框架选型 1. Apache POI 2. EasyExcel 收费Java框架选型 1. Spire.XLS for java 2. Aspose 总结 背景 在低代码产品的研发过程中,为用户提供数据导入导出的能力时,无法避免的就是对EXCEL解析的能力,所以本篇通过介…...
Require:基于雪花算法完成一个局部随机,全局离散没有热点切唯一的数值Id生成器。
【雪花算法】雪花算法(Snowflake Algorithm)是Twitter开源的用于生成唯一ID的算法,它可以在分布式系统中生成唯一的64位长整数ID。这种ID生成方式既保证了趋势递增,又保证了在不同数据中心、不同机器上生成的ID的唯一性。 符号位&…...
libevent - Macro function
TAILQ_INIT /** Tail queue functions.* 尾队列的头结点初始化为空队列。*/ #define TAILQ_INIT(head) do { \(head)->tqh_first NULL; \(head)->tqh_last &(head)->tqh_first; \ } while (/*CONSTCOND*/0)TAILQ_INIT 宏是一个用于初始化尾队列头部…...
408算法题leetcode--第17天
101. 对称二叉树 101. 对称二叉树思路:递归,对称即两个子树的左边和右边分别一样;一个子树是左中右遍历,另一个是右中左遍历;写的时候可以分三步,确定函数参数以及返回类型,确定终止条件&#…...

机器人顶刊IEEE T-RO发布无人机动态环境高效表征成果:基于粒子的动态环境连续占有地图
摘要:本研究有效提高了动态环境中障碍物建模的精度和效率。NOKOV度量动作捕捉系统助力评估动态占用地图在速度估计方面的性能。 近日,上海交通大学、荷兰代尔夫特理工研究团队在机器人顶刊IEEE T-RO上发表题为Continuous Occupancy Mapping in Dynamic …...

spring-boot web + vue
依赖的软件 maven 1. 官网下载zip 文件,比如apache-maven-3.9.9-bin.zip 2. 解压到某个盘符,必须保证父亲目录的名字包含英文,数字,破折号(-) 3. 设置环境变量M2_HOME, 并将%M2_HOME%\bin添加到windown…...

HDFS分布式文件系统01-HDFS架构与SHELL操作
HDFS分布式文件系统 学习目标第一课时知识点1-文件系统的分类单机文件系统网络文件系统分布式文件系统 知识点2-HDFS架构知识点3-HDFS的特点知识点4-HDFS的文件读写流程知识点5-HDFS的健壮性 第二课时知识点1-HDFS的Shell介绍HDFS Shell的语法格式如下。HDFS Shell客户端命令中…...
Go语言流程控制
Go语言流程控制 1.IF-ELSE2.Switch-Caseswitch 语句Type Switch 3.select 语句4.循环语句 1.IF-ELSE Go 编程语言中 if 语句的语法如下: if 布尔表达式 {/* 在布尔表达式为 true 时执行 */ }例如: package mainimport "fmt"func main() {va…...

无人机在救灾方面的应用!
一、灾害监测与评估 实时监测与评估:无人机可以快速到达灾害现场,通过搭载的高清摄像头、红外热成像仪等设备,对灾区进行实时监测和灾情评估。根据捕捉到的受灾范围、火势大小、建筑物损坏情况等关键信息,为救援行动提供决策依据…...

面试知识点总结篇一
一、C语言和C有什么区别 C语言是面向过程,强调用函数将问题分解为多个子任务,按顺序逐步进行。数据和操作分开C则是面向对象,面向对象是一种基于对象和类的编程范式,关注如何利用对象来抽象和模拟现实世界的实体。因此引入了类&a…...

【计算机网络 - 基础问题】每日 3 题(二十五)
✍个人博客:Pandaconda-CSDN博客 📣专栏地址:http://t.csdnimg.cn/fYaBd 📚专栏简介:在这个专栏中,我将会分享 C 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞👍收藏&…...

【第十八章:Sentosa_DSML社区版-机器学习之协同过滤】
【第十八章:Sentosa_DSML社区版-机器学习之协同过滤】 1.算子介绍 协同过滤是推荐系统中常用的一种方法。该算法旨在填补用户-产品关联矩阵中缺少的项。在算法中,用户和产品都是通过一组少量的潜在因素描述,这些潜在因素可以用于预测用户-产…...
TDOA方法求二维坐标的MATLAB代码演示与讲解
引言 时间差定位(Time Difference of Arrival, TDOA)是一种用于确定信号源位置的技术,广泛应用于无线通信、声学定位等领域。通过测量信号到达多个接收器的时间差,可以计算出信号源的二维坐标。本文将通过MATLAB代码演示如何使用TDOA方法来求解二维坐标。 TDOA原理 TDOA…...

基于微信的原创音乐小程序的设计与实现+ssm论文源码调试讲解
第二章 开发工具及关键技术介绍 2.1 JAVA技术 Java主要采用CORBA技术和安全模型,可以在互联网应用的数据保护。它还提供了对EJB(Enterrise JavaBeans)的全面支持,java servlet AI,JS(java server ages&…...

基于大数据技术的颈椎病预防交流与数据分析及可视化系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏:Java精选实战项目…...

Spring MVC中实现一个文件上传和下载功能
说到文件上传和下载,相信每个开发者都有或多或少的接触过文件上传的功能吧,文件上传和下载是我们在学习计算机网络应用常见的一个功能,主要涉及到用户和服务器之间的数据传输。 我们来对文件上传和下载功能的进行相关概述吧! 文…...

Webpack 介绍
Webpack 介绍 Date: August 29, 2024 全文概要 Webpack概念: Webpack是一个静态的模块化的打包工具,可以为现代的 JavaSript 应用程序进行打包。 1-静态:Webpack可以将代码打包成最终的静态资源 2-模块化:webpack支持各种模块…...
在Linux实时监控某个应用是否运行,未运行,执行运行命令
1、shell脚本(每隔30秒检测一次) 脚本要注意的地方是:在Nodepad编辑的时候要使用Unix(LF)格式,避免在Linux无法执行命令 #!/bin/bash# RabbitMQ进程名称(可能需要根据你的安装进行调整) RABBITMQ_PROCE…...

Serilog文档翻译系列(六) - 可用的接收器、增强器、格式化输出
01、提供的接收器 Serilog 使用接收器将日志事件以各种格式写入存储。许多接收器由更广泛的 Serilog 社区开发和支持;可以通过在 NuGet 上搜索 serilog 标签找到。 02、增强器 日志事件可以通过多种方式增强属性。通过 NuGet 提供了一些预构建的增强器ÿ…...

傅里叶级数在机器人中的应用(动力学参数辨识)
B站首发!草履虫都能看懂的【傅里叶变换】讲解,清华大学李永乐老师教你如何理解傅里叶变换,辨清美颜和变声原理,!!_哔哩哔哩_bilibiliB站首发!草履虫都能看懂的【傅里叶变换】讲解,清…...

《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一)
CSI-2 协议详细解析 (一) 1. CSI-2层定义(CSI-2 Layer Definitions) 分层结构 :CSI-2协议分为6层: 物理层(PHY Layer) : 定义电气特性、时钟机制和传输介质(导线&#…...
多模态商品数据接口:融合图像、语音与文字的下一代商品详情体验
一、多模态商品数据接口的技术架构 (一)多模态数据融合引擎 跨模态语义对齐 通过Transformer架构实现图像、语音、文字的语义关联。例如,当用户上传一张“蓝色连衣裙”的图片时,接口可自动提取图像中的颜色(RGB值&…...

Netty从入门到进阶(二)
二、Netty入门 1. 概述 1.1 Netty是什么 Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients. Netty是一个异步的、基于事件驱动的网络应用框架,用于…...
GitHub 趋势日报 (2025年06月06日)
📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...
LRU 缓存机制详解与实现(Java版) + 力扣解决
📌 LRU 缓存机制详解与实现(Java版) 一、📖 问题背景 在日常开发中,我们经常会使用 缓存(Cache) 来提升性能。但由于内存有限,缓存不可能无限增长,于是需要策略决定&am…...

淘宝扭蛋机小程序系统开发:打造互动性强的购物平台
淘宝扭蛋机小程序系统的开发,旨在打造一个互动性强的购物平台,让用户在购物的同时,能够享受到更多的乐趣和惊喜。 淘宝扭蛋机小程序系统拥有丰富的互动功能。用户可以通过虚拟摇杆操作扭蛋机,实现旋转、抽拉等动作,增…...
tomcat入门
1 tomcat 是什么 apache开发的web服务器可以为java web程序提供运行环境tomcat是一款高效,稳定,易于使用的web服务器tomcathttp服务器Servlet服务器 2 tomcat 目录介绍 -bin #存放tomcat的脚本 -conf #存放tomcat的配置文件 ---catalina.policy #to…...

篇章二 论坛系统——系统设计
目录 2.系统设计 2.1 技术选型 2.2 设计数据库结构 2.2.1 数据库实体 1. 数据库设计 1.1 数据库名: forum db 1.2 表的设计 1.3 编写SQL 2.系统设计 2.1 技术选型 2.2 设计数据库结构 2.2.1 数据库实体 通过需求分析获得概念类并结合业务实现过程中的技术需要&#x…...

何谓AI编程【02】AI编程官网以优雅草星云智控为例建设实践-完善顶部-建立各项子页-调整排版-优雅草卓伊凡
何谓AI编程【02】AI编程官网以优雅草星云智控为例建设实践-完善顶部-建立各项子页-调整排版-优雅草卓伊凡 背景 我们以建设星云智控官网来做AI编程实践,很多人以为AI已经强大到不需要程序员了,其实不是,AI更加需要程序员,普通人…...
命令行关闭Windows防火墙
命令行关闭Windows防火墙 引言一、防火墙:被低估的"智能安检员"二、优先尝试!90%问题无需关闭防火墙方案1:程序白名单(解决软件误拦截)方案2:开放特定端口(解决网游/开发端口不通)三、命令行极速关闭方案方法一:PowerShell(推荐Win10/11)方法二:CMD命令…...