Java解析Excel文件
目录
背景
技术选型
开源Java框架选型
1. Apache POI
2. EasyExcel
收费Java框架选型
1. Spire.XLS for java
2. Aspose
总结
背景
在低代码产品的研发过程中,为用户提供数据导入导出的能力时,无法避免的就是对EXCEL解析的能力,所以本篇通过介绍部分开源框架以及收费框架的相关技术,来介绍低代码产品中与Excel解析相关的知识。
技术选型
开源Java框架选型
在Java中,解析Excel文件的技术选择多种多样,但最为流行和广泛使用的莫过于Apache POI和EasyExcel。
1. Apache POI
Apache POI是Apache软件基金会下的一个开源项目,提供了对Microsoft Office格式文件的读写支持,包括Excel、Word和PowerPoint等。对于Excel文件,Apache POI支持.xls(Excel 2003及之前版本)和.xlsx(Excel 2007及之后版本)两种格式。
Apache POI基于DOM(Document Object Model)方式解析Excel文件,即将整个文件加载到内存中,然后构建成一个树状结构,便于通过编程方式访问和操作。这种方式在处理小型Excel文件时非常高效,但如果文件过大,可能会导致内存溢出。
代码示例:
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;public class ExcelParser {public static void main(String[] args) {String excelFilePath = "path/to/your/excel/file.xlsx";try (FileInputStream fileInputStream = new FileInputStream(new File(excelFilePath));Workbook workbook = new XSSFWorkbook(fileInputStream)) {Sheet sheet = workbook.getSheetAt(0); // 获取第一个工作表for (Row row : sheet) { // 迭代行for (Cell cell : row) { // 迭代列// 获取单元格数据,根据单元格类型使用相应的方法switch (cell.getCellTypeEnum()) {case STRING:System.out.print(cell.getStringCellValue() + "\t");break;case NUMERIC:System.out.print(cell.getNumericCellValue() + "\t");break;case BOOLEAN:System.out.print(cell.getBooleanCellValue() + "\t");break;case FORMULA:System.out.print(cell.getCellFormula() + "\t");break;default:System.out.print("\t");break;}}System.out.println();}} catch (IOException e) {
e.printStackTrace();}}
} 2. EasyExcel
EasyExcel是阿里巴巴开源的一个基于Java的快速、简洁、解决大文件内存溢出的Excel处理工具。与Apache POI不同,EasyExcel采用了SAX(Simple API for XML)模式来解析Excel文件,实现了逐行读取,大大减少了内存的占用。
EasyExcel特别适用于处理大数据量的Excel文件,能够显著提高处理速度和降低内存消耗。同时,EasyExcel还提供了丰富的API来简化Excel的读写操作,使得开发者能够更加专注于业务逻辑的实现。
import com.alibaba.excel.EasyExcel;public class TestEasyExcel {public static void main(String[] args) {String fileName = "test.xlsx";EasyExcel.write(fileName, Object.class).sheet("Sheet1").doWrite(data());}private static List<Object> data() {List<Object> list = new ArrayList<>();
list.add(new YourDataClass("data1", "data2"));// ... 添加更多数据return list;}
} 收费Java框架选型
1. Spire.XLS for java
Spire.XLS是成都冰蓝科技有限公司为.NET开发人员提供的一款功能强大的Excel操作组件。它以其独立性、广泛的支持性和高效的操作性能,赢得了众多开发者的青睐。无论是在企业级的报表生成、数据分析还是其他需要处理Excel文件的场景中,Spire.XLS for .NET都能为开发者提供强有力的支持。
使用Spire.XLS对于文件类型的转换提供了几行代码即可解析excel甚至将其在离线linux环境中解析甚至转换低版本excel的能力。这在开源框架中是几乎无法完美做到的。
import com.spire.xls.*;public class ParseExcel {public static void main(String[] args) {//加载Excel文档Workbook workbook = new Workbook();
workbook.loadFromFile("路径到Excel文件.xlsx");//获取工作表Worksheet worksheet = workbook.getWorksheets().get(0);//遍历工作表中的所有单元格for (int i = 0; i < worksheet.getLastRow(); i++) {for (int j = 0; j < worksheet.getLastColumn(); j++) {//获取单元格并打印值Cell cell = worksheet.getCellRange(i, j);Object value = cell.getValue();System.out.print(value + "\t");}System.out.println();}}
} 2. Aspose
Aspose于2002年3月在澳大利亚悉尼创建,与Spire框架类似是一个更加成熟的以及老牌的收费java框架,Aspose以其强大的文件转换能力、丰富的文档处理功能、灵活的图像处理选项以及便捷的邮件处理功能,在多个领域得到了广泛应用。无论是需要处理复杂文档的企业,还是希望实现数据整合和自动化的开发者,Aspose都是一个值得考虑的选择。当然因为他是一个国外的收费软件,所以如果使用其来支撑产品功能性价比会很低。但是他也是少数可以做到在离线的linux环境中解析xls以及doc以及转换的能力。
import com.aspose.cells.Workbook;
import com.aspose.cells.Worksheet;
import com.aspose.cells.Cell;public class ParseExcel {public static void main(String[] args) {// 加载 Excel 文件Workbook workbook = new Workbook("path/to/your/excel/file.xlsx");// 获取第一个工作表Worksheet worksheet = workbook.getWorksheets().get(0);// 遍历工作表中的所有行和列for (int row = 0; row < worksheet.getCells().getMaxRow(); row++) {for (int column = 0; column < worksheet.getCells().getMaxColumn(); column++) {// 获取单元格Cell cell = worksheet.getCells().get(row, column);// 读取单元格内容System.out.print(cell.getStringValue() + "\t");}System.out.println();}}
} 总结
在一个成熟的java产品中,如果需要手撸一个解析excel的功能其实有诸多的限制,因为服务器需要部署在linux中,导致无法调用windows自带的一些类库来实现office文件的转换以及修改编辑。而大部分开源的框架中又无法对低版本的excel进行很好的支持,往往需要大量编码时间来做到支撑,并且会经常出现BUG。所以如果遇到这种卡点时,可以考虑使用部分收费的框架来达到这方面的效果。如果是仅支持excel高版本的解析大部分的开源框架都能支持这部分功能。
| 效率优先 | 解析低版本excel | 需要转换到其他格式 | 开源 | |
| Apache POI | 推荐sxssf | 不推荐 | 不推荐 | 是 |
| EasyExcel | 推荐 | 较推荐 | 不推荐 | 是 |
| Spire.XLS for java | 推荐 | 推荐 | 推荐 | 否 |
| Aspose | 推荐 | 推荐 | 推荐 | 否 |
最后附上七巧的资料参考:https://qiqiao.do1.com.cn/
点击关注,更多内容下期继续分享!
相关文章:
Java解析Excel文件
目录 背景 技术选型 开源Java框架选型 1. Apache POI 2. EasyExcel 收费Java框架选型 1. Spire.XLS for java 2. Aspose 总结 背景 在低代码产品的研发过程中,为用户提供数据导入导出的能力时,无法避免的就是对EXCEL解析的能力,所以本篇通过介…...
Require:基于雪花算法完成一个局部随机,全局离散没有热点切唯一的数值Id生成器。
【雪花算法】雪花算法(Snowflake Algorithm)是Twitter开源的用于生成唯一ID的算法,它可以在分布式系统中生成唯一的64位长整数ID。这种ID生成方式既保证了趋势递增,又保证了在不同数据中心、不同机器上生成的ID的唯一性。 符号位&…...
libevent - Macro function
TAILQ_INIT /** Tail queue functions.* 尾队列的头结点初始化为空队列。*/ #define TAILQ_INIT(head) do { \(head)->tqh_first NULL; \(head)->tqh_last &(head)->tqh_first; \ } while (/*CONSTCOND*/0)TAILQ_INIT 宏是一个用于初始化尾队列头部…...
408算法题leetcode--第17天
101. 对称二叉树 101. 对称二叉树思路:递归,对称即两个子树的左边和右边分别一样;一个子树是左中右遍历,另一个是右中左遍历;写的时候可以分三步,确定函数参数以及返回类型,确定终止条件&#…...
机器人顶刊IEEE T-RO发布无人机动态环境高效表征成果:基于粒子的动态环境连续占有地图
摘要:本研究有效提高了动态环境中障碍物建模的精度和效率。NOKOV度量动作捕捉系统助力评估动态占用地图在速度估计方面的性能。 近日,上海交通大学、荷兰代尔夫特理工研究团队在机器人顶刊IEEE T-RO上发表题为Continuous Occupancy Mapping in Dynamic …...
spring-boot web + vue
依赖的软件 maven 1. 官网下载zip 文件,比如apache-maven-3.9.9-bin.zip 2. 解压到某个盘符,必须保证父亲目录的名字包含英文,数字,破折号(-) 3. 设置环境变量M2_HOME, 并将%M2_HOME%\bin添加到windown…...
HDFS分布式文件系统01-HDFS架构与SHELL操作
HDFS分布式文件系统 学习目标第一课时知识点1-文件系统的分类单机文件系统网络文件系统分布式文件系统 知识点2-HDFS架构知识点3-HDFS的特点知识点4-HDFS的文件读写流程知识点5-HDFS的健壮性 第二课时知识点1-HDFS的Shell介绍HDFS Shell的语法格式如下。HDFS Shell客户端命令中…...
Go语言流程控制
Go语言流程控制 1.IF-ELSE2.Switch-Caseswitch 语句Type Switch 3.select 语句4.循环语句 1.IF-ELSE Go 编程语言中 if 语句的语法如下: if 布尔表达式 {/* 在布尔表达式为 true 时执行 */ }例如: package mainimport "fmt"func main() {va…...
无人机在救灾方面的应用!
一、灾害监测与评估 实时监测与评估:无人机可以快速到达灾害现场,通过搭载的高清摄像头、红外热成像仪等设备,对灾区进行实时监测和灾情评估。根据捕捉到的受灾范围、火势大小、建筑物损坏情况等关键信息,为救援行动提供决策依据…...
面试知识点总结篇一
一、C语言和C有什么区别 C语言是面向过程,强调用函数将问题分解为多个子任务,按顺序逐步进行。数据和操作分开C则是面向对象,面向对象是一种基于对象和类的编程范式,关注如何利用对象来抽象和模拟现实世界的实体。因此引入了类&a…...
【计算机网络 - 基础问题】每日 3 题(二十五)
✍个人博客:Pandaconda-CSDN博客 📣专栏地址:http://t.csdnimg.cn/fYaBd 📚专栏简介:在这个专栏中,我将会分享 C 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞👍收藏&…...
【第十八章:Sentosa_DSML社区版-机器学习之协同过滤】
【第十八章:Sentosa_DSML社区版-机器学习之协同过滤】 1.算子介绍 协同过滤是推荐系统中常用的一种方法。该算法旨在填补用户-产品关联矩阵中缺少的项。在算法中,用户和产品都是通过一组少量的潜在因素描述,这些潜在因素可以用于预测用户-产…...
TDOA方法求二维坐标的MATLAB代码演示与讲解
引言 时间差定位(Time Difference of Arrival, TDOA)是一种用于确定信号源位置的技术,广泛应用于无线通信、声学定位等领域。通过测量信号到达多个接收器的时间差,可以计算出信号源的二维坐标。本文将通过MATLAB代码演示如何使用TDOA方法来求解二维坐标。 TDOA原理 TDOA…...
基于微信的原创音乐小程序的设计与实现+ssm论文源码调试讲解
第二章 开发工具及关键技术介绍 2.1 JAVA技术 Java主要采用CORBA技术和安全模型,可以在互联网应用的数据保护。它还提供了对EJB(Enterrise JavaBeans)的全面支持,java servlet AI,JS(java server ages&…...
基于大数据技术的颈椎病预防交流与数据分析及可视化系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏:Java精选实战项目…...
Spring MVC中实现一个文件上传和下载功能
说到文件上传和下载,相信每个开发者都有或多或少的接触过文件上传的功能吧,文件上传和下载是我们在学习计算机网络应用常见的一个功能,主要涉及到用户和服务器之间的数据传输。 我们来对文件上传和下载功能的进行相关概述吧! 文…...
Webpack 介绍
Webpack 介绍 Date: August 29, 2024 全文概要 Webpack概念: Webpack是一个静态的模块化的打包工具,可以为现代的 JavaSript 应用程序进行打包。 1-静态:Webpack可以将代码打包成最终的静态资源 2-模块化:webpack支持各种模块…...
在Linux实时监控某个应用是否运行,未运行,执行运行命令
1、shell脚本(每隔30秒检测一次) 脚本要注意的地方是:在Nodepad编辑的时候要使用Unix(LF)格式,避免在Linux无法执行命令 #!/bin/bash# RabbitMQ进程名称(可能需要根据你的安装进行调整) RABBITMQ_PROCE…...
Serilog文档翻译系列(六) - 可用的接收器、增强器、格式化输出
01、提供的接收器 Serilog 使用接收器将日志事件以各种格式写入存储。许多接收器由更广泛的 Serilog 社区开发和支持;可以通过在 NuGet 上搜索 serilog 标签找到。 02、增强器 日志事件可以通过多种方式增强属性。通过 NuGet 提供了一些预构建的增强器ÿ…...
傅里叶级数在机器人中的应用(动力学参数辨识)
B站首发!草履虫都能看懂的【傅里叶变换】讲解,清华大学李永乐老师教你如何理解傅里叶变换,辨清美颜和变声原理,!!_哔哩哔哩_bilibiliB站首发!草履虫都能看懂的【傅里叶变换】讲解,清…...
终极CoreCycler完全指南:5步掌握CPU单核稳定性测试与精准调校
终极CoreCycler完全指南:5步掌握CPU单核稳定性测试与精准调校 【免费下载链接】corecycler Script to test single core stability, e.g. for PBO & Curve Optimizer on AMD Ryzen or overclocking/undervolting on Intel processors 项目地址: https://gitco…...
Zotero插件市场:三步快速上手的插件管理神器
Zotero插件市场:三步快速上手的插件管理神器 【免费下载链接】zotero-addons Zotero Add-on Market | Zotero插件市场 | Browsing, installing, and reviewing plugins within Zotero 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-addons 想象一下&a…...
轻量级爬虫框架slacrawl:基于规则驱动的模块化数据采集实践
1. 项目概述:一个轻量级、模块化的网页爬虫框架最近在做一个需要从多个网站定时抓取结构化数据的小项目,找了一圈现成的工具,要么太重(像Scrapy,学起来成本高),要么太死板(很多脚本只…...
Unity游戏开发集成MCP协议:AI助手自动化操作指南
1. 项目概述:Unity游戏开发中的MCP革命如果你是一名Unity开发者,最近可能已经注意到一个名为“CoderGamester/mcp-unity”的项目在GitHub上悄然走红。这不仅仅是一个普通的插件或工具包,它代表了一种全新的工作流范式,旨在将大型语…...
终极指南:3步实现PotPlayer实时字幕翻译,外语视频无障碍观看
终极指南:3步实现PotPlayer实时字幕翻译,外语视频无障碍观看 【免费下载链接】PotPlayer_Subtitle_Translate_Baidu PotPlayer 字幕在线翻译插件 - 百度平台 项目地址: https://gitcode.com/gh_mirrors/po/PotPlayer_Subtitle_Translate_Baidu 还…...
开源机械爪OpenClaw:从设计到力控抓取的完整实现指南
1. 项目概述:从“OpenClaw”看开源机械爪的无限可能最近在逛GitHub的时候,发现了一个挺有意思的项目,叫“MeyerZhou/openclaw”。光看名字,你大概能猜到这是个关于机械爪的开源项目。没错,这是一个旨在提供低成本、模块…...
Kubernetes配置管理实战:基于Kustomize的结构化部署与多环境管理
1. 项目概述:一个被低估的Kubernetes配置管理利器如果你和我一样,长期在Kubernetes生态里摸爬滚打,那你一定经历过这样的场景:为了部署一个稍微复杂点的应用,需要维护一堆YAML文件——Deployment、Service、ConfigMap、…...
乌尔都语语音合成落地难?揭秘ElevenLabs未公开的ur-PK语言代码陷阱与ISO 639-3双标适配规范(仅限首批127家认证开发者知晓)
更多请点击: https://intelliparadigm.com 第一章:乌尔都语语音合成落地难?揭秘ElevenLabs未公开的ur-PK语言代码陷阱与ISO 639-3双标适配规范(仅限首批127家认证开发者知晓) ElevenLabs 官方文档中仅标注 ur 为乌尔…...
基于Panel与LLM构建智能数据可视化应用的架构与实践
1. 项目概述与核心价值最近在数据可视化与交互应用开发领域,一个名为holoviz-topics/panel-chat-examples的项目仓库引起了我的注意。乍一看,这似乎只是将聊天界面(Chat Interface)与 Panel 这个强大的 Python 交互式仪表盘库结合…...
数据分析师能力展示:从项目构建到报告呈现的完整指南
1. 项目概述:一个数据分析师的能力展示平台最近在GitHub上看到一个挺有意思的项目,叫“dataanalyst-showcase”。光看名字,你可能会觉得这又是一个数据科学项目合集,但点进去仔细研究后,我发现它的定位非常精准——它不…...
