当前位置: 首页 > news >正文

【Excel单元格类型的解析校验】Java使用POI解析excel数据

一、使用的maven依赖:

<dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>2.1.7</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>4.1.2</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>4.1.2</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml-schemas</artifactId><version>4.1.2</version>
</dependency>

二、对上传的文件类型,文件大小进行校验控制

//TODO==上传校验文件名后缀、大小限制
if (org.springframework.util.StringUtils.isEmpty(file)) {return new ResultVO("请上传文件!");
}if (file.getSize() > 20971520 || file.getSize() == 0) //大于20MB
{return new ResultVO("文件大小大于0MB,小于20MB");
}
System.out.println(file.getContentType());
System.out.println(file.getOriginalFilename());List<String> typeList = Arrays.asList(".xls", ".XLS", ".xlsx", ".XLSX", ".doc", ".DOC", ".docx", ".DOCX", ".pdf", ".PDF", ".jpg", ".JPG", ".png", ".PNG", ".jepg", ".JPEG", ".bpm", ".BPM", ".zip", ".ZIP", ".rar", ".RAR");
String fileType = file.getOriginalFilename().substring(file.getOriginalFilename().lastIndexOf("."));
if (!typeList.contains(fileType)) {return new ResultVO("文件类型有误!");
}
//TODO==上传校验文件名后缀、大小限制

三、对是否使用模板进行Excel文件的上传进行校验 | 判断Excel固定单元格是否有值

public static String ExecelExport(MultipartFile file) {Sheet sheet;InputStream inputStream = null;try {//获取前端传递过来的文件对象,存储在“inputStream”中inputStream = file.getInputStream();//获取文件名String fileName = file.getOriginalFilename();//用于存储解析后的Excel文件Workbook workbook = null;//判断文件扩展名为“.xls还是xlsx的Excel文件”,因为不同扩展名的Excel所用到的解析方法不同String fileType = fileName.substring(fileName.lastIndexOf("."));if (".xls".equals(fileType)) {//HSSFWorkbook专门解析.xls文件workbook = new HSSFWorkbook(inputStream);} else if (".xlsx".equals(fileType)) {//XSSFWorkbook专门解析.xlsx文件workbook = new XSSFWorkbook(inputStream);} else {throw new BusinessException("导入文件类型非法");}//获取第一个sheet页Sheet sheet1 = workbook.getSheetAt(0);//获取固定行固定列,(获取想要进行校验的单元格的值)Cell cell = sheet1.getRow(0).getCell(11);String stringCellValue = cell.getStringCellValue();return stringCellValue;} catch (Exception e) {System.out.println(e.getMessage());e.printStackTrace();return null;} finally {try {inputStream.close();} catch (IOException e) {e.printStackTrace();return null;}}
}

四、Java解析Excel,获取单元格,并对单元格中的内容进行校验

//获得文本操作对象
XSSFWorkbook wb = new XSSFWorkbook(file.getInputStream());
// 得到第一个SHEET页面
XSSFSheet sheet = wb.getSheetAt(0);
// 开始进行SHEET页面解析
if(sheet != null){Set sfzhmSet = new HashSet();//校验,并将有问题的校验信息全部返回到前端String errResultMsg = "";for (int rowNum = 0; rowNum <= sheet.getLastRowNum(); rowNum++) {//排除表头,从第四行开始解析if (rowNum > 2) {//获取表格有数据的第一行XSSFRow hssfRow = sheet.getRow(rowNum);//获取第一行第一个单元格Cell cell = hssfRow.getCell(0);//判断单元格里内容是否为空if (hssfRow == null || cell == null || cell.getCellType() == CellType.BLANK) {continue;}//进行基本数据校验String errMsg = ValidateUtil.validatePersonnelInfo(hssfRow).toString();if (StringUtils.isNotBlank(errMsg)) {errResultMsg += errMsg;}}}//将全部校验结果返回至前端if(!"".equals(errResultMsg)){return new ResultVO(errResultMsg);}
}

五、获取单个Excel单元格的类型,进行相关的校验

CellType.NUMERIC:数字类型
CellType.STRING:字符串类型
CellType.FORMULA:公式类型
CellType.BLANK:空值类型
CellType.BOOLEAN:Boolean类型
CellType.ERROR:错误故障类型

//获取单个单元格的数据类型
public static String getCellValue(Cell cell) {String cellValue = "";if (cell == null) {return cellValue;}// 判断数据的类型switch (cell.getCellType()) {case NUMERIC:// 数字cellValue = String.valueOf(cell.getNumericCellValue());break;case STRING:// 字符串cellValue = String.valueOf(cell.getStringCellValue());break;case BOOLEAN:// BooleancellValue = String.valueOf(cell.getBooleanCellValue());break;case FORMULA:// 公式cellValue = String.valueOf(cell.getCellFormula());break;case BLANK:// 空值cellValue = "";break;case ERROR:// 故障cellValue = "非法字符";break;default:cellValue = "未知类型";break;}return cellValue;
}

1、若Excel中导入的字符串数字类型变成了NUMERIC数字类型:

解决方法: NumberToTextConverter.toText();

if(c.getCellType()==CellType.NUMERIC){returnStr = NumberToTextConverter.toText(c.getNumericCellValue());
}

参考链接:https://blog.csdn.net/FxxYSHOOO/article/details/126297887

2、excel中数据明明是yyyy/mm/dd ,java程序解析为dd-M月-yyyy | Excel中,单元格类型为NUMERIC的日期数据的处理:

处理方式:需要先将数据转化为天数,在转成日期格式的字符串。

//1、将数据转化为天数
double value = cell.getNumericCellValue(); 
//2、将天数转成日期格式的字符串
Calendar calendar = new GregorianCalendar(1900,0,-1);
SimpleDateFormat formatter = new SimpleDateFormat("yyyy-MM-dd");
Date d = calendar.getTime();
Date dd = DateUtils.addDays(d,Integer.valueOf((int) value));
String format1 = formatter.format(dd);//将日期转化为字符串格式

参考链接:https://blog.csdn.net/qq_43354492/article/details/128124813

3、更全面的解析Excel单元格类型,并对数据进行处理的方法:

主要是对 数据类型 和 公式类型 两种有细分的区别处理;

public static final String REGEX = "\n";
//getCellValue出来的数据就是去格式化之后的正确数据
private String getCellValue(Cell cell) {Object cellValue;if (cell != null) {cellValue = cellValue(cell);} else {cellValue = "";}return String.valueOf(cellValue);}private Object cellValue(Cell cell) {//判断cell类型Object cellValue;switch (cell.getCellType()) {case NUMERIC: {cellValue = date(cell);break;}case FORMULA: {cellValue = formula(cell);break;}case STRING: {cellValue = cell.getRichStringCellValue().getString().replaceAll(REGEX, " ") ;break;}default:cellValue = cell.getStringCellValue();}return cellValue;}private Object formula(Cell cell) {//判断cell是否为日期格式Object cellValue = null;try {cellValue = date(cell);} catch (Exception e) {if (e.getMessage().contains(STRING)) {cellValue = cell.getRichStringCellValue().getString().replaceAll(REGEX, " ");}}return cellValue;}private Object date(Cell cell) {Object cellValue;if (DateUtil.isCellDateFormatted(cell)) {cellValue = cell.getDateCellValue();cellValue = cellDate(cellValue);} else {//数字cell.setCellType(CellType.STRING);cellValue = cell.getRichStringCellValue();}return String.valueOf(cellValue).replaceAll(REGEX, " ");}private Object cellDate(Object cellValue) {DateFormat formater = new SimpleDateFormat("yyyy-MM-dd");cellValue = formater.format(cellValue);return cellValue;}

参考链接1:https://blog.csdn.net/icemeco/article/details/130872752
参考链接2:https://blog.csdn.net/FxxYSHOOO/article/details/126297887

相关文章:

【Excel单元格类型的解析校验】Java使用POI解析excel数据

一、使用的maven依赖&#xff1a; <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>2.1.7</version> </dependency> <dependency><groupId>org.apache.poi</groupId&…...

【运维知识高级篇】超详细的Jenkins教程5(pipeline流水线配置+分布式构建)

CI/CD是持续集成&#xff0c;持续部署&#xff0c;集成就是开发人员通过自动化编译&#xff0c;发布&#xff0c;测试的手段集成软件&#xff0c;在开发的测试环境上测试发现自己的错误&#xff1b;持续部署是自动化构建&#xff0c;部署&#xff0c;通常也是在测试环境上进行&…...

为什么要在电影院装监控?有什么作用?

近期小编在网上看到有很多人在讨论&#xff1a;电影院的摄像头有多高清&#xff1f;看电影时的小动作放映员都能看得一清二楚&#xff1f;答案是&#xff1a;是的。但大家也不必有心理负担&#xff0c;电影院的监控目的不是为了监控观众&#xff0c;更多的是为了保障观影者的权…...

攻防世界题目练习——Web引导模式(三)(持续更新)

题目目录 1. mfw2. Cat3.4.5. 1. mfw 进去看到网页和页面内容如下&#xff1a; 看到url的参数 ?pageabout &#xff0c;我以为是文件包含什么的&#xff0c;反复试了几次&#xff0c;想用 …/…/…/…/etc/passwd &#xff0c;但是发现.似乎被过滤了&#xff0c;实在不知道怎…...

Python制作PDF转Word工具(Tkinter+pdf2docx)

一、效果样式 二、核心点 1. 使用pdf2docx完成PDF转换Word 安装pdf2docx可能会报错&#xff0c;安装完成引入from pdf2docx import Converter运行也可能报错&#xff0c;可以根据报错提示看缺少那些库&#xff0c;先卸载pip uninstall xxx,使用pip install python-docx -i htt…...

有哪些手段可以优化 CSS, 提高性能

CSS优化是Web开发中提高性能和用户体验的关键部分。下面详细解释一些CSS优化的方法&#xff0c;以提高性能&#xff1a; 合并和压缩CSS文件: 合并文件&#xff1a;将多个CSS文件合并成一个&#xff0c;以减少HTTP请求次数。这可以通过构建工具&#xff08;如Webpack&#xff09…...

ARM可用的可信固件项目简介

安全之安全(security)博客目录导读 目录 一、TrustedFirmware-A (TF-A) 二、MCUboot 三、TrustedFirmware-M (TF-M) 四、TF-RMM 五、OP-TEE 六、Mbed TLS 七、Hafnium 八、Trusted Services 九、Open CI 可信固件为Armv8-A、Armv9-A和Armv8-M提供了安全软件的参考实现…...

信创办公–基于WPS的Word最佳实践系列 (图文环绕方式)

信创办公–基于WPS的Word最佳实践系列 &#xff08;图文环绕方式&#xff09; 目录 应用背景操作步骤1、 打开布局选项中图文环绕方式的方法2、 图文环绕三大类型 应用背景 在Word中&#xff0c;对文字和图片进行排版时&#xff0c;采用各种不同的图片与文字组合效果能够使页面…...

Naive UI数据表格分页pageCount配置没效果

吐槽&#xff1a;因为naive-ui是基于vue3&#xff0c;所以目前的组件资料是少之又少啊&#xff0c;虽然好用&#xff0c;但感觉没有特别的普及。 背景&#xff1a;记得1年前我第一次碰到了这个问题&#xff0c;在列表里使用:pagination分页&#xff0c;怎么都不显示页码&#…...

Kibana Discover数据查询

步骤1&#xff1a;打开管理页面(Management) 步骤2&#xff1a; 因为前面的章节导入航班数据的时候&#xff0c;自动创建了一个名字叫kibana_sample_data_flights的航班数据索引&#xff0c;如果我们只想搜索kibana_sample_data_flights索引的数据&#xff0c;则不需要通配符&…...

笔记 | 编程经验谈:如何正确的使用内存

笔记 | 编程经验谈:如何正确的使用内存 首先我们要了解内存的分配方式。一般来说,内存的分配方式有三种: 1.从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在。例如全局变量,static变量。 2.在栈上创建。在执行函数时,函数内…...

C语言入门-1.1 C语言概述

想要学好一门计算机编程语言&#xff0c;就和谈一个女朋友是一样的&#xff0c;需要对其深入了解。 1、计算机语言 &#xff08;1&#xff09;什么是计算机语言&#xff1f; 顾名思义&#xff0c;就是计算机之间交流的语言&#xff0c;就和人一样&#xff0c;咱们都是使用普通…...

周记之学习总结

你在人群中看到的每一个耀眼的女孩&#xff0c;都是踩着刀尖过来的。你如履平地般地舒适坦然&#xff0c;当然不配拥有任何光芒&#xff1b; 10.11-10.12 思来想去还是不舍得&#xff0c;搞了一下这个jwt&#xff0c;看了很多视频和博客&#xff0c;一直没看懂&#xff0c;两…...

程序设计:C++ 一个可以放入共享内存的string模板

共享内存由于是多进程共享的&#xff0c;里面的数据不适合包含指针&#xff0c;因为共享内存在不同进程里的地址并不相同。尽管可以在连接共享内存时指定连接地址&#xff0c;但是&#xff0c;这样做限制太多&#xff1a; 不同硬件、系统这个地址可能不一样&#xff0c;没有通…...

【EI会议征稿】第三届应用力学与先进材料国际学术会议(ICAMAM 2024)

第三届应用力学与先进材料国际学术会议&#xff08;ICAMAM 2024&#xff09; 2024 3rd International Conference on Applied Mechanics and Advanced Materials&#xff08;ICAMAM 2024&#xff09; 第三届应用力学与先进材料国际学术会议&#xff08;ICAMAM 2024&#xff09…...

Python -- I/O编程

文章目录 一、文件读写1. 读文件2. 二进制文件3. 字符编码4. 写文件 二、StringIO和BytesIO三、操作文件和目录1. 操作系统命令2. 操作文件 四、序列化五、 JSON六、异步IO1. 协程2. asyncioasync/awaitaiohttp 一、文件读写 Python内置了读写文件的函数&#xff0c;用法和C是…...

langchain入门指南和实战

简单介绍 LangChain 是一个开源的语言模型集成框架&#xff0c;旨在简化使用大型语言模型&#xff08;LLM&#xff09;创建应用程序的过程。 利用它可以让开发者使用语言模型来实现各种复杂的任务&#xff0c;例如文本到图像的生成、文档问答、聊天机器人、 调用特定的SaaS服务…...

群晖synology DSM 7.2设置钉钉Webhooks通知

现在越来越多的小伙伴都有了自己的Nas系统&#xff0c;为了更加方便的接收Nas的消息&#xff0c;这篇文章带着大家一起配置一个钉钉&#xff08;机器人&#xff09;即时消息通知 首先登录钉钉的开放平台&#xff1a;开发者后台统一登录 - 钉钉统一身份认证 1.创建一个机器人&…...

STP生成树协议详解

一、STP作用 如果链路断开或节点故障&#xff0c;那么互联的设备就无法正常通信了&#xff0c;这类网络问题叫做单点故障。没有备份的链路或节点&#xff0c;出现故障会直接断网。如果要提供 724 小时不间断的服务&#xff0c;那就需要在网络中提前部署冗余。避免出现单点故障…...

CentOS 6/7/8 操作系统镜像下载

CentOS Mirrors List ​编辑 DownloadAbout About CentOS Frequently Asked Questions (FAQs) Special Interest Groups (SIGs) CentOS Variants Governance Community Contribute Forums Mailing Lists IRC Calendar & IRC Meeting List Planet Submit a Bug Stories Doc…...

【研报339】物流无人化研究报告:从测试到规模化的产业演进

本报告提供限时下载&#xff0c;请查看文后提示以下仅为报告部分内容&#xff1a;摘要&#xff1a;无人配送车正从技术验证迈向规模化落地&#xff0c;技术迭代、政策放开、成本下行成为核心驱动力。本文系统梳理产业逻辑&#xff1a;技术上BEV感知等架构升级&#xff0c;提升车…...

采用预训练模型(如ResNet)进行,实现24类花卉的高精度分类 PyTorch训练花卉分类数据集24类 使用花卉数据集进行图像分类

采用预训练模型&#xff08;如ResNet&#xff09;进行&#xff0c;实现24类花卉的高精度分类 PyTorch训练花卉分类数据集24类 使用花卉数据集进行图像分类 以下文字及代码仅供参考学习使用。 文章目录&#x1f4e6; 1. 环境准备&#x1f4c1; 2. 数据集结构要求&#x1f9f9; …...

Avey-B架构:无注意力机制的高效双向编码器解析

1. Avey-B&#xff1a;无注意力机制的双向编码器架构解析在自然语言处理领域&#xff0c;Transformer架构长期占据主导地位&#xff0c;但其核心的注意力机制存在明显的计算效率瓶颈。传统自注意力机制的计算复杂度随序列长度呈二次方增长&#xff0c;在处理长文本时面临严重的…...

【智能体漫游】选错框架等于白干一年?2026 AI开发者的选型生存指南

开篇语:你以为AI应用开发最大的难题是调参?Too young too simple。最让架构师夜不能寐的,是凌晨三点对着五六个框架发呆——“我到底该用LangGraph还是CrewAI?要不要上Multi-Agent?” 一、别再靠玄学选型了:每个架构师都应该有自己的"照妖镜" 作为一个在AI老兵…...

Z-Image-Turbo-辉夜巫女镜像免配置:预装Xinference+Gradio+LoRA权重,开箱即用

Z-Image-Turbo-辉夜巫女镜像免配置&#xff1a;预装XinferenceGradioLoRA权重&#xff0c;开箱即用 1. 镜像简介 Z-Image-Turbo-辉夜巫女是一款基于Z-Image-Turbo模型的LoRA版本镜像&#xff0c;专门用于生成辉夜巫女风格的高质量图片。这个镜像最大的特点是开箱即用&#xf…...

MusicDownload:你的个人音乐库自由之路,三步开启免费音乐收藏新体验

MusicDownload&#xff1a;你的个人音乐库自由之路&#xff0c;三步开启免费音乐收藏新体验 【免费下载链接】MusicDownload 歌曲下载 项目地址: https://gitcode.com/gh_mirrors/mu/MusicDownload 还在为喜欢的音乐无法离线收听而烦恼吗&#xff1f;你是否曾想过建立一…...

DynamicVerse框架:4D动态场景重建与语义理解技术解析

1. DynamicVerse框架概述DynamicVerse是一个革命性的4D动态场景生成与理解框架&#xff0c;它通过融合多视角几何、计算机视觉和自然语言处理技术&#xff0c;实现了对真实世界动态场景的高精度建模与语义理解。这个框架的核心创新在于将传统的三维重建技术扩展到四维时空领域&…...

WSC混合并行计算架构与TCME通信优化解析

1. WSC混合并行计算架构解析晶圆级计算(Wafer-Scale Computing, WSC)是当前分布式训练的前沿架构&#xff0c;其核心特征是将数百个计算单元集成在单一晶圆上。与传统GPU集群相比&#xff0c;WSC具有两个显著优势&#xff1a;首先&#xff0c;die-to-die互连带宽可达4TB/s&…...

深度测评2026年家政小程序推荐榜单:解决生活难题的前3款高口碑产品

家政小程序作为2026年数字生活服务的重要组成部分&#xff0c;正通过技术革新与模式优化深度融入用户的日常家务场景。本次深度解析聚焦于行业前三强的核心方案&#xff0c;从服务架构、操作效率到口碑数据展开横向比对&#xff0c;为家庭及个人用户提供选型参考。领先的家政小…...

多语言预训练模型的高效迁移与适配技术解析

1. 项目概述这个研究课题直指当前NLP领域最前沿也最实用的方向——如何让预训练语言模型在不同语言间实现高效迁移和适配。我在过去三年参与过多个跨国企业的多语言NLP项目&#xff0c;深刻体会到传统单语模型在跨语言场景中的局限性。比如去年为某跨境电商平台搭建客服系统时&…...