SpringBoot使用poi将word转换为PDF并且展示
1.前言
由于最近做了一个需求,界面上有一个按钮,点击按钮后将一个文件夹中的word文档显示在页面中,并且有一个下拉框可以选择不同的文档,选择文档可以显示该文档。这里我选择使用fr.opensagres.poi.xwpf.converter.pdf-gae
依赖包来实现。
2.依赖
这里我只依赖了这些依赖包
<dependency><groupId>fr.opensagres.xdocreport</groupId><artifactId>fr.opensagres.poi.xwpf.converter.pdf-gae</artifactId><version>2.0.1</version></dependency><!-- Apache PDFBox 依赖用于.docx转PDF --><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>3.0.0</version> <!-- 根据最新版本调整 --></dependency>
3.代码
Java代码部分,这里我使用了两个文件夹中的文档
package com.hxgis.controller;import java.io.File;
import java.io.FileInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.Arrays;
import java.util.Collections;
import java.util.Comparator;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.stream.Collectors;import fr.opensagres.poi.xwpf.converter.pdf.PdfConverter;
import fr.opensagres.poi.xwpf.converter.pdf.PdfOptions;
import org.springframework.core.io.ByteArrayResource;
import org.springframework.core.io.Resource;
import org.springframework.http.ResponseEntity;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
//import org.apache.poi.xwpf.converter.pdf.PdfOptions;
//import org.apache.poi.xwpf.converter.pdf.PdfConverter;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;/*** ClassName: DocumentController* Package: com.hxgis.controller* Description:** @Author dhn* @Create 2024/1/31 11:56* @Version 1.0*/
@RestController
@RequestMapping("/api/document")
public class DocumentController {private final String MONTH_PATH = "D:/ftp_data/month"; // 修改为你的文档存储路径private final String QUARTER_PATH = "D:/ftp_data/quarter"; // 修改为你的文档存储路径// private final String MONTH_PATH = "/home/geli/hbnyWeatherReport/month"; // 修改为你的文档存储路径
// private final String QUARTER_PATH = "/home/geli/hbnyWeatherReport/quarter"; // 修改为你的文档存储路径@GetMapping("/monthLatest")public ResponseEntity<Resource> getDocument(@RequestParam(required = false) String name) throws IOException {File folder = new File(MONTH_PATH);File[] files = folder.listFiles((dir, filename) -> filename.endsWith(".docx"));if (files == null || files.length == 0) {return ResponseEntity.notFound().build();}File fileToConvert;if (name != null && !name.isEmpty()) {// 用户选择了特定的文件fileToConvert = Arrays.stream(files).filter(file -> file.getName().equals(name)).findFirst().orElse(null);} else {// 没有特定选择,找最新的文件Pattern pattern = Pattern.compile("(\\d{4})年(\\d{2})月风光资源趋势预测\\.docx");fileToConvert = Arrays.stream(files).filter(file -> pattern.matcher(file.getName()).matches()).max(Comparator.comparingInt(file -> {Matcher matcher = pattern.matcher(file.getName());if (matcher.find()) {int year = Integer.parseInt(matcher.group(1));int month = Integer.parseInt(matcher.group(2));return year * 100 + month;}return 0;})).orElse(null);}if (fileToConvert == null) {return ResponseEntity.notFound().build();}// 以下为文件转换为PDF的代码try (XWPFDocument document = new XWPFDocument(new FileInputStream(fileToConvert));ByteArrayOutputStream out = new ByteArrayOutputStream()) {PdfOptions options = PdfOptions.create();PdfConverter.getInstance().convert(document, out, options);byte[] pdfContent = out.toByteArray();ByteArrayResource resource = new ByteArrayResource(pdfContent);return ResponseEntity.ok().contentLength(pdfContent.length).header("Content-type", "application/pdf").body(resource);}}@GetMapping("/quarterLatest")public ResponseEntity<Resource> quarterLatest(@RequestParam(required = false) String name) throws IOException {File folder = new File(QUARTER_PATH);File[] files = folder.listFiles((dir, filename) -> filename.endsWith(".docx"));if (files == null || files.length == 0) {return ResponseEntity.notFound().build();}File fileToConvert;if (name != null && !name.isEmpty()) {// 用户选择了特定的文件fileToConvert = Arrays.stream(files).filter(file -> file.getName().equals(name)).findFirst().orElse(null);} else {// 没有特定选择,找最新的文件Pattern pattern = Pattern.compile("(\\d{4})年(?:\\d{2})月-(\\d{4})年(?:\\d{2})月风光资源趋势预测\\.docx|" +"(\\d{4})年(?:\\d{2})-(\\d{2})月风光资源趋势预测\\.docx");fileToConvert = Arrays.stream(files).filter(file -> pattern.matcher(file.getName()).matches()).max(Comparator.comparingInt(file -> {Matcher matcher = pattern.matcher(file.getName());if (matcher.find()) {if (matcher.group(1) != null) {// 处理跨年文件名int yearStart = Integer.parseInt(matcher.group(1));int yearEnd = Integer.parseInt(matcher.group(2));return yearEnd * 100 + (matcher.group(4) != null ? Integer.parseInt(matcher.group(4)) : 0);} else if (matcher.group(3) != null) {// 处理同一年文件名int year = Integer.parseInt(matcher.group(3));int monthEnd = Integer.parseInt(matcher.group(4));return year * 100 + monthEnd;}}return 0;})).orElse(null);}if (fileToConvert == null) {return ResponseEntity.notFound().build();}// 文件转换为PDF的代码try (XWPFDocument document = new XWPFDocument(new FileInputStream(fileToConvert));ByteArrayOutputStream out = new ByteArrayOutputStream()) {PdfOptions options = PdfOptions.create();PdfConverter.getInstance().convert(document, out, options);byte[] pdfContent = out.toByteArray();ByteArrayResource resource = new ByteArrayResource(pdfContent);return ResponseEntity.ok().contentLength(pdfContent.length).header("Content-type", "application/pdf").body(resource);}}@GetMapping("/monthList")public List<String> listAllDocs() {File folder = new File(MONTH_PATH);// 修改为获取.docx文件File[] files = folder.listFiles((dir, name) -> name.endsWith(".docx"));if (files == null) {return Collections.emptyList();}// 返回文件名列表return Arrays.stream(files).map(File::getName).collect(Collectors.toList());}@GetMapping("/quarterList")public List<String> quarterList() {File folder = new File(QUARTER_PATH);// 修改为获取.docx文件File[] files = folder.listFiles((dir, name) -> name.endsWith(".docx"));if (files == null) {return Collections.emptyList();}// 返回文件名列表return Arrays.stream(files).map(File::getName).collect(Collectors.toList());}}
前端代码html代码,使用两个按钮,点击后弹出模态框,在模态框中有iframe来展示pdf:
<!-- 模态框(Modal) -->
<div class="modal fade" id="pdfModalMonth" tabindex="-1" role="dialog" aria-labelledby="pdfModalLabelMonth" aria-hidden="true"><div class="modal-dialog" style="max-width: 90%; width: auto;"><div class="modal-content"><div class="modal-header"><h4 class="modal-title" id="pdfModalLabelMonth">月度预测文档</h4><button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button></div><div class="modal-body"><!-- 下拉框用于选择文档 --><select id="MonthList" class="form-control"><option value="">请选择文档</option><!-- 文档列表将在这里填充 --></select><iframe id="MonthViewer" style="width:100%; height:700px;"></iframe> <!-- 可以根据需要调整高度 --></div><div class="modal-footer"><button type="button" class="btn btn-default" data-dismiss="modal">关闭</button></div></div></div>
</div><div class="modal fade" id="pdfModalQuarter" tabindex="-1" role="dialog" aria-labelledby="pdfModalLabelQuarter" aria-hidden="true"><div class="modal-dialog" style="max-width: 90%; width: auto;"><div class="modal-content"><div class="modal-header"><h4 class="modal-title" id="pdfModalLabelQuarter">月度预测文档</h4><button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button></div><div class="modal-body"><!-- 下拉框用于选择文档 --><select id="QuarterList" class="form-control"><option value="">请选择文档</option><!-- 文档列表将在这里填充 --></select><iframe id="QuarterViewer" style="width:100%; height:700px;"></iframe> <!-- 可以根据需要调整高度 --></div><div class="modal-footer"><button type="button" class="btn btn-default" data-dismiss="modal">关闭</button></div></div></div>
</div>
<a class="btn btn-sm btn-primary" id="loadMonth" style="text-decoration: none;color: #ffffff">月度预测</a><a class="btn btn-sm btn-primary" id="loadQuarter" style="text-decoration: none;color: #ffffff">季度预测</a>
js代码:
$(document).ready(function() {// 加载月度列表function loadMonthList() {$.get("/api/document/monthList", function(data) {// 清空现有的选项$("#MonthList").empty();$("#MonthList").append('<option value="">请选择文档</option>');// 假设文档名包含日期,例如 "2024年01月风光资源趋势预测.docx"// 对文档进行倒序排序data.sort(function(a, b) {// 转换为日期格式进行比较var dateA = new Date(a.split('年')[0], a.split('年')[1].split('月')[0] - 1);var dateB = new Date(b.split('年')[0], b.split('年')[1].split('月')[0] - 1);return dateB - dateA; // 从新到旧排序});// 添加新的选项data.forEach(function(doc) {$("#MonthList").append('<option value="' + doc + '">' + doc + '</option>');});});}// 当点击加载最新文档的按钮时$("#loadMonth").click(function() {loadMonthList(); // 调用函数加载文档列表// 加载最新的PDF文档$("#MonthViewer").attr("src", "/api/document/monthLatest");// 显示模态框$("#pdfModalMonth").modal("show");});// 当选择不同的文档时$("#MonthList").change(function() {var selectedFile = $(this).val();if(selectedFile) {$("#MonthViewer").attr("src", "/api/document/monthLatest?name=" + encodeURIComponent(selectedFile));}});// 加载季度列表function parseDateFromDocName(docName) {var year, month;var parts = docName.match(/(\d{4})年(\d{2})-(\d{2})月|(\d{4})年(\d{2})月-(\d{4})年(\d{2})月/);if (parts) {if (parts[1]) {// 格式是 "YYYY年MM-DD月"year = parseInt(parts[1], 10);month = parseInt(parts[2], 10); // 使用开始月份} else {// 格式是 "YYYY年MM月-YYYY年MM月"year = parseInt(parts[4], 10);month = parseInt(parts[5], 10); // 使用开始月份}}return new Date(year, month - 1); // JavaScript中的月份是从0开始的}function loadQuarterList() {$.get("/api/document/quarterList", function(data) {// 清空现有的选项$("#QuarterList").empty();$("#QuarterList").append('<option value="">请选择文档</option>');// 对文档进行倒序排序data.sort(function(a, b) {var dateA = parseDateFromDocName(a);var dateB = parseDateFromDocName(b);return dateB - dateA; // 从新到旧排序});// 添加新的选项data.forEach(function(doc) {$("#QuarterList").append('<option value="' + doc + '">' + doc + '</option>');});});}// 当点击加载最新文档的按钮时$("#loadQuarter").click(function() {loadQuarterList(); // 调用函数加载文档列表// 加载最新的PDF文档$("#QuarterViewer").attr("src", "/api/document/quarterLatest");// 显示模态框$("#pdfModalQuarter").modal("show");});// 当选择不同的文档时$("#QuarterList").change(function() {var selectedFile = $(this).val();if(selectedFile) {$("#QuarterViewer").attr("src", "/api/document/quarterLatest?name=" + encodeURIComponent(selectedFile));}});
});
4.遇到的问题
做完一切后,发现有些文档中的标题的中文没有显示出来,我就对比显示的文档和没显示的文档,发现是因为字体的原因,宋体是可以显示出来的,但是宋体(中文)显示不出来。把宋体(中文)改成宋体就可以显示。
但是这只是我windows系统上运行是没问题的,我把项目部署到服务器(centos)后,发现中文一点都展示不出来,这时候我就很纳闷,为什么在windows上能显示出来,linux上显示不出来,经过查阅资料,我发现是由于Linux上缺乏一些中文字体,例如宋体、仿宋等,这些字体是我文档中用到的字体,所以下一步我要将windows中的字体放在服务器上。
5.在Linux中安装宋体
在Linux系统中安装宋体(SimSun)字体,需要手动下载字体文件或从Windows系统中复制字体文件,然后将其安装到Linux系统中。宋体不包含在开源字体包中,因为它是微软的商业字体。下面是一般步骤:
- 从Windows复制:如果你有访问Windows系统的权限,可以从C:\Windows\Fonts目录找到simsun.ttc(宋体)和其他中文字体文件,并将其复制到你的Linux系统中。
- 在Linux系统上安装字体一般有以下几个步骤:
- 创建字体目录(如果尚不存在)
sudo mkdir -p /usr/share/fonts/chinese
- 将字体文件复制到创建的目录中,假设你已经将simsun.ttc字体文件复制到了Linux系统的某个位置(例如~/Downloads),运行以下命令将其移动到字体目录:
sudo cp ~/Downloads/simsun.ttc /usr/share/fonts/chinese/
- 更新字体缓存,安装完字体后,需要更新字体缓存,以便系统识别新安装的字体:
sudo fc-cache -fv
- 安装后,你可以使用fc-list命令确认字体是否已正确安装:
fc-list | grep "simsun"
至此,大功告成!
相关文章:
SpringBoot使用poi将word转换为PDF并且展示
1.前言 由于最近做了一个需求,界面上有一个按钮,点击按钮后将一个文件夹中的word文档显示在页面中,并且有一个下拉框可以选择不同的文档,选择文档可以显示该文档。这里我选择使用fr.opensagres.poi.xwpf.converter.pdf-gae依赖包…...

Java多线程--线程间的通信
文章目录 一、线程间的通信(1)为什么要处理线程间的通信(2)等待唤醒机制 二、案例(1)案例1、创建线程2、解决线程安全问题3、等待4、唤醒5、同步监视器 (2)调用wait和notify需注意的…...
vue + element 页面滚动计算百分比 + 节流函数
html: <el-progress :percentage"scrollValue"></el-progress> js: data() {return {scrollValue: 0,} }, mounted() {window.addEventListener(scroll, this.handleScroll) // 监听页面滚动 }, beforeDestroy() {window.remov…...

【笔记】React Native实战练习(仿网易云游戏网页移动端)
/** * 如果系统看一遍RN相关官方文档,可能很快就忘记了。一味看文档也很枯燥无味, * 于是大概看了关键文档后,想着直接开发一个Demo出来,边学边写,对往后工作 * 开发衔接上能够更顺。这期间肯定会遇到各种各样的问题&a…...

Android SystemUI 介绍
目录 一、什么是SystemUI 二、SystemUI应用源码 三、学习 SystemUI 的核心组件 四、修改状态与导航栏测试 本篇文章,主要科普的是Android SystemUI , 下一篇文章我们将介绍如何把Android SystemUI 应用转成Android Studio 工程项目。 一、什么是Syst…...

2024美赛数学建模A题思路分析 - 资源可用性和性别比例
1 赛题 问题A:资源可用性和性别比例 虽然一些动物物种存在于通常的雄性或雌性性别之外,但大多数物种实质上是雄性或雌性。虽然许多物种在出生时的性别比例为1:1,但其他物种的性别比例并不均匀。这被称为适应性性别比例的变化。例…...

2024年数学建模美赛C题(预测 Wordle)——思路、程序总结分享
1: 问题描述与要求 《纽约时报》要求您对本文件中的结果进行分析,以回答几个问题。 问题1:报告结果的数量每天都在变化。开发一个模型来解释这种变化,并使用您的模型为2023年3月1日报告的结果数量创建一个预测区间。这个词的任何属性是否会…...

TryHackMe-File Inclusion练习
本文相关的TryHackMe实验房间链接:TryHackMe | Why Subscribe 路径遍历(目录遍历) LocationDescription/etc/issue包含要在登录提示之前打印的消息或系统标识。/etc/profile控制系统范围的默认变量,例如导出(Export)变量、文件创…...
Leetcode 《面试经典150题》169. 多数元素
题目 给定一个大小为 n 的数组 nums ,返回其中的多数元素。多数元素是指在数组中出现次数 大于 ⌊ n/2 ⌋ 的元素。 你可以假设数组是非空的,并且给定的数组总是存在多数元素。 示例 1: 输入:nums [3,2,3] 输出:3示…...

百度输入法往选字框里强塞广告
关注卢松松,会经常给你分享一些我的经验和观点。 国内几乎100%的输入法都有广告,只是你们没发现而已!!! 百度输入法居然在输入法键盘上推送广告,近日,博主阑夕 表示,V2EX论坛上有…...
分享一个Qt使用的模块间通信类
需求: 不同线程,或者同一线程的不同类之间通信,按照Qt的机制,定义一个信号,一个槽,然后绑定。以两个类A,B为例,A触发一个信号,B执行一个槽,在定义好信号和槽之后&#x…...

工作七年,对消息推送使用的一些经验和总结
前言:不管是APP还是WEB端都离不开消息推送,尤其是APP端,push消息,小信箱消息;WEB端的代办消息等。因在项目中多次使用消息推送且也是很多项目必不可少的组成部分,故此总结下供自己参考。 一、什么是消息推…...

计网——应用层
应用层 应用层协议原理 网络应用的体系结构 客户-服务器(C/S)体系结构 对等体(P2P)体系结构 C/S和P2P体系结构的混合体 客户-服务器(C/S)体系结构 服务器 服务器是一台一直运行的主机,需…...

算法面试八股文『 基础知识篇 』
博客介绍 近期在准备算法面试,网上信息杂乱不规整,出于强迫症就自己整理了算法面试常出现的考题。独乐乐不如众乐乐,与其奖励自己,不如大家一起嗨。以下整理的内容可能有不足之处,欢迎大佬一起讨论。 PS:…...

docker-学习-4
docker学习第四天 docker学习第四天1. 回顾1.1. 容器的网络类型1.2. 容器的本质1.3. 数据的持久化1.4. 看有哪些卷1.5. 看卷的详细信息 2. 如何做多台宿主机里的多个容器之间的数据共享2.1. 概念2.2. 搭NFS服务器实现多个容器之间的数据共享的详细步骤2.3. 如果是多台机器&…...

el-upload子组件上传多张图片(上传为files或base64url)
场景: 在表单页,有图片需要上传,表单的操作行按钮中有上传按钮,点击上传按钮。 弹出el-dialog进行图片的上传,可以上传多张图片。 由于多个表单页都有上传多张图片的操作,因此将上传多图的el-upload定义…...
2024美赛数学建模C题思路源码——网球选手的动量
这题挺有意思,没具体看比赛情况,打过比赛的人应该都知道险胜局(第二局、第五局逆转局)最影响心态的,导致第3、5局输了 模型结果需要证明这样的现象 赛题目的 赛题目的:分析网球球员的表现 问题一.球员在比赛特定时间表现力 问题分析 excel数据:每个时间段有16场比赛,…...

金三银四_程序员怎么写简历_写简历网站
你们在制作简历时,是不是基本只关注两件事:简历模板,还有基本信息的填写。 当你再次坐下来更新你的简历时,可能会发现自己不自觉地选择了那个“看起来最好看的模板”,填写基本信息,却没有深入思考如何使简历更具吸引力。这其实是一个普遍现象:许多求职者仍停留在传统简历…...

echarts条形图添加滚动条
效果展示: 测试数据: taskList:[{majorDeptName:测试,finishCount:54,notFinishCount:21}, {majorDeptName:测试,finishCount:54,notFinishCount:21}, {majorDeptName:测试,finishCount:54,notFinishCount:21}, {majorDeptName:测试,finishCount:54,notFinishCount:21}, {maj…...
Java 使用Soap方式调用WebService接口
pom文件依赖 <dependencies><dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-databind</artifactId><version>2.13.0</version></dependency><!-- https://mvnrepository.com/artif…...

19c补丁后oracle属主变化,导致不能识别磁盘组
补丁后服务器重启,数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后,存在与用户组权限相关的问题。具体表现为,Oracle 实例的运行用户(oracle)和集…...
反向工程与模型迁移:打造未来商品详情API的可持续创新体系
在电商行业蓬勃发展的当下,商品详情API作为连接电商平台与开发者、商家及用户的关键纽带,其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息(如名称、价格、库存等)的获取与展示,已难以满足市场对个性化、智能…...

如何在看板中体现优先级变化
在看板中有效体现优先级变化的关键措施包括:采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中,设置任务排序规则尤其重要,因为它让看板视觉上直观地体…...
连锁超市冷库节能解决方案:如何实现超市降本增效
在连锁超市冷库运营中,高能耗、设备损耗快、人工管理低效等问题长期困扰企业。御控冷库节能解决方案通过智能控制化霜、按需化霜、实时监控、故障诊断、自动预警、远程控制开关六大核心技术,实现年省电费15%-60%,且不改动原有装备、安装快捷、…...
鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序
一、开发准备 环境搭建: 安装DevEco Studio 3.0或更高版本配置HarmonyOS SDK申请开发者账号 项目创建: File > New > Create Project > Application (选择"Empty Ability") 二、核心功能实现 1. 医院科室展示 /…...

select、poll、epoll 与 Reactor 模式
在高并发网络编程领域,高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表,以及基于它们实现的 Reactor 模式,为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。 一、I…...

Spring数据访问模块设计
前面我们已经完成了IoC和web模块的设计,聪明的码友立马就知道了,该到数据访问模块了,要不就这俩玩个6啊,查库势在必行,至此,它来了。 一、核心设计理念 1、痛点在哪 应用离不开数据(数据库、No…...
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南 在数字化营销时代,邮件列表效度、用户参与度和网站性能等指标往往决定着创业公司的增长成败。今天,我们将深入解析邮件打开率、网站可用性、页面参与时…...

html-<abbr> 缩写或首字母缩略词
定义与作用 <abbr> 标签用于表示缩写或首字母缩略词,它可以帮助用户更好地理解缩写的含义,尤其是对于那些不熟悉该缩写的用户。 title 属性的内容提供了缩写的详细说明。当用户将鼠标悬停在缩写上时,会显示一个提示框。 示例&#x…...
鸿蒙DevEco Studio HarmonyOS 5跑酷小游戏实现指南
1. 项目概述 本跑酷小游戏基于鸿蒙HarmonyOS 5开发,使用DevEco Studio作为开发工具,采用Java语言实现,包含角色控制、障碍物生成和分数计算系统。 2. 项目结构 /src/main/java/com/example/runner/├── MainAbilitySlice.java // 主界…...