当前位置: 首页 > news >正文

pdf内容三张以上转图片,使用spire.pdf.free

一、依赖

   <spire.pdf.free.version>9.13.0</spire.pdf.free.version><itextpdf.version>5.5.13</itextpdf.version><dependency><groupId>e-iceblue</groupId><artifactId>spire.pdf.free</artifactId><version>${spire.pdf.free.version}</version></dependency><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>${itextpdf.version}</version></dependency>

二、思路:

①问题:

1、spire.pdf.free只能免费转换每个PDF的前三页

2、转换速度慢

3、多线程合并后页数顺序问题

②解决

1、将PDF文档根据页数截断为多个PDF,每个PDF最多三页

2、使用线程池多线程异步处理

3、map里的索引

三、代码:

1、 转换的类

package com.shiqiao.nev.business.infra.adapter.pdftoPic;import com.itextpdf.text.Document;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.pdf.PdfCopy;
import com.itextpdf.text.pdf.PdfImportedPage;
import com.itextpdf.text.pdf.PdfReader;
import com.spire.pdf.PdfDocument;
import com.spire.pdf.graphics.PdfImageType;import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Future;public class PdfToPicConverter {private final byte[] pdfFileByteStream;private final Integer pageCount;private List<InputStream> picResult;public PdfToPicConverter(InputStream pdfFile) {try {pdfFileByteStream = inputStreamToByteArray(pdfFile);} catch (Exception e) {throw new RuntimeException("pdf文件转换为字节流失败", e);}PdfDocument pdf = new PdfDocument();pdf.loadFromStream(new ByteArrayInputStream(pdfFileByteStream));pageCount = pdf.getPages().getCount();}public PdfToPicConverter(byte[] pdfFile) {pdfFileByteStream = pdfFile;PdfDocument pdf = new PdfDocument();pdf.loadFromStream(new ByteArrayInputStream(pdfFileByteStream));pageCount = pdf.getPages().getCount();}public List<InputStream> convertToPictures(ExecutorService executorService) {picResult = new ArrayList<>();// 每三页为一组int groupSize = 3;int numGroups = (pageCount + groupSize - 1) / groupSize;List<Future<List<InputStream>>> futures = new ArrayList<>();for (int i = 0; i < numGroups; i++) {int startPage = i * groupSize;int endPage = Math.min(startPage + groupSize, pageCount);if (executorService != null) {futures.add(executorService.submit(() -> convertGroup(startPage, endPage)));}}// 等待所有任务完成并合并结果for (Future<List<InputStream>> future : futures) {try {picResult.addAll(future.get());} catch (Exception e) {throw new RuntimeException("图片转换失败", e);}}return picResult;}private InputStream splitPDFFile(byte[] pdfFileByteStream, int from, int end) {Document document = null;PdfCopy copy = null;try (ByteArrayInputStream bais = new ByteArrayInputStream(pdfFileByteStream);ByteArrayOutputStream baos = new ByteArrayOutputStream()) {PdfReader reader = new PdfReader(bais);int n = reader.getNumberOfPages();if (end == 0 || end > n) {end = n;}document = new Document(reader.getPageSize(1));copy = new PdfCopy(document, baos);document.open();for (int j = from + 1; j <= end; j++) {  // 注意这里j从from+1开始document.newPage();PdfImportedPage page = copy.getImportedPage(reader, j);copy.addPage(page);}document.close();return new ByteArrayInputStream(baos.toByteArray());} catch (IOException | DocumentException e) {throw new RuntimeException("PDF文件拆分失败", e);}}private List<InputStream> convertGroup(int startPage, int endPage) {InputStream inputStream = splitPDFFile(pdfFileByteStream, startPage, endPage);PdfDocument pdf = new PdfDocument();pdf.loadFromStream(inputStream);int end = endPage - startPage;List<InputStream> groupResult = new ArrayList<>();for (int i = 0; i < end; i++) {BufferedImage image = pdf.saveAsImage(i, PdfImageType.Bitmap, 500, 500);try (ByteArrayOutputStream baos = new ByteArrayOutputStream()) {ImageIO.write(image, "PNG", baos);groupResult.add(new ByteArrayInputStream(baos.toByteArray()));} catch (IOException e) {throw new RuntimeException("图片保存失败", e);}}pdf.close();return groupResult;return new ArrayList<>();}protected byte[] inputStreamToByteArray(InputStream inputStream) throws IOException {int bufferSize = 4096;byte[] buffer = new byte[bufferSize];int bytesRead;ByteArrayOutputStream baos = new ByteArrayOutputStream();while ((bytesRead = inputStream.read(buffer)) != -1) {baos.write(buffer, 0, bytesRead);}return baos.toByteArray();}
}

2、使用的地方

  public List<FileDTO> pdfToPng(byte[] filebyte, String fileName) {List<FileDTO> fileDTOS = new ArrayList<>();PdfToPicConverter pdfToPicConverter = new PdfToPicConverter(filebyte);List<InputStream> inputStreams = pdfToPicConverter.convertToPictures(pdfCovertPicExectorPool);inputStreams.forEach((e) -> {// 生成文件名String pgnNames = "fileName"+inputStreams.indexOf(e) + ".png";FileDTO fileDTO = new FileDTO(e, pgnNames);fileDTOS.add(fileDTO);});return fileDTOS;}

四、spire.pdf.free 的下载:maven仓库里进去然后点官网就能下jar包了

相关文章:

pdf内容三张以上转图片,使用spire.pdf.free

一、依赖 <spire.pdf.free.version>9.13.0</spire.pdf.free.version><itextpdf.version>5.5.13</itextpdf.version><dependency><groupId>e-iceblue</groupId><artifactId>spire.pdf.free</artifactId><version>$…...

游戏、软件、开源项目和资讯

游戏 标题链接【白嫖正版游戏】IT之家喜加一website 软件 标题链接【白嫖正版软件】反斗限免website 开源项目 标题链接【Luxirty Search】基于Google搜索结果&#xff0c;屏蔽内容农场Github【Video2X】图片/视频超分工具Github 新闻资讯 标题链接分享10个 Claude 3.5 …...

Acrel-1000变电站综合自动化系统及微机在化工企业中的应用方案

文&#xff1a;安科瑞郑桐 摘要&#xff1a;大型化工企业供配电具有的集约型特点&#xff0c;化工企业内35kV变电站和10kV变电所数量大、分布广&#xff0c;对于老的大多大型及中型化工企业而言&#xff0c;其变电站或变电所内高压电气设备为旧式继电保护装置&#xff0c;可靠…...

[Linux] CentOS7替换yum源为阿里云并安装gcc详细过程(附下载链接)

前言 CentOS7替换yum源为阿里云 yum是CentOS中的一种软件管理器&#xff0c;通过yum安装软件&#xff0c;可以自动解决包依赖的问题&#xff0c;免去手工安装依赖包的麻烦。 yum使用了一个中心仓库来记录和管理软件的依赖关系&#xff0c;默认为mirrorlist.centos.org&#xf…...

在Java中创建多线程的三种方式

多线程的创建和启动方式 在Java中&#xff0c;创建多线程主要有以下三种方式&#xff1a; 继承Thread类实现Runnable接口使用Callable接口与Future 下面是这三种方式的简单示例&#xff0c;以及如何在主类中启动它们。 1. 继承Thread类 class MyThread extends Thread {Ov…...

洛谷 AT_abc374_c [ABC374C] Separated Lunch 题解

题目大意 KEYENCE 总部有 N N N 个部门&#xff0c;第 i i i 个部门有 K i K_i Ki​ 个人。 现在要把所有部门分为 AB 两组&#xff0c;求这两组中人数多的那一组的人数最少为多少。 题目分析 设这些部门共有 x x x 个人&#xff0c;则较多的组的人数肯定大于等于 ⌈ …...

力扣2528.最大化城市的最小电量

力扣2528.最大化城市的最小电量 题目解析及思路 题目要求找到所有城市电量最小值的最大 电量为给城市供电的发电站数量 因此每座城市的电量可以用一段区间和表示&#xff0c;即前缀和 二分最低电量时 如果当前城市电量不够,贪心的想发电站建立的位置&#xff0c;应该是在mi…...

【zookeeper】集群配置

zookeeper 数据结构 zookeeper数据模型结构&#xff0c;就和Linux的文件系统类型&#xff0c;看起来是一颗树&#xff0c;每个节点称为一个znode.每一个Znode默认的存储1MB的数据&#xff0c;每个Znode都有唯一标识&#xff0c;可以通过命令显示节点的信息每当节点有数据变化…...

YOLO11 目标检测 | 导出ONNX模型 | ONNX模型推理

本文分享YOLO11中&#xff0c;从xxx.pt权重文件转为.onnx文件&#xff0c;然后使用.onnx文件&#xff0c;进行目标检测任务的模型推理。 用ONNX模型推理&#xff0c;便于算法到开发板或芯片的部署。 备注&#xff1a;本文是使用Python&#xff0c;编写ONNX模型推理代码的 目…...

PostgreSQL DBA月度检查列表

为了确保数据库系统能够稳定高效运行&#xff0c;DBA 需要定期对数据库进行检查和维护&#xff0c;这是一项非常具有挑战性的工作。 本文给大家推荐一个 PostgreSQL DBA 月度性能检查列表&#xff0c;遵循以下指导原则可以帮助我们实现一个高可用、高性能、低成本、可扩展的数…...

驱动开发系列12 - Linux 编译内核模块的Makefile解释

一:内核模块Makefile #这一行定义了要编译的内核模块目标文件。obj-m表示目标模块对象文件(.o文件), #并指定了两个模块源文件:helloworld-params.c 和 helloworld.c。最终会生成这 #这两个.c文件的.o对象文件。 obj-m := helloworld-params.o helloworld.o#这行定义了内核…...

用js+css实现圆环型的进度条——js+css基础积累

如果用jscss实现圆环型的进度条&#xff1a; 直接上代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><met…...

TDengine 与北微传感达成合作,解决传统数据库性能瓶颈

在当今物联网&#xff08;IoT&#xff09;快速发展的背景下&#xff0c;传感器技术已成为各个行业数字化转型的关键组成部分。随着设备数量的激增和数据生成速度的加快&#xff0c;如何高效地管理和分析这些数据&#xff0c;成为企业实现智能化运营的重要挑战。尤其是在惯性传感…...

通过Python爬虫获取商品销量数据,轻松掌握市场动态

为什么选择Python爬虫&#xff1f; 简洁易用&#xff1a;Python语言具有简洁的语法和丰富的库&#xff0c;使得编写爬虫变得简单高效。强大的库支持&#xff1a;Python拥有强大的爬虫框架&#xff08;如Scrapy、BeautifulSoup、Requests等&#xff09;&#xff0c;可以快速实现…...

学习虚幻C++开发日志——TSet

TSet 官方文档&#xff1a;虚幻引擎中的Set容器 | 虚幻引擎 5.5 文档 | Epic Developer Community (epicgames.com) TSet 是通过对元素求值的可覆盖函数&#xff0c;使用数据值本身作为键&#xff0c;而不是将数据值与独立的键相关联。 默认情况下&#xff0c;TSet 不支持重…...

面向对象进阶(下)(JAVA笔记第二十二期)

p.s.这是萌新自己自学总结的笔记&#xff0c;如果想学习得更透彻的话还是请去看大佬的讲解 目录 抽象方法和抽象类抽象方法定义格式抽象类定义格式抽象方法和抽象类注意事项 接口接口的定义接口中成员变量的特点接口中没有构造方法接口中成员方法的特点在接口中定义具有方法体…...

通信协议——UART

目录 基础概念串行&并行串行的优缺点 单工&双工 UART基本概念时序图思考&#xff1a;接收方如何确定01和0011 基础概念 串行&并行 串行为8车道&#xff0c;并行为1车道 串行的优缺点 通行速度快浪费资源布线复杂线与线之间存在干扰 单工&双工 单工&#xf…...

最优阵列处理技术(七)-谱加权

阵列的加权技术等价于时间序列谱分析中的加窗或锐化技术。在加权过程中,需要考虑的是如何降低旁瓣并使主波束宽度的增长最小。 首先需要明确的是,在 u u u空间下的波束方向图为 B u ( u ) =...

Java | Leetcode Java题解之第486题预测赢家

题目&#xff1a; 题解&#xff1a; class Solution {public boolean PredictTheWinner(int[] nums) {int length nums.length;int[] dp new int[length];for (int i 0; i < length; i) {dp[i] nums[i];}for (int i length - 2; i > 0; i--) {for (int j i 1; j …...

leetcode动态规划(十五)-完全背包

题目 leetcode上没有纯完全背包题目&#xff0c;可以看卡码网上的题目 完全背包 思路 有N件物品和一个最多能背重量为W的背包。第i件物品的重量是weight[i]&#xff0c;得到的价值是value[i] 。每件物品都有无限个&#xff08;也就是可以放入背包多次&#xff09;&#xff…...

腾讯混元翻译模型实战:跨境电商多语言商品描述生成案例

腾讯混元翻译模型实战&#xff1a;跨境电商多语言商品描述生成案例 1. 项目背景与价值 跨境电商企业面临一个共同挑战&#xff1a;如何高效地将商品信息翻译成多种语言。传统人工翻译成本高、周期长&#xff0c;而通用翻译工具又难以满足电商场景的专业需求。 腾讯混元翻译模…...

深度学习模型压缩:从原理到实践

深度学习模型压缩&#xff1a;从原理到实践 1. 背景与动机 深度学习模型在各种任务上取得了显著的性能提升&#xff0c;但随之而来的是模型规模的不断增长。大型模型虽然性能优异&#xff0c;但也带来了以下问题&#xff1a; 存储需求大&#xff1a;大型模型需要大量存储空间&a…...

PostgreSQL 模式级权限迁移:一键批量修改所有表与对象的所有者

1. 为什么需要批量修改PostgreSQL对象所有者&#xff1f; 在实际的数据库运维工作中&#xff0c;经常会遇到需要批量修改数据库对象所有者的情况。我遇到过不少这样的场景&#xff1a;公司部门重组后&#xff0c;原先由开发团队A负责的项目转交给团队B维护&#xff1b;或者某个…...

2026年鱼生专用花生油:哪些品牌值得选?

大家好&#xff0c;今天咱们聊聊一个很有趣的话题——鱼生专用花生油。说到鱼生&#xff0c;大家可能会想到广东、广西地区的美食&#xff0c;尤其是那一道道色香味俱全的鱼生&#xff0c;简直让人垂涎欲滴。但是&#xff0c;鱼生的美味离不开优质的食用油&#xff0c;尤其是花…...

避坑指南:C# ComboBox那些容易踩的坑(SelectedIndexChanged的诡异事件)

C# ComboBox开发避坑实战&#xff1a;SelectedIndexChanged的7个隐秘陷阱与解决方案 下拉框控件ComboBox看似简单&#xff0c;却暗藏诸多让开发者抓狂的"坑"。我曾在一个仓储管理系统中&#xff0c;因为ComboBox的异常行为连续加班三晚——数据绑定时的SelectedInde…...

CLIP-GmP-ViT-L-14图文匹配工具实战:新闻配图与标题语义一致性自动检测

CLIP-GmP-ViT-L-14图文匹配工具实战&#xff1a;新闻配图与标题语义一致性自动检测 你有没有遇到过这种情况&#xff1f;看到一篇新闻&#xff0c;标题写得挺吸引人&#xff0c;但配图却让人摸不着头脑——标题说“科技创新”&#xff0c;配图却是风景照&#xff1b;标题讲“经…...

YOLOv11涨点改进| 全网独家创新、检测头Head改进篇| CVPR 2026顶会 |使用FAAHead改进YOLOv11的检测头,处理小目标、遮挡小目标检测、旋转目标检测有效涨点,助力高效发论文

一、本文介绍 🔥本文给大家介绍使用CVPR 2026顶会 FAAHead 和 OBB_FAAHead 改进 YOLOv11的检测头,可以有效缓解目标检测中分类分支与框回归分支之间的特征冲突问题,尤其适合旋转目标检测或含明显方向信息的目标检测任务。FAAHead 的核心思想是在检测头阶段先对 RoI 或候选…...

工厂里EtherCAT从站模块坏了别慌!手把手教你用Startup list和CoE-online快速换新(附配置顺序避坑指南)

工厂EtherCAT从站模块更换实战指南&#xff1a;Startup list与CoE-online的高效应用 当生产线上的EtherCAT从站模块突然罢工&#xff0c;设备维护工程师往往面临两难选择&#xff1a;是临时在线修改参数快速恢复生产&#xff0c;还是彻底解决"即插即用"的配置难题&am…...

OpenClaw语音交互扩展:百川2-13B+Whisper实现语音指令控制

OpenClaw语音交互扩展&#xff1a;百川2-13BWhisper实现语音指令控制 1. 为什么需要语音交互能力 去年冬天的一个深夜&#xff0c;我正在调试OpenClaw的自动化脚本&#xff0c;双手因为长时间敲键盘已经有些僵硬。突然想到&#xff1a;如果能让AI听懂我的语音指令直接执行任务…...

如何突破数据标注瓶颈?Label Studio全攻略:从多模态标注到AI协作

如何突破数据标注瓶颈&#xff1f;Label Studio全攻略&#xff1a;从多模态标注到AI协作 【免费下载链接】label-studio Label Studio is a multi-type data labeling and annotation tool with standardized output format 项目地址: https://gitcode.com/GitHub_Trending/l…...