Python也可以合并和拆分PDF,批量高效!
PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。
知乎上也有人问,如何对PDF进行合并和拆分?

看很多回答推荐了各种PDF编辑器或者网站,确实方法比较多。
但这种软件的弊端在于很难去批量操作,比如你有几百个PDF要合并,使用软件会非常麻烦。
而且很多软件是收费的,本来PDF合并拆分也不是什么难事,赚的是信息差的钱。
我一般会用Python的PyPDF2库来编辑PDF,其中就包括合并、拆分多个PDF。
使用Python来实现的好处是处理PDF速度快,可大批量操作,而且免费。
话不多说,下面给出案例代码:

该示例代码定义了两个函数 merge_pdf() 和 split_pdf(),分别用于合并和拆分 PDF。
这两个函数使用 PyPDF2 库读取 PDF 文件,然后使用 PdfFileMerger() 类创建一个合并后的 PDF 文件,或使用 getPage() 方法获取指定页码的页面,并将其添加到合并后的 PDF 文件中。
最后,使用 write() 方法将合并后的 PDF 文件写入磁盘。
在测试代码中,首先调用 merge_pdf() 函数将两个 PDF 文件合并,然后调用 split_pdf() 函数将合并后的 PDF 文件拆分为多个页面,并将这些页面保存到不同的文件中。
这个脚本需要安装 PyPDF2 库才能使用。可以使用 pip install PyPDF2 命令安装 PyPDF2 库。
相关文章:
Python也可以合并和拆分PDF,批量高效!
PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。 知乎上也有人问,如何对PDF进行合并和拆分? 看很多回答推荐了各种PDF编辑器或者网站,确实方法比较多。 …...
python笔记(14)迭代器和生成器
迭代器的优势 延迟计算:迭代器按需提供数据,无需一次性加载整个数据集到内存中,特别适合处理大规模或无限数据流。资源效率:减少内存占用,尤其在处理大量数据时,避免一次性构建完整数据结构带来的开销。统…...
简单3步,OpenHarmony上跑起ArkUI分布式小游戏
标准系统新增支持了方舟开发框架(ArkUI)、分布式组网和 FA 跨设备迁移能力等新特性,因此我们结合了这三种特性使用 ets 开发了一款如下动图所示传炸弹应用。 打开应用在通过邀请用户进行设备认证后,用户须根据提示完成相应操作&am…...
GPT-3和自然语言处理的前沿:思考AI大模型的发展
引言 自然语言处理(NLP)是人工智能(AI)领域中最富有挑战性和活跃的研究领域之一。近年来,随着深度学习技术的发展和计算能力的提高,大型语言模型,尤其是OpenAI的GPT-3,已成为推动该…...
傅里叶变换例题
目录 傅里叶转化例题: 时移 频移 尺度 时域卷积性质:卷积==乘机...
基于Docker构建CI/CD工具链(六)使用Apifox进行自动化测试
添加测试接口 在Spring Boot Demo项目里实现一个简单的用户管理系统的后端功能。具体需求如下: 实现了一个RESTful API,提供了以下两个接口 : POST请求 /users:用于创建新的用户。GET请求 /users:用于获取所有用户的列…...
Java 中建造者模式,请用代码具体举例
建造者模式是一种创建型设计模式,它允许你创建一个复杂对象的不同部分并将它们组装在一起,以产生最终的对象。以下是一个简单的 Java 示例,演示了建造者模式的用法: // 产品类 class Computer {private String cpu;private String…...
Tomcat 启动闪退问题解决方法
总体思路 解决Tomcat闪退问题,您可以尝试以下几种方法: 检查安装过程:确保您的Tomcat安装过程没有遗漏任何步骤。如果是zip包形式的Tomcat,解压后通常不需要额外配置环境变量。编辑启动脚本:打开Tomcat安装目录下的bi…...
使用docker部署数据可视化平台Metabase
目前公司没有人力开发数据可视化看板,因此考虑自己搭建开源可视化平台MetaBase。在此记录下部署过程~ 一、镜像下载 docker pull metabase/metabase:latest 运行结果如下: 二、创建容器 docker run -dit --name matebase -p 3000:3000\ -v /home/loc…...
数图智慧零售解决方案,赋能零售行业空间资源价值最大化
数图智慧零售解决方案 赋能零售行业空间资源价值最大 在激烈的市场竞争中,如何更好地提升空间资源价值,提高销售额,成为行业关注的焦点。近日,NIQ发布的《2024年中国饮料行业趋势与展望》称,“在传统零售业态店内&…...
Django中的实时通信:WebSockets与异步视图的结合【第167篇—实时通信】
👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 在现代Web应用程序中,实时通信已经成为了必不可少的功能之一。无论是在线聊天、…...
R 格式(蓝桥杯)
文章目录 R 格式【问题描述】解题思路高精度乘法高精度加法 R 格式 【问题描述】 小蓝最近在研究一种浮点数的表示方法:R 格式。对于一个大于 0 的浮点数 d,可以用 R 格式的整数来表示。给定一个转换参数 n,将浮点数转换为 R格式整数的做法…...
Intellij idea的快速配置详细使用
IntelliJ IDEA是一款强大的集成开发环境(IDE),支持多种编程语言,包括Java、Kotlin、Scala等。以下是关于IntelliJ IDEA的快速配置和使用的详细步骤: 一、安装 前往IntelliJ IDEA的官方网站或可靠的软件下载平台&…...
JavaEE:JVM
基本介绍 JVM:Java虚拟机,用于解释执行Java字节码 jdk:Java开发工具包 jre:Java运行时环境 C语言将写入的程序直接编译成二进制的机器语言,而java不想重新编译,希望能直接执行。Java先通过javac把.java…...
Linux基础|线程池Part.1|线程池的定义和运行逻辑
线程池的定义和运行逻辑 多线程的问题: 如果并发的线程数量很多,并且每个线程都是执行一个时间很短的任务就结束了,这样频繁创建线程就会大大降低系统的效率,因为频繁创建线程和销毁线程需要时间。 那么一个很自然的想法就出现了…...
蓝队面试经验总结
Sql注入 1、sql注入漏洞原理 开发者没有在网页传参点做好过滤,导致恶意 sql 语句拼接到数据库进行执行 2、sql注入分类 联合注入 、布尔盲注 、时间盲注 、堆叠注入 、宽字节注入 、报错注入 3、堆叠注入原理 在 mysql 中,分号 代表一个查询语句的…...
MySQL命令分类与大纲
一、数据库管理 创建与删除数据库 CREATE DATABASE:创建新数据库DROP DATABASE:删除已存在的数据库ALTER DATABASE:修改数据库属性 切换与查看数据库 USE:选择当前工作数据库SHOW DATABASES:列出所有可用数据库 二、…...
windows编译xlnt,获取Excel表里的数据
用git拉取项目 这个文件是空的 要用git拉下来,使用终端编译xlnt库 点击解决方案 运行生成 然后新建项目,配置好库, #include <iostream> #include <xlnt/xlnt.hpp>int main() {// 打开 Excel 文件xlnt::workbook workbook;workb…...
c#字段和属性的区别
在C#中,字段(fields)和属性(properties)都是类的成员,它们提供了类存储数据的方式,但它们在用途和功能上有着明显的区别。 字段 字段通常用来存储类或结构的状态信息。字段是类的数据成员&…...
微软正式发布Copilot for Security
微软公司近日宣布,其备受期待的安全自动化解决方案——Copilot for Security现已全面上市,面向全球用户开放。这一创新工具的推出标志着微软在提升企业安全防护能力方面迈出了重要一步,同时也为安全专业人士提供了强大的支持。 Copilot for …...
ARM PB11MPCore USB与DVI接口设计与信号完整性分析
1. ARM PB11MPCore接口架构解析PB11MPCore作为ARM经典的嵌入式开发平台,其外设接口设计体现了工业级嵌入式系统的典型特征。我们先从整体架构入手,理解USB和DVI接口在系统中的位置。1.1 系统级接口布局开发板采用前后面板分离设计,关键接口分…...
实时代码光标同步工具:跨设备与团队协作的开发效率利器
1. 项目概述:一个为开发者设计的代码光标同步工具如果你和我一样,经常需要在多台设备、多个编辑器窗口,甚至是与同事进行远程结对编程时,保持代码编辑位置的同步,那么你肯定理解那种来回切换、手动寻找上次编辑位置的痛…...
从拿订单到看方向
在企业积极应对全球化挑战的实践中,贸易型展会(如广交会)因其汇聚全球商业生态的独特属性,成为企业探索市场、验证策略、获取关键资源的核心节点。未来,供应链全球化将更加强调在动态平衡中构建网络韧性,企…...
SITS2026到底是什么?3类企业已紧急升级AI部署栈,第4类正在掉队(附Gartner未公开验证数据)
更多请点击: https://intelliparadigm.com 第一章:SITS2026的定义与演进逻辑 SITS2026(Semantic Integration and Trustable Systems 2026)是新一代面向语义互操作与可信协同的系统架构规范,由国际开放系统联盟&…...
视频怎么去水印?视频去水印软件哪个好用?2026实测方法盘点
视频怎么去水印?视频去水印软件哪个好用?2026实测方法盘点 刷到一条好视频想保存下来,打开相册发现角落里有个大水印,二次使用直接废了。做自媒体的更懂这种痛:从各个平台扒下来的素材,水印各不相同&#x…...
BooruDatasetTagManager:AI训练数据标注效率提升10倍的智能解决方案
BooruDatasetTagManager:AI训练数据标注效率提升10倍的智能解决方案 【免费下载链接】BooruDatasetTagManager 项目地址: https://gitcode.com/gh_mirrors/bo/BooruDatasetTagManager 在AI模型训练领域,数据标注的质量直接决定了模型的最终表现。…...
在Node.js服务中集成Taotoken实现稳定的大模型调用方案
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在Node.js服务中集成Taotoken实现稳定的大模型调用方案 应用场景类,针对需要构建AI功能的后端开发者,阐述如…...
QueryExcel终极指南:5分钟批量查询上百个Excel文件的完整解决方案
QueryExcel终极指南:5分钟批量查询上百个Excel文件的完整解决方案 【免费下载链接】QueryExcel 多Excel文件内容查询工具。 项目地址: https://gitcode.com/gh_mirrors/qu/QueryExcel 你是否曾在海量Excel文件中迷失方向?当数据分散在数十个甚至上…...
告别玄学调音!手把手教你用Adobe Audition和杰里SDK搞定蓝牙音箱EQ
数据驱动的蓝牙音箱EQ调音实战:从频响分析到SDK参数优化 在音频产品开发中,音质调试往往被视为一门"玄学"——依赖工程师的"金耳朵"和经验积累。这种传统方法不仅效率低下,更难以保证结果的可重复性。本文将彻底改变这一…...
如何5分钟完成高质量AI语音转文字:免费音频转录神器终极指南
如何5分钟完成高质量AI语音转文字:免费音频转录神器终极指南 【免费下载链接】faster-whisper-GUI faster_whisper GUI with PySide6 项目地址: https://gitcode.com/gh_mirrors/fa/faster-whisper-GUI 还在为会议录音整理而烦恼吗?还在为视频字幕…...
