当前位置：首页 > news >正文

Python操作PDF：PDF文件合并与PDF页面重排

news 2026/2/10 9:06:49

处理大量的 PDF 文档是非常麻烦的事情，频繁地打开关闭文件会严重影响工作效率。对于一大堆内容相关的 PDF 文件，我们在处理时可以将这些 PDF 文件合并起来，作为单一文件处理，从而提高处理效率。同时，我们也可以选取不同PDF文件中想要的页面制作新的 PDF 文件。本文将介绍如何利用 Python 合并 PDF 文件以及选取页面组成新的PDF文件。

文章目录

- 通过 MergeFiles () 方法直接合并 PDF 文件
- 通过插入页面合并 PDF 文档
- 合并不同 PDF 文件的指定页面

使用工具：Spire.PDF for Python
PyPI:
pip install Spire.Doc

通过 MergeFiles () 方法直接合并 PDF 文件

MergeFiles(List[str]) 方法可以将一个文件路径列表对应的所有 PDF 文件按列表顺序合并为一个 PDF 文件。操作示例如下：

遍历文件夹，创建 PDF 文件路径的列表。
使用 PdfDocument.MergeFiles() 方法合并列表对应的 PDF 文件，得到一个 PdfDocumentBase 对象。
使用 PdfDocumentBase.Save() 方法保存合并结果。

Python

from spire.pdf.common import *
from spire.pdf import *
import os# 指定文件夹路径
folder_path = "G:/文档/"# 遍历文件夹中的文件并创建文件路径列表
pdf_files = []
for file_name in sorted(os.listdir(folder_path)):if file_name.endswith(".pdf"):file_path = os.path.join(folder_path, file_name)pdf_files.append(file_path)# 合并PDF文档
pdf = PdfDocument.MergeFiles(pdf_files)# 保存结果文档
pdf.Save("output/合并PDF.pdf", FileFormat.PDF)
pdf.Close()

通过插入页面合并 PDF 文档

AppendPage(PdfDocument) 方法可以在一个 PDF 文件中插入另一个 PDF 文件的所有页面，从而实现合并PDF文件。以下是通过这种方法合并 PDF 文件的操作示例：

载入文件夹下的 PDF 文件为 PdfDocument 对象并创建列表。
创建一个新的 PdfDocument 对象。
PdfDocument.AppendPage(PdfDocument) 方法将载入的 PDF 文件的页面插入到新的 PDF 文件中。
使用 PdfDocument.SaveToFile() 方法保存新的 PDF 文件。

Python

from spire.pdf.common import *
from spire.pdf import *# 遍历文件夹中的文件，载入每个PDF文件PdfDocument对象并列表
folder_path = "G:/文档/"
pdf_files = []
for file_name in sorted(os.listdir(folder_path)):if file_name.endswith(".pdf"):file_path = os.path.join(folder_path, file_name)pdf_files.append(PdfDocument(file_path))# 创建一个PdfDocument对象
newPdf = PdfDocument()# 将加载的PDF文档的页面插入到新的PDF文档中
for pdf in pdf_files:newPdf.AppendPage(pdf)# 保存新的PDF文档
newPdf.SaveToFile("output/插入页面合并PDF.pdf")

合并不同 PDF 文件的指定页面

InsertPage(PdfDocument, pageIndex: int) 方法可以将一个 PDF 文件的指定页面插入到另一个 PDF 文件中。我们可以通过这个方法合并不同 PDF 文件的指定页面。以下是操作示例：

创建 PDF 文件路径列表。
载入 PDF 文件为 PdfDocument 对象并创建列表。
创建新的 PdfDocument 对象。
使用 PdfDocument.InsertPage() 方法插入指定 PDF 文件的指定页面到新的 PDF 文件种。
使用 PdfDocument.SaveToFile() 方法保存新的 PDF 文件。

Python

from spire.pdf import *
from spire.pdf.common import *# 创建PDF文件路径列表
file1 = "示例1.pdf"
file2 = "示例2.pdf"
file3 = "示例3.pdf"
files = [file1, file2, file3]# 加载每个PDF文件并添加到列表中
pdfs = []
for file in files:pdfs.append(PdfDocument(file))# 创建一个PdfDocument对象
newPdf = PdfDocument()# 将加载的PDF文档中选择的页面插入到新文档中
newPdf.InsertPage(pdfs[0], 0)
newPdf.InsertPage(pdfs[1], 1)
newPdf.InsertPageRange(pdfs[2], 0, 1)# 保存新的PDF文档
newPdf.SaveToFile("output/合并不同PDF的指定页面.pdf")

以上是关于如何使用 Spire.PDF for Pytho 合并 PDF 文件的操作介绍。如果你想了解更多此 API 的功能，可前往 Spire.PDF for Python 中文教程了解。

Python操作PDF：PDF文件合并与PDF页面重排

文章目录

通过 MergeFiles () 方法直接合并 PDF 文件

通过插入页面合并 PDF 文档

合并不同 PDF 文件的指定页面

相关文章：

Python操作PDF：PDF文件合并与PDF页面重排

删除链表的倒数第n个节点（C++解法）

Apache服务的搭建与配置（超详细版）

设计模式大赏（一）：桥接模式，组合模式

数据通信——应用层（DHCP的原理与配置）

力扣151.反转字符串中的单词

vim三种模式,文本操作(操作字符/光标,列出行号可视化块模式/多文件查看)

jquery控制easyui中combobox、textbox显示隐藏

Android拖放startDragAndDrop拖拽onDrawShadow静态添加xml布局View，Kotlin（4）

Servlet 初始化参数（web.xml和@WebServlet）

shell_62.shell脚本生成一个标准的 SQL INSERT 语句

华为ICT——第五章语音处理理论与实践

ardupilot开发 --- SLAM 篇

Elasticsearch：在你的数据上训练大型语言模型 (LLM)

拓展卡尔曼滤波EKF

第四章应用SysML基本特性集的汽车示例 P2（断更）｜系统建模语言SysML实用指南学习

Vue入门——核心知识点

使用opencv的tracking模块跟踪目标

Debian或Ubuntu静态交叉编译arm和aarch64

最新ai系统ChatGPT程序源码+详细搭建教程+以图生图+Dall-E2绘画+支持GPT4+Midjourney绘画

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现，论文初版实现

如何为服务器生成TLS证书

Swagger和OpenApi的前世今生

智能分布式爬虫的数据处理流水线优化：基于深度强化学习的数据质量控制

第7篇：中间件全链路监控与 SQL 性能分析实践

协议转换利器，profinet转ethercat网关的两大派系，各有千秋

qt+vs Generated File下的moc_和ui_文件丢失导致 error LNK2001

VSCode 使用CMake 构建 Qt 5 窗口程序

背包问题双雄：01 背包与完全背包详解（Java 实现）