Python自动化操作Word文档详解
在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作。
一、安装所需的库
要使用Python操作Word文档,我们需要安装一个名为python-docx的库。可以使用以下命令通过pip安装:
pip install python-docx
二、读取 Word 文档
1. 打开文档
使用python-docx库中的Document类可以轻松打开一个Word文档。
示例:
from docx import Document
doc = Document('example.docx')
在上面的代码中,我们将文档路径作为参数传递给Document类的构造函数,从而打开了一个名为example.docx的文档。
2. 读取文本内容
一旦打开了文档,我们可以使用paragraphs属性来获取文档中的段落列表。每个段落都是一个Paragraph对象,我们可以使用text属性来获取段落的文本内容。
示例:
for paragraph in doc.paragraphs:
print(paragraph.text)
在上面的代码中,我们遍历文档中的每个段落,并打印出其文本内容。
3. 读取表格内容
如果文档中包含表格,我们可以使用tables属性来获取表格列表。每个表格都是一个Table对象,我们可以使用rows和columns属性来获取表格的行和列。
示例:
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,打印出每个单元格的文本内容。
三、写入 Word 文档
1. 创建新文档
我们可以使用Document类的构造函数来创建一个新的空白文档。
示例:
from docx import Document
doc = Document()
在上面的代码中,我们创建了一个新的空白文档。
2. 添加段落
我们可以使用add_paragraph方法来向文档中添加一个段落。
示例:
doc.add_paragraph('这是一个段落。')
在上面的代码中,我们向文档中添加了一个包含文本“这是一个段落。”的段落。
3. 添加表格
我们可以使用add_table方法来向文档中添加一个表格。
示例:
table = doc.add_table(rows=3, cols=3)
for row in table.rows:
for cell in row.cells:
cell.text = '单元格内容'
在上面的代码中,我们向文档中添加了一个3行3列的表格,并为每个单元格设置了文本内容。
4. 保存文档
我们可以使用save方法来保存文档。
示例:
doc.save('new_document.docx')
在上面的代码中,我们将文档保存为名为new_document.docx的文件。
四、修改 Word 文档
1. 修改段落内容
我们可以使用paragraphs属性来获取文档中的段落列表,并使用text属性来修改段落的文本内容。
示例:
for paragraph in doc.paragraphs:
if '要修改的内容' in paragraph.text:
paragraph.text = paragraph.text.replace('要修改的内容', '修改后的内容')
在上面的代码中,我们遍历文档中的每个段落,如果段落中包含“要修改的内容”,则将其替换为“修改后的内容”。
2. 修改表格内容
我们可以使用tables属性来获取文档中的表格列表,并使用rows和columns属性来修改表格的行和列。
示例:
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
if '要修改的内容' in cell.text:
cell.text = cell.text.replace('要修改的内容', '修改后的内容')
在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,如果单元格中包含“要修改的内容”,则将其替换为“修改后的内容”。
五、格式化 Word 文档
1. 设置字体格式
我们可以使用Run对象来设置段落中的字体格式。
示例:
from docx.shared import Pt
paragraph = doc.add_paragraph('这是一个段落。')
run = paragraph.runs[0]
run.font.name = '宋体'
run.font.size = Pt(12)
run.bold = True
run.italic = True
run.underline = True
在上面的代码中,我们向文档中添加了一个段落,并设置了段落中第一个Run对象的字体格式为宋体、字号为12磅、加粗、斜体和下划线。
2. 设置段落格式
我们可以使用ParagraphFormat对象来设置段落的格式。
示例:
from docx.enum.text import WD_ALIGN_PARAGRAPH
paragraph = doc.add_paragraph('这是一个段落。')
paragraph_format = paragraph.paragraph_format
paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER
paragraph_format.line_spacing = 1.5
在上面的代码中,我们向文档中添加了一个段落,并设置了段落的格式为居中对齐、行间距为1.5倍。
3. 设置页面格式
我们可以使用Section对象来设置页面的格式。
示例:
from docx.enum.section import WD_SECTION
section = doc.sections[0]
section.page_height = Pt(11692)
section.page_width = Pt(8268)
section.left_margin = Pt(720)
section.right_margin = Pt(720)
section.top_margin = Pt(720)
section.bottom_margin = Pt(720)
section.header_distance = Pt(360)
section.footer_distance = Pt(360)
在上面的代码中,我们设置了文档的页面格式为A4纸大小、页边距为720磅、页眉和页脚距离为360磅。
六、总结
通过使用python-docx库,我们可以轻松地使用Python自动化操作Word文档。本文介绍了如何读取、写入、修改和格式化Word文档,希望对你有所帮助。在实际应用中,你可以根据自己的需求进一步扩展和定制这些功能,以提高工作效率。
相关文章:

Python自动化操作Word文档详解
在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作…...

常用滤波算法(二)-中位值滤波法
文章目录 一、中位值滤波法简介二、C语言实现中位值滤波法三、程序说明信号初始化:滤波窗口大小:内存分配:中位值滤波函数:中位值计算函数:内存释放: 四、总结 中位值滤波法,作为一种非线性滤波…...

HCIP--以太网交换安全(总实验)
实验背景 假如你是公司的网络管理员,为了提高公司网络安全性,你决定在接入交换机部署一些安全技术:端口隔、端口安全、DHCP snooping、IPSG。 实验拓扑图 实验的要求: 1.在R1、R2连接在GE0/0/1和GE0/0/2接口下,均划…...

C语言 | Leetcode C语言题解之第519题随机翻转矩阵
题目: 题解: typedef struct {unsigned long long val;UT_hash_handle hh; } Hash;typedef struct {Hash *hash;int n_rows;int n_cols; } Solution, SL;Solution* solutionCreate(int n_rows, int n_cols) {SL *obj malloc(sizeof(SL));obj->hash …...

《机器人SLAM导航核心技术与实战》第1季:第10章_其他SLAM系统
视频讲解 【第1季】10.第10章_其他SLAM系统-视频讲解 【第1季】10.1.第10章_其他SLAM系统_RTABMAP算法-视频讲解 【第1季】10.2.第10章_其他SLAM系统_VINS算法-视频讲解 【第1季】10.3.第10章_其他SLAM系统_机器学习与SLAM-视频讲解 第1季:第10章_其他SLAM系统 …...

《双指针篇》---快乐数
题目传送门 1.创建一个bitsum函数用于得到这个数每位的平方和。 2.令快指针等于bitsum(n) 3.慢指针等于n。 逐步令 fast bitSum(bitSum(fast)); slow bitSum(slow); 若最后fast等于slow,则且等于1.则return true。 否则return false。 cla…...

U盘引导丢失问题的处理办法
项目背景:在使用自制的u盘系统的时候经常遇到引导丢失的问题,那么咱们怎么解决这个问题呢,首先第一步通过手动引导u盘 进入系统,同时再进行引导区的修复这样u盘系统就可以正常工作了。 1 进入grub 的提示符下面,首先…...

layui tree customSelet选中的内容重写,查找父级
layui tree customSelet选中的内容重写,查找父级 需要重新源码 // 递归查找函数 // tree 所有数据 ,nodeId选中数据id值 function findParent(tree, nodeId, parent null) {for (let i 0; i < tree.length; i) {if (tree[i].id nodeId) {return …...

Maven 插件
Maven 插件 Maven 是一个强大的项目管理和构建自动化工具,广泛应用于 Java 项目中。它通过插件来实现各种功能,如编译、测试、打包、部署等。Maven 插件是 Maven 的核心组成部分,它们扩展了 Maven 的功能,使其能够执行各种任务。…...

MybatisPlus入门(七)MybatisPlus-DQL编程控制
一、查询投影 查询投影:查出来的东西有多少字段,设置查询出来的结果长什么样,查出的字段控制; 查询投影适用于lamda格式,使用select 查询 lqw.select(User::getId,User::getName,User::getAge); 代码示例࿱…...

K8S概念及其常见组件和整体架构
1.概念 什么是Kubernetes 官网:Kubernetes 文档 | Kubernetes K8S的本质是一组服务器集群,可以在对应服务器集群的每个节点上运行程序,来对节点中的容器进行管理 类似Master-Work方式,每个服务器上安装特定的K8S组件,…...

LabVIEW继电器视觉检测系统
随着制造业的自动化与高精度要求不断提升,传统的人工检测方法逐渐难以满足高效和高精度的需求。特别是在航空航天、医疗设备等高端领域,密封继电器推动杆部件的质量直接影响到设备的性能与可靠性。LabVIEW自动化视觉检测系统,能对推动杆部件进…...

linux操作系统进程
linux操作系统是对下的软硬件进行管理,为了能够对上提供稳定,快速,安全的服务而诞生的软件。 广义上的操作系统是包含搭载在操作系统上的软件和函数库等文件的。 狭义上的操作系统就是操作系统内核,进行进程管理,文件…...

jeecgbootvue2菜单路由配置静态文件夹(public)下的html
需求:想要在菜单配置src/assets/iconfont/chart.html显示页面(目的是打包上线以后运维依然可以修改数据) 官网没有相关数据:菜单配置说明 JeecgBoot 开发文档 看云 问题现象: 我把文件放在src/assets/iconfont/chart.html然后在vue中作为 iframe 的 src 属性&am…...

PHP反序列化原生类字符串逃逸框架反序列化利用
PHP反序列化 概念 序列化的原因:为了解决开发中数据传输和数据解析的一个情况(类似于要发送一个椅子快递,不可能整个椅子打包发送,这是非常不方便的,所以就要对椅子进行序列化处理,让椅子分成很多部分在一起打包发送…...

6.1、属性动画
使用显式动画产生布局更新动画 1.旋转动画 只修改对应的属性 rotate({angle: this.angle}) 即可达到效果 动画效果 对应实现代码 @Entry @Component struct AnimationPage {@State angle:number = 0aboutToAppear() {...

v-model还可以作用于其他表单元素的使用
1、文本输入框 直接双向绑定输入的元素值 初始化默认值为空字符串 2、复选按钮 直接双向绑定输入的元素值 初始化默认值为flase,不选中 3、单选按钮, 1.使用name分组,产生互斥效果。 2.使用value存值, 3再用v-model双向绑定…...

最短路的求解
实验类型:◆验证性实验 ◇综合性实验 ◇设计性实验 实验目的:学会使用Matlab求解最短路。 实验内容:1.熟练运用Floyd算法;2. 熟练运用Dijkstra算法;3.利用Matlab编程实现最短路的计算。 例1:已知无向图…...

四:java 基础知识(4)-- 异常 字符串
目录 1. 异常处理 1.1 什么是异常 1.2 异常的类型 1.2.1 检查异常 1.2.2 运行时异常 1.3 异常的捕获与处理 1.3.1 try-catch 语句 1.3.2 finally 块 1.3.3 throw 和 throws 关键字 1.4 自定义异常 1.5 异常的最佳实践 2. 字符串 2.1 String 类的概述 2.2 字符串的…...

Uniapp 实现app自动检测更新/自动更新功能
实现步骤 配置 manifest.json 在 manifest.json 中设置应用的基本信息,包括 versionName 和 versionCode。 一般默认0.0.1,1. 服务器端接口开发 提供一个 API 接口,返回应用的最新版本信息,版本号、下载链接。客户端检测更新 使…...

7.0、RIP
RIP (Routing Information Protocol) 简介 RIP是由Xerox在20世纪70年代开发的,最初定义在RFC1058中。RIP用两种数据包传输更新:更新和请求,每个有RIP功能的路由器在默认情况下,每隔30s利用UDP520端口向与它直连的网络邻居广播(RIP1)或组播(R…...

C#与C++结构体的交互
C#在和C进行交互时,有时候会需要传递结构体。 做一些总结,避免大家在用的时候踩坑。 一般情况 例如我们在C里定义了一个struct_basic结构体 1 struct struct_basic 2 { 3 WORD value_1; 4 LONG value_2; 5 DWORD value_3; 6 UINT v…...

sql纵表转横表
项目上有一个需求(例子): 用户表 user{ id, name, workCode } id name workCode 1 张三 WC1001 2 李四 WC1002 工作信息表 work{ id, name, workCode, workTimeSun } id name …...

数据采集-Kepware OPCUA 服务器实现
KepserverEX OPC UA server设置 系列文章目录 数据采集-Kepware 安装证书异常处理 目录 KepserverEX OPC UA server设置系列文章目录一、OPC UA(OPC Unified Architecture)二、防火墙的配置三、配置KepserverEX的OPC UA3.1 启用远程连接3.2 启动OPCUA服务器接口 四、管理OPCU…...

初识计算机网络
🌎初识计算机网络 文章目录: 初识计算机网络 计算机网络背景 网络协议 初识协议 制定协议标准的组织或公司 OSI七层模型 操作系统和计算机网络关系 再谈协议 网络传输的基本流程 …...

Oracle 第11章:异常处理
在 Oracle PL/SQL 中,异常处理是一个重要的概念,它用于管理程序执行过程中可能发生的错误或特殊情况。异常可以是系统预定义的,也可以是由用户自定义的。 异常类型与处理机制 PL/SQL 提供了两种类型的异常: 预定义异常…...

导航栏渐变色iOS
- (void)viewDidLoad {[super viewDidLoad];// 设置导航栏属性self.navigationBar.translucent NO;[self.navigationBar setTitleTextAttributes:{NSForegroundColorAttributeName : [UIColor whiteColor], NSFontAttributeName:[UIFont boldSystemFontOfSize:28]}];// 修复iO…...

mysql读写分离
一、proxysql实现mysql读写分离 二、mycat...

计算机的错误计算(一百四十二)
摘要 本节探讨 MATLAB中 附近数的正弦函数的计算精度问题。 例1. 已知 计算 与 直接贴图吧: 另外, 16位的正确值分别为 -0.3077518861551721e-8 与 0.4106402475009074e-3(ISRealsoft 提供)。 容易看出,MATLAB的…...

利用大模型辅助科研论文写作·第一期|论文写作·24-11-02
小罗碎碎念 从这期推文开始,开一个新的系列——如何利用大语言模型辅助论文写作。 我目前的推文主要都集中于分享已经发表的论文,前期背景积累到一定程度以后,我们要动手做实验然后写自己的论文。如果从头到尾,全都自己写…...