Python自动化操作Word文档详解
在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作。
一、安装所需的库
要使用Python操作Word文档,我们需要安装一个名为python-docx的库。可以使用以下命令通过pip安装:
pip install python-docx
二、读取 Word 文档
1. 打开文档
使用python-docx库中的Document类可以轻松打开一个Word文档。
示例:
from docx import Document
doc = Document('example.docx')
在上面的代码中,我们将文档路径作为参数传递给Document类的构造函数,从而打开了一个名为example.docx的文档。
2. 读取文本内容
一旦打开了文档,我们可以使用paragraphs属性来获取文档中的段落列表。每个段落都是一个Paragraph对象,我们可以使用text属性来获取段落的文本内容。
示例:
for paragraph in doc.paragraphs:
print(paragraph.text)
在上面的代码中,我们遍历文档中的每个段落,并打印出其文本内容。
3. 读取表格内容
如果文档中包含表格,我们可以使用tables属性来获取表格列表。每个表格都是一个Table对象,我们可以使用rows和columns属性来获取表格的行和列。
示例:
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,打印出每个单元格的文本内容。
三、写入 Word 文档
1. 创建新文档
我们可以使用Document类的构造函数来创建一个新的空白文档。
示例:
from docx import Document
doc = Document()
在上面的代码中,我们创建了一个新的空白文档。
2. 添加段落
我们可以使用add_paragraph方法来向文档中添加一个段落。
示例:
doc.add_paragraph('这是一个段落。')
在上面的代码中,我们向文档中添加了一个包含文本“这是一个段落。”的段落。
3. 添加表格
我们可以使用add_table方法来向文档中添加一个表格。
示例:
table = doc.add_table(rows=3, cols=3)
for row in table.rows:
for cell in row.cells:
cell.text = '单元格内容'
在上面的代码中,我们向文档中添加了一个3行3列的表格,并为每个单元格设置了文本内容。
4. 保存文档
我们可以使用save方法来保存文档。
示例:
doc.save('new_document.docx')
在上面的代码中,我们将文档保存为名为new_document.docx的文件。
四、修改 Word 文档
1. 修改段落内容
我们可以使用paragraphs属性来获取文档中的段落列表,并使用text属性来修改段落的文本内容。
示例:
for paragraph in doc.paragraphs:
if '要修改的内容' in paragraph.text:
paragraph.text = paragraph.text.replace('要修改的内容', '修改后的内容')
在上面的代码中,我们遍历文档中的每个段落,如果段落中包含“要修改的内容”,则将其替换为“修改后的内容”。
2. 修改表格内容
我们可以使用tables属性来获取文档中的表格列表,并使用rows和columns属性来修改表格的行和列。
示例:
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
if '要修改的内容' in cell.text:
cell.text = cell.text.replace('要修改的内容', '修改后的内容')
在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,如果单元格中包含“要修改的内容”,则将其替换为“修改后的内容”。
五、格式化 Word 文档
1. 设置字体格式
我们可以使用Run对象来设置段落中的字体格式。
示例:
from docx.shared import Pt
paragraph = doc.add_paragraph('这是一个段落。')
run = paragraph.runs[0]
run.font.name = '宋体'
run.font.size = Pt(12)
run.bold = True
run.italic = True
run.underline = True
在上面的代码中,我们向文档中添加了一个段落,并设置了段落中第一个Run对象的字体格式为宋体、字号为12磅、加粗、斜体和下划线。
2. 设置段落格式
我们可以使用ParagraphFormat对象来设置段落的格式。
示例:
from docx.enum.text import WD_ALIGN_PARAGRAPH
paragraph = doc.add_paragraph('这是一个段落。')
paragraph_format = paragraph.paragraph_format
paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER
paragraph_format.line_spacing = 1.5
在上面的代码中,我们向文档中添加了一个段落,并设置了段落的格式为居中对齐、行间距为1.5倍。
3. 设置页面格式
我们可以使用Section对象来设置页面的格式。
示例:
from docx.enum.section import WD_SECTION
section = doc.sections[0]
section.page_height = Pt(11692)
section.page_width = Pt(8268)
section.left_margin = Pt(720)
section.right_margin = Pt(720)
section.top_margin = Pt(720)
section.bottom_margin = Pt(720)
section.header_distance = Pt(360)
section.footer_distance = Pt(360)
在上面的代码中,我们设置了文档的页面格式为A4纸大小、页边距为720磅、页眉和页脚距离为360磅。
六、总结
通过使用python-docx库,我们可以轻松地使用Python自动化操作Word文档。本文介绍了如何读取、写入、修改和格式化Word文档,希望对你有所帮助。在实际应用中,你可以根据自己的需求进一步扩展和定制这些功能,以提高工作效率。
相关文章:
Python自动化操作Word文档详解
在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作…...
常用滤波算法(二)-中位值滤波法
文章目录 一、中位值滤波法简介二、C语言实现中位值滤波法三、程序说明信号初始化:滤波窗口大小:内存分配:中位值滤波函数:中位值计算函数:内存释放: 四、总结 中位值滤波法,作为一种非线性滤波…...
HCIP--以太网交换安全(总实验)
实验背景 假如你是公司的网络管理员,为了提高公司网络安全性,你决定在接入交换机部署一些安全技术:端口隔、端口安全、DHCP snooping、IPSG。 实验拓扑图 实验的要求: 1.在R1、R2连接在GE0/0/1和GE0/0/2接口下,均划…...
C语言 | Leetcode C语言题解之第519题随机翻转矩阵
题目: 题解: typedef struct {unsigned long long val;UT_hash_handle hh; } Hash;typedef struct {Hash *hash;int n_rows;int n_cols; } Solution, SL;Solution* solutionCreate(int n_rows, int n_cols) {SL *obj malloc(sizeof(SL));obj->hash …...
《机器人SLAM导航核心技术与实战》第1季:第10章_其他SLAM系统
视频讲解 【第1季】10.第10章_其他SLAM系统-视频讲解 【第1季】10.1.第10章_其他SLAM系统_RTABMAP算法-视频讲解 【第1季】10.2.第10章_其他SLAM系统_VINS算法-视频讲解 【第1季】10.3.第10章_其他SLAM系统_机器学习与SLAM-视频讲解 第1季:第10章_其他SLAM系统 …...
《双指针篇》---快乐数
题目传送门 1.创建一个bitsum函数用于得到这个数每位的平方和。 2.令快指针等于bitsum(n) 3.慢指针等于n。 逐步令 fast bitSum(bitSum(fast)); slow bitSum(slow); 若最后fast等于slow,则且等于1.则return true。 否则return false。 cla…...
U盘引导丢失问题的处理办法
项目背景:在使用自制的u盘系统的时候经常遇到引导丢失的问题,那么咱们怎么解决这个问题呢,首先第一步通过手动引导u盘 进入系统,同时再进行引导区的修复这样u盘系统就可以正常工作了。 1 进入grub 的提示符下面,首先…...
layui tree customSelet选中的内容重写,查找父级
layui tree customSelet选中的内容重写,查找父级 需要重新源码 // 递归查找函数 // tree 所有数据 ,nodeId选中数据id值 function findParent(tree, nodeId, parent null) {for (let i 0; i < tree.length; i) {if (tree[i].id nodeId) {return …...
Maven 插件
Maven 插件 Maven 是一个强大的项目管理和构建自动化工具,广泛应用于 Java 项目中。它通过插件来实现各种功能,如编译、测试、打包、部署等。Maven 插件是 Maven 的核心组成部分,它们扩展了 Maven 的功能,使其能够执行各种任务。…...
MybatisPlus入门(七)MybatisPlus-DQL编程控制
一、查询投影 查询投影:查出来的东西有多少字段,设置查询出来的结果长什么样,查出的字段控制; 查询投影适用于lamda格式,使用select 查询 lqw.select(User::getId,User::getName,User::getAge); 代码示例࿱…...
K8S概念及其常见组件和整体架构
1.概念 什么是Kubernetes 官网:Kubernetes 文档 | Kubernetes K8S的本质是一组服务器集群,可以在对应服务器集群的每个节点上运行程序,来对节点中的容器进行管理 类似Master-Work方式,每个服务器上安装特定的K8S组件,…...
LabVIEW继电器视觉检测系统
随着制造业的自动化与高精度要求不断提升,传统的人工检测方法逐渐难以满足高效和高精度的需求。特别是在航空航天、医疗设备等高端领域,密封继电器推动杆部件的质量直接影响到设备的性能与可靠性。LabVIEW自动化视觉检测系统,能对推动杆部件进…...
linux操作系统进程
linux操作系统是对下的软硬件进行管理,为了能够对上提供稳定,快速,安全的服务而诞生的软件。 广义上的操作系统是包含搭载在操作系统上的软件和函数库等文件的。 狭义上的操作系统就是操作系统内核,进行进程管理,文件…...
jeecgbootvue2菜单路由配置静态文件夹(public)下的html
需求:想要在菜单配置src/assets/iconfont/chart.html显示页面(目的是打包上线以后运维依然可以修改数据) 官网没有相关数据:菜单配置说明 JeecgBoot 开发文档 看云 问题现象: 我把文件放在src/assets/iconfont/chart.html然后在vue中作为 iframe 的 src 属性&am…...
PHP反序列化原生类字符串逃逸框架反序列化利用
PHP反序列化 概念 序列化的原因:为了解决开发中数据传输和数据解析的一个情况(类似于要发送一个椅子快递,不可能整个椅子打包发送,这是非常不方便的,所以就要对椅子进行序列化处理,让椅子分成很多部分在一起打包发送…...
6.1、属性动画
使用显式动画产生布局更新动画 1.旋转动画 只修改对应的属性 rotate({angle: this.angle}) 即可达到效果 动画效果 对应实现代码 @Entry @Component struct AnimationPage {@State angle:number = 0aboutToAppear() {...
v-model还可以作用于其他表单元素的使用
1、文本输入框 直接双向绑定输入的元素值 初始化默认值为空字符串 2、复选按钮 直接双向绑定输入的元素值 初始化默认值为flase,不选中 3、单选按钮, 1.使用name分组,产生互斥效果。 2.使用value存值, 3再用v-model双向绑定…...
最短路的求解
实验类型:◆验证性实验 ◇综合性实验 ◇设计性实验 实验目的:学会使用Matlab求解最短路。 实验内容:1.熟练运用Floyd算法;2. 熟练运用Dijkstra算法;3.利用Matlab编程实现最短路的计算。 例1:已知无向图…...
四:java 基础知识(4)-- 异常 字符串
目录 1. 异常处理 1.1 什么是异常 1.2 异常的类型 1.2.1 检查异常 1.2.2 运行时异常 1.3 异常的捕获与处理 1.3.1 try-catch 语句 1.3.2 finally 块 1.3.3 throw 和 throws 关键字 1.4 自定义异常 1.5 异常的最佳实践 2. 字符串 2.1 String 类的概述 2.2 字符串的…...
Uniapp 实现app自动检测更新/自动更新功能
实现步骤 配置 manifest.json 在 manifest.json 中设置应用的基本信息,包括 versionName 和 versionCode。 一般默认0.0.1,1. 服务器端接口开发 提供一个 API 接口,返回应用的最新版本信息,版本号、下载链接。客户端检测更新 使…...
19c补丁后oracle属主变化,导致不能识别磁盘组
补丁后服务器重启,数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后,存在与用户组权限相关的问题。具体表现为,Oracle 实例的运行用户(oracle)和集…...
装饰模式(Decorator Pattern)重构java邮件发奖系统实战
前言 现在我们有个如下的需求,设计一个邮件发奖的小系统, 需求 1.数据验证 → 2. 敏感信息加密 → 3. 日志记录 → 4. 实际发送邮件 装饰器模式(Decorator Pattern)允许向一个现有的对象添加新的功能,同时又不改变其…...
python打卡day49
知识点回顾: 通道注意力模块复习空间注意力模块CBAM的定义 作业:尝试对今天的模型检查参数数目,并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...
【OSG学习笔记】Day 18: 碰撞检测与物理交互
物理引擎(Physics Engine) 物理引擎 是一种通过计算机模拟物理规律(如力学、碰撞、重力、流体动力学等)的软件工具或库。 它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互,广泛应用于 游戏开发、动画制作、虚…...
使用分级同态加密防御梯度泄漏
抽象 联邦学习 (FL) 支持跨分布式客户端进行协作模型训练,而无需共享原始数据,这使其成为在互联和自动驾驶汽车 (CAV) 等领域保护隐私的机器学习的一种很有前途的方法。然而,最近的研究表明&…...
高等数学(下)题型笔记(八)空间解析几何与向量代数
目录 0 前言 1 向量的点乘 1.1 基本公式 1.2 例题 2 向量的叉乘 2.1 基础知识 2.2 例题 3 空间平面方程 3.1 基础知识 3.2 例题 4 空间直线方程 4.1 基础知识 4.2 例题 5 旋转曲面及其方程 5.1 基础知识 5.2 例题 6 空间曲面的法线与切平面 6.1 基础知识 6.2…...
微服务商城-商品微服务
数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...
嵌入式学习笔记DAY33(网络编程——TCP)
一、网络架构 C/S (client/server 客户端/服务器):由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序,负责提供用户界面和交互逻辑 ,接收用户输入,向服务器发送请求,并展示服务…...
IP如何挑?2025年海外专线IP如何购买?
你花了时间和预算买了IP,结果IP质量不佳,项目效率低下不说,还可能带来莫名的网络问题,是不是太闹心了?尤其是在面对海外专线IP时,到底怎么才能买到适合自己的呢?所以,挑IP绝对是个技…...
适应性Java用于现代 API:REST、GraphQL 和事件驱动
在快速发展的软件开发领域,REST、GraphQL 和事件驱动架构等新的 API 标准对于构建可扩展、高效的系统至关重要。Java 在现代 API 方面以其在企业应用中的稳定性而闻名,不断适应这些现代范式的需求。随着不断发展的生态系统,Java 在现代 API 方…...
