Python自动化操作Word文档详解
在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作。
一、安装所需的库
要使用Python操作Word文档,我们需要安装一个名为python-docx的库。可以使用以下命令通过pip安装:
pip install python-docx
二、读取 Word 文档
1. 打开文档
使用python-docx库中的Document类可以轻松打开一个Word文档。
示例:
from docx import Document
doc = Document('example.docx')
在上面的代码中,我们将文档路径作为参数传递给Document类的构造函数,从而打开了一个名为example.docx的文档。
2. 读取文本内容
一旦打开了文档,我们可以使用paragraphs属性来获取文档中的段落列表。每个段落都是一个Paragraph对象,我们可以使用text属性来获取段落的文本内容。
示例:
for paragraph in doc.paragraphs:
print(paragraph.text)
在上面的代码中,我们遍历文档中的每个段落,并打印出其文本内容。
3. 读取表格内容
如果文档中包含表格,我们可以使用tables属性来获取表格列表。每个表格都是一个Table对象,我们可以使用rows和columns属性来获取表格的行和列。
示例:
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,打印出每个单元格的文本内容。
三、写入 Word 文档
1. 创建新文档
我们可以使用Document类的构造函数来创建一个新的空白文档。
示例:
from docx import Document
doc = Document()
在上面的代码中,我们创建了一个新的空白文档。
2. 添加段落
我们可以使用add_paragraph方法来向文档中添加一个段落。
示例:
doc.add_paragraph('这是一个段落。')
在上面的代码中,我们向文档中添加了一个包含文本“这是一个段落。”的段落。
3. 添加表格
我们可以使用add_table方法来向文档中添加一个表格。
示例:
table = doc.add_table(rows=3, cols=3)
for row in table.rows:
for cell in row.cells:
cell.text = '单元格内容'
在上面的代码中,我们向文档中添加了一个3行3列的表格,并为每个单元格设置了文本内容。
4. 保存文档
我们可以使用save方法来保存文档。
示例:
doc.save('new_document.docx')
在上面的代码中,我们将文档保存为名为new_document.docx的文件。
四、修改 Word 文档
1. 修改段落内容
我们可以使用paragraphs属性来获取文档中的段落列表,并使用text属性来修改段落的文本内容。
示例:
for paragraph in doc.paragraphs:
if '要修改的内容' in paragraph.text:
paragraph.text = paragraph.text.replace('要修改的内容', '修改后的内容')
在上面的代码中,我们遍历文档中的每个段落,如果段落中包含“要修改的内容”,则将其替换为“修改后的内容”。
2. 修改表格内容
我们可以使用tables属性来获取文档中的表格列表,并使用rows和columns属性来修改表格的行和列。
示例:
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
if '要修改的内容' in cell.text:
cell.text = cell.text.replace('要修改的内容', '修改后的内容')
在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,如果单元格中包含“要修改的内容”,则将其替换为“修改后的内容”。
五、格式化 Word 文档
1. 设置字体格式
我们可以使用Run对象来设置段落中的字体格式。
示例:
from docx.shared import Pt
paragraph = doc.add_paragraph('这是一个段落。')
run = paragraph.runs[0]
run.font.name = '宋体'
run.font.size = Pt(12)
run.bold = True
run.italic = True
run.underline = True
在上面的代码中,我们向文档中添加了一个段落,并设置了段落中第一个Run对象的字体格式为宋体、字号为12磅、加粗、斜体和下划线。
2. 设置段落格式
我们可以使用ParagraphFormat对象来设置段落的格式。
示例:
from docx.enum.text import WD_ALIGN_PARAGRAPH
paragraph = doc.add_paragraph('这是一个段落。')
paragraph_format = paragraph.paragraph_format
paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER
paragraph_format.line_spacing = 1.5
在上面的代码中,我们向文档中添加了一个段落,并设置了段落的格式为居中对齐、行间距为1.5倍。
3. 设置页面格式
我们可以使用Section对象来设置页面的格式。
示例:
from docx.enum.section import WD_SECTION
section = doc.sections[0]
section.page_height = Pt(11692)
section.page_width = Pt(8268)
section.left_margin = Pt(720)
section.right_margin = Pt(720)
section.top_margin = Pt(720)
section.bottom_margin = Pt(720)
section.header_distance = Pt(360)
section.footer_distance = Pt(360)
在上面的代码中,我们设置了文档的页面格式为A4纸大小、页边距为720磅、页眉和页脚距离为360磅。
六、总结
通过使用python-docx库,我们可以轻松地使用Python自动化操作Word文档。本文介绍了如何读取、写入、修改和格式化Word文档,希望对你有所帮助。在实际应用中,你可以根据自己的需求进一步扩展和定制这些功能,以提高工作效率。
相关文章:
Python自动化操作Word文档详解
在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作…...
常用滤波算法(二)-中位值滤波法
文章目录 一、中位值滤波法简介二、C语言实现中位值滤波法三、程序说明信号初始化:滤波窗口大小:内存分配:中位值滤波函数:中位值计算函数:内存释放: 四、总结 中位值滤波法,作为一种非线性滤波…...
HCIP--以太网交换安全(总实验)
实验背景 假如你是公司的网络管理员,为了提高公司网络安全性,你决定在接入交换机部署一些安全技术:端口隔、端口安全、DHCP snooping、IPSG。 实验拓扑图 实验的要求: 1.在R1、R2连接在GE0/0/1和GE0/0/2接口下,均划…...
C语言 | Leetcode C语言题解之第519题随机翻转矩阵
题目: 题解: typedef struct {unsigned long long val;UT_hash_handle hh; } Hash;typedef struct {Hash *hash;int n_rows;int n_cols; } Solution, SL;Solution* solutionCreate(int n_rows, int n_cols) {SL *obj malloc(sizeof(SL));obj->hash …...
《机器人SLAM导航核心技术与实战》第1季:第10章_其他SLAM系统
视频讲解 【第1季】10.第10章_其他SLAM系统-视频讲解 【第1季】10.1.第10章_其他SLAM系统_RTABMAP算法-视频讲解 【第1季】10.2.第10章_其他SLAM系统_VINS算法-视频讲解 【第1季】10.3.第10章_其他SLAM系统_机器学习与SLAM-视频讲解 第1季:第10章_其他SLAM系统 …...
《双指针篇》---快乐数
题目传送门 1.创建一个bitsum函数用于得到这个数每位的平方和。 2.令快指针等于bitsum(n) 3.慢指针等于n。 逐步令 fast bitSum(bitSum(fast)); slow bitSum(slow); 若最后fast等于slow,则且等于1.则return true。 否则return false。 cla…...
U盘引导丢失问题的处理办法
项目背景:在使用自制的u盘系统的时候经常遇到引导丢失的问题,那么咱们怎么解决这个问题呢,首先第一步通过手动引导u盘 进入系统,同时再进行引导区的修复这样u盘系统就可以正常工作了。 1 进入grub 的提示符下面,首先…...
layui tree customSelet选中的内容重写,查找父级
layui tree customSelet选中的内容重写,查找父级 需要重新源码 // 递归查找函数 // tree 所有数据 ,nodeId选中数据id值 function findParent(tree, nodeId, parent null) {for (let i 0; i < tree.length; i) {if (tree[i].id nodeId) {return …...
Maven 插件
Maven 插件 Maven 是一个强大的项目管理和构建自动化工具,广泛应用于 Java 项目中。它通过插件来实现各种功能,如编译、测试、打包、部署等。Maven 插件是 Maven 的核心组成部分,它们扩展了 Maven 的功能,使其能够执行各种任务。…...
MybatisPlus入门(七)MybatisPlus-DQL编程控制
一、查询投影 查询投影:查出来的东西有多少字段,设置查询出来的结果长什么样,查出的字段控制; 查询投影适用于lamda格式,使用select 查询 lqw.select(User::getId,User::getName,User::getAge); 代码示例࿱…...
K8S概念及其常见组件和整体架构
1.概念 什么是Kubernetes 官网:Kubernetes 文档 | Kubernetes K8S的本质是一组服务器集群,可以在对应服务器集群的每个节点上运行程序,来对节点中的容器进行管理 类似Master-Work方式,每个服务器上安装特定的K8S组件,…...
LabVIEW继电器视觉检测系统
随着制造业的自动化与高精度要求不断提升,传统的人工检测方法逐渐难以满足高效和高精度的需求。特别是在航空航天、医疗设备等高端领域,密封继电器推动杆部件的质量直接影响到设备的性能与可靠性。LabVIEW自动化视觉检测系统,能对推动杆部件进…...
linux操作系统进程
linux操作系统是对下的软硬件进行管理,为了能够对上提供稳定,快速,安全的服务而诞生的软件。 广义上的操作系统是包含搭载在操作系统上的软件和函数库等文件的。 狭义上的操作系统就是操作系统内核,进行进程管理,文件…...
jeecgbootvue2菜单路由配置静态文件夹(public)下的html
需求:想要在菜单配置src/assets/iconfont/chart.html显示页面(目的是打包上线以后运维依然可以修改数据) 官网没有相关数据:菜单配置说明 JeecgBoot 开发文档 看云 问题现象: 我把文件放在src/assets/iconfont/chart.html然后在vue中作为 iframe 的 src 属性&am…...
PHP反序列化原生类字符串逃逸框架反序列化利用
PHP反序列化 概念 序列化的原因:为了解决开发中数据传输和数据解析的一个情况(类似于要发送一个椅子快递,不可能整个椅子打包发送,这是非常不方便的,所以就要对椅子进行序列化处理,让椅子分成很多部分在一起打包发送…...
6.1、属性动画
使用显式动画产生布局更新动画 1.旋转动画 只修改对应的属性 rotate({angle: this.angle}) 即可达到效果 动画效果 对应实现代码 @Entry @Component struct AnimationPage {@State angle:number = 0aboutToAppear() {...
v-model还可以作用于其他表单元素的使用
1、文本输入框 直接双向绑定输入的元素值 初始化默认值为空字符串 2、复选按钮 直接双向绑定输入的元素值 初始化默认值为flase,不选中 3、单选按钮, 1.使用name分组,产生互斥效果。 2.使用value存值, 3再用v-model双向绑定…...
最短路的求解
实验类型:◆验证性实验 ◇综合性实验 ◇设计性实验 实验目的:学会使用Matlab求解最短路。 实验内容:1.熟练运用Floyd算法;2. 熟练运用Dijkstra算法;3.利用Matlab编程实现最短路的计算。 例1:已知无向图…...
四:java 基础知识(4)-- 异常 字符串
目录 1. 异常处理 1.1 什么是异常 1.2 异常的类型 1.2.1 检查异常 1.2.2 运行时异常 1.3 异常的捕获与处理 1.3.1 try-catch 语句 1.3.2 finally 块 1.3.3 throw 和 throws 关键字 1.4 自定义异常 1.5 异常的最佳实践 2. 字符串 2.1 String 类的概述 2.2 字符串的…...
Uniapp 实现app自动检测更新/自动更新功能
实现步骤 配置 manifest.json 在 manifest.json 中设置应用的基本信息,包括 versionName 和 versionCode。 一般默认0.0.1,1. 服务器端接口开发 提供一个 API 接口,返回应用的最新版本信息,版本号、下载链接。客户端检测更新 使…...
生成xcframework
打包 XCFramework 的方法 XCFramework 是苹果推出的一种多平台二进制分发格式,可以包含多个架构和平台的代码。打包 XCFramework 通常用于分发库或框架。 使用 Xcode 命令行工具打包 通过 xcodebuild 命令可以打包 XCFramework。确保项目已经配置好需要支持的平台…...
【kafka】Golang实现分布式Masscan任务调度系统
要求: 输出两个程序,一个命令行程序(命令行参数用flag)和一个服务端程序。 命令行程序支持通过命令行参数配置下发IP或IP段、端口、扫描带宽,然后将消息推送到kafka里面。 服务端程序: 从kafka消费者接收…...
python打卡day49
知识点回顾: 通道注意力模块复习空间注意力模块CBAM的定义 作业:尝试对今天的模型检查参数数目,并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...
SciencePlots——绘制论文中的图片
文章目录 安装一、风格二、1 资源 安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格 简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源 论文绘图神器来了:一行…...
STM32F4基本定时器使用和原理详解
STM32F4基本定时器使用和原理详解 前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...
汇编常见指令
汇编常见指令 一、数据传送指令 指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX(不访问内存)XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...
智能仓储的未来:自动化、AI与数据分析如何重塑物流中心
当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...
企业如何增强终端安全?
在数字化转型加速的今天,企业的业务运行越来越依赖于终端设备。从员工的笔记本电脑、智能手机,到工厂里的物联网设备、智能传感器,这些终端构成了企业与外部世界连接的 “神经末梢”。然而,随着远程办公的常态化和设备接入的爆炸式…...
Go语言多线程问题
打印零与奇偶数(leetcode 1116) 方法1:使用互斥锁和条件变量 package mainimport ("fmt""sync" )type ZeroEvenOdd struct {n intzeroMutex sync.MutexevenMutex sync.MutexoddMutex sync.Mutexcurrent int…...
LRU 缓存机制详解与实现(Java版) + 力扣解决
📌 LRU 缓存机制详解与实现(Java版) 一、📖 问题背景 在日常开发中,我们经常会使用 缓存(Cache) 来提升性能。但由于内存有限,缓存不可能无限增长,于是需要策略决定&am…...
