当前位置: 首页 > news >正文

Python自动化操作Word文档详解

       在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作。

一、安装所需的库

       要使用Python操作Word文档,我们需要安装一个名为python-docx的库。可以使用以下命令通过pip安装:

pip install python-docx

二、读取 Word 文档

1. 打开文档

       使用python-docx库中的Document类可以轻松打开一个Word文档。

示例:

from docx import Document

doc = Document('example.docx')

       在上面的代码中,我们将文档路径作为参数传递给Document类的构造函数,从而打开了一个名为example.docx的文档。

2. 读取文本内容

        一旦打开了文档,我们可以使用paragraphs属性来获取文档中的段落列表。每个段落都是一个Paragraph对象,我们可以使用text属性来获取段落的文本内容。

示例:

for paragraph in doc.paragraphs:

    print(paragraph.text)

       在上面的代码中,我们遍历文档中的每个段落,并打印出其文本内容。

3. 读取表格内容

如果文档中包含表格,我们可以使用tables属性来获取表格列表。每个表格都是一个Table对象,我们可以使用rows和columns属性来获取表格的行和列。

示例:

for table in doc.tables:

    for row in table.rows:

        for cell in row.cells:

            print(cell.text)

       在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,打印出每个单元格的文本内容。

三、写入 Word 文档

1. 创建新文档

       我们可以使用Document类的构造函数来创建一个新的空白文档。

示例:

from docx import Document

doc = Document()

在上面的代码中,我们创建了一个新的空白文档。

2. 添加段落

       我们可以使用add_paragraph方法来向文档中添加一个段落。

示例:

doc.add_paragraph('这是一个段落。')

在上面的代码中,我们向文档中添加了一个包含文本“这是一个段落。”的段落。

3. 添加表格

       我们可以使用add_table方法来向文档中添加一个表格。

示例:

table = doc.add_table(rows=3, cols=3)

for row in table.rows:

    for cell in row.cells:

        cell.text = '单元格内容'

在上面的代码中,我们向文档中添加了一个3行3列的表格,并为每个单元格设置了文本内容。

4. 保存文档

       我们可以使用save方法来保存文档。

示例:

doc.save('new_document.docx')

在上面的代码中,我们将文档保存为名为new_document.docx的文件。

四、修改 Word 文档

1. 修改段落内容

       我们可以使用paragraphs属性来获取文档中的段落列表,并使用text属性来修改段落的文本内容。

示例:

for paragraph in doc.paragraphs:

    if '要修改的内容' in paragraph.text:

        paragraph.text = paragraph.text.replace('要修改的内容', '修改后的内容')

在上面的代码中,我们遍历文档中的每个段落,如果段落中包含“要修改的内容”,则将其替换为“修改后的内容”。

2. 修改表格内容

       我们可以使用tables属性来获取文档中的表格列表,并使用rows和columns属性来修改表格的行和列。

示例:

for table in doc.tables:

    for row in table.rows:

        for cell in row.cells:

            if '要修改的内容' in cell.text:

                cell.text = cell.text.replace('要修改的内容', '修改后的内容')

在上面的代码中,我们遍历文档中的每个表格,并遍历每个表格的行和列,如果单元格中包含“要修改的内容”,则将其替换为“修改后的内容”。

五、格式化 Word 文档

1. 设置字体格式

       我们可以使用Run对象来设置段落中的字体格式。

示例:

from docx.shared import Pt

paragraph = doc.add_paragraph('这是一个段落。')

run = paragraph.runs[0]

run.font.name = '宋体'

run.font.size = Pt(12)

run.bold = True

run.italic = True

run.underline = True

在上面的代码中,我们向文档中添加了一个段落,并设置了段落中第一个Run对象的字体格式为宋体、字号为12磅、加粗、斜体和下划线。

2. 设置段落格式

       我们可以使用ParagraphFormat对象来设置段落的格式。

示例:

from docx.enum.text import WD_ALIGN_PARAGRAPH

paragraph = doc.add_paragraph('这是一个段落。')

paragraph_format = paragraph.paragraph_format

paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER

paragraph_format.line_spacing = 1.5

在上面的代码中,我们向文档中添加了一个段落,并设置了段落的格式为居中对齐、行间距为1.5倍。

3. 设置页面格式

我们可以使用Section对象来设置页面的格式。

示例:

from docx.enum.section import WD_SECTION

section = doc.sections[0]

section.page_height = Pt(11692)

section.page_width = Pt(8268)

section.left_margin = Pt(720)

section.right_margin = Pt(720)

section.top_margin = Pt(720)

section.bottom_margin = Pt(720)

section.header_distance = Pt(360)

section.footer_distance = Pt(360)

在上面的代码中,我们设置了文档的页面格式为A4纸大小、页边距为720磅、页眉和页脚距离为360磅。

六、总结

        通过使用python-docx库,我们可以轻松地使用Python自动化操作Word文档。本文介绍了如何读取、写入、修改和格式化Word文档,希望对你有所帮助。在实际应用中,你可以根据自己的需求进一步扩展和定制这些功能,以提高工作效率。

 

 

相关文章:

Python自动化操作Word文档详解

在日常办公和数据处理中,我们经常需要处理Word文档。手动操作Word文档可能会非常繁琐和耗时,而使用Python可以实现自动化操作,提高工作效率。本文将详细介绍如何使用Python自动化操作Word文档,包括读取、写入、修改和格式化等操作…...

常用滤波算法(二)-中位值滤波法

文章目录 一、中位值滤波法简介二、C语言实现中位值滤波法三、程序说明信号初始化:滤波窗口大小:内存分配:中位值滤波函数:中位值计算函数:内存释放: 四、总结 中位值滤波法,作为一种非线性滤波…...

HCIP--以太网交换安全(总实验)

实验背景 假如你是公司的网络管理员,为了提高公司网络安全性,你决定在接入交换机部署一些安全技术:端口隔、端口安全、DHCP snooping、IPSG。 实验拓扑图 实验的要求: 1.在R1、R2连接在GE0/0/1和GE0/0/2接口下,均划…...

C语言 | Leetcode C语言题解之第519题随机翻转矩阵

题目: 题解: typedef struct {unsigned long long val;UT_hash_handle hh; } Hash;typedef struct {Hash *hash;int n_rows;int n_cols; } Solution, SL;Solution* solutionCreate(int n_rows, int n_cols) {SL *obj malloc(sizeof(SL));obj->hash …...

《机器人SLAM导航核心技术与实战》第1季:第10章_其他SLAM系统

视频讲解 【第1季】10.第10章_其他SLAM系统-视频讲解 【第1季】10.1.第10章_其他SLAM系统_RTABMAP算法-视频讲解 【第1季】10.2.第10章_其他SLAM系统_VINS算法-视频讲解 【第1季】10.3.第10章_其他SLAM系统_机器学习与SLAM-视频讲解 第1季:第10章_其他SLAM系统 …...

《双指针篇》---快乐数

题目传送门 1.创建一个bitsum函数用于得到这个数每位的平方和。 2.令快指针等于bitsum(n) 3.慢指针等于n。 逐步令 fast bitSum(bitSum(fast)); slow bitSum(slow); 若最后fast等于slow,则且等于1.则return true。 否则return false。 cla…...

U盘引导丢失问题的处理办法

项目背景:在使用自制的u盘系统的时候经常遇到引导丢失的问题,那么咱们怎么解决这个问题呢,首先第一步通过手动引导u盘 进入系统,同时再进行引导区的修复这样u盘系统就可以正常工作了。 1 进入grub 的提示符下面,首先…...

layui tree customSelet选中的内容重写,查找父级

layui tree customSelet选中的内容重写&#xff0c;查找父级 需要重新源码 // 递归查找函数 // tree 所有数据 &#xff0c;nodeId选中数据id值 function findParent(tree, nodeId, parent null) {for (let i 0; i < tree.length; i) {if (tree[i].id nodeId) {return …...

Maven 插件

Maven 插件 Maven 是一个强大的项目管理和构建自动化工具&#xff0c;广泛应用于 Java 项目中。它通过插件来实现各种功能&#xff0c;如编译、测试、打包、部署等。Maven 插件是 Maven 的核心组成部分&#xff0c;它们扩展了 Maven 的功能&#xff0c;使其能够执行各种任务。…...

MybatisPlus入门(七)MybatisPlus-DQL编程控制

一、查询投影 查询投影&#xff1a;查出来的东西有多少字段&#xff0c;设置查询出来的结果长什么样&#xff0c;查出的字段控制&#xff1b; 查询投影适用于lamda格式&#xff0c;使用select 查询 lqw.select(User::getId,User::getName,User::getAge); 代码示例&#xff1…...

K8S概念及其常见组件和整体架构

1.概念 什么是Kubernetes 官网&#xff1a;Kubernetes 文档 | Kubernetes K8S的本质是一组服务器集群&#xff0c;可以在对应服务器集群的每个节点上运行程序&#xff0c;来对节点中的容器进行管理 类似Master-Work方式&#xff0c;每个服务器上安装特定的K8S组件&#xff0c…...

LabVIEW继电器视觉检测系统

随着制造业的自动化与高精度要求不断提升&#xff0c;传统的人工检测方法逐渐难以满足高效和高精度的需求。特别是在航空航天、医疗设备等高端领域&#xff0c;密封继电器推动杆部件的质量直接影响到设备的性能与可靠性。LabVIEW自动化视觉检测系统&#xff0c;能对推动杆部件进…...

linux操作系统进程

linux操作系统是对下的软硬件进行管理&#xff0c;为了能够对上提供稳定&#xff0c;快速&#xff0c;安全的服务而诞生的软件。 广义上的操作系统是包含搭载在操作系统上的软件和函数库等文件的。 狭义上的操作系统就是操作系统内核&#xff0c;进行进程管理&#xff0c;文件…...

jeecgbootvue2菜单路由配置静态文件夹(public)下的html

需求:想要在菜单配置src/assets/iconfont/chart.html显示页面(目的是打包上线以后运维依然可以修改数据) 官网没有相关数据&#xff1a;菜单配置说明 JeecgBoot 开发文档 看云 问题现象: 我把文件放在src/assets/iconfont/chart.html然后在vue中作为 iframe 的 src 属性&am…...

PHP反序列化原生类字符串逃逸框架反序列化利用

PHP反序列化 概念 序列化的原因&#xff1a;为了解决开发中数据传输和数据解析的一个情况(类似于要发送一个椅子快递&#xff0c;不可能整个椅子打包发送&#xff0c;这是非常不方便的&#xff0c;所以就要对椅子进行序列化处理&#xff0c;让椅子分成很多部分在一起打包发送…...

6.1、属性动画

使用显式动画产生布局更新动画 1.旋转动画 只修改对应的属性 rotate({angle: this.angle}) 即可达到效果 动画效果 对应实现代码 @Entry @Component struct AnimationPage {@State angle:number = 0aboutToAppear() {...

v-model还可以作用于其他表单元素的使用

1、文本输入框 直接双向绑定输入的元素值 初始化默认值为空字符串 2、复选按钮 直接双向绑定输入的元素值 初始化默认值为flase&#xff0c;不选中 3、单选按钮&#xff0c; 1.使用name分组&#xff0c;产生互斥效果。 2.使用value存值&#xff0c; 3再用v-model双向绑定…...

最短路的求解

实验类型&#xff1a;◆验证性实验 ◇综合性实验 ◇设计性实验 实验目的&#xff1a;学会使用Matlab求解最短路。 实验内容&#xff1a;1.熟练运用Floyd算法&#xff1b;2. 熟练运用Dijkstra算法&#xff1b;3.利用Matlab编程实现最短路的计算。 例1&#xff1a;已知无向图…...

四:java 基础知识(4)-- 异常 字符串

目录 1. 异常处理 1.1 什么是异常 1.2 异常的类型 1.2.1 检查异常 1.2.2 运行时异常 1.3 异常的捕获与处理 1.3.1 try-catch 语句 1.3.2 finally 块 1.3.3 throw 和 throws 关键字 1.4 自定义异常 1.5 异常的最佳实践 2. 字符串 2.1 String 类的概述 2.2 字符串的…...

Uniapp 实现app自动检测更新/自动更新功能

实现步骤 配置 manifest.json 在 manifest.json 中设置应用的基本信息&#xff0c;包括 versionName 和 versionCode。 一般默认0.0.1&#xff0c;1. 服务器端接口开发 提供一个 API 接口&#xff0c;返回应用的最新版本信息&#xff0c;版本号、下载链接。客户端检测更新 使…...

MPNet:旋转机械轻量化故障诊断模型详解python代码复现

目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...

【根据当天日期输出明天的日期(需对闰年做判定)。】2022-5-15

缘由根据当天日期输出明天的日期(需对闰年做判定)。日期类型结构体如下&#xff1a; struct data{ int year; int month; int day;};-编程语言-CSDN问答 struct mdata{ int year; int month; int day; }mdata; int 天数(int year, int month) {switch (month){case 1: case 3:…...

Frozen-Flask :将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是&#xff1a;将一个 Flask Web 应用生成成纯静态 HTML 文件&#xff0c;从而可以部署到静态网站托管服务上&#xff0c;如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

【论文阅读28】-CNN-BiLSTM-Attention-(2024)

本文把滑坡位移序列拆开、筛优质因子&#xff0c;再用 CNN-BiLSTM-Attention 来动态预测每个子序列&#xff0c;最后重构出总位移&#xff0c;预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵&#xff08;S…...

图表类系列各种样式PPT模版分享

图标图表系列PPT模版&#xff0c;柱状图PPT模版&#xff0c;线状图PPT模版&#xff0c;折线图PPT模版&#xff0c;饼状图PPT模版&#xff0c;雷达图PPT模版&#xff0c;树状图PPT模版 图表类系列各种样式PPT模版分享&#xff1a;图表系列PPT模板https://pan.quark.cn/s/20d40aa…...

重启Eureka集群中的节点,对已经注册的服务有什么影响

先看答案&#xff0c;如果正确地操作&#xff0c;重启Eureka集群中的节点&#xff0c;对已经注册的服务影响非常小&#xff0c;甚至可以做到无感知。 但如果操作不当&#xff0c;可能会引发短暂的服务发现问题。 下面我们从Eureka的核心工作原理来详细分析这个问题。 Eureka的…...

JVM 内存结构 详解

内存结构 运行时数据区&#xff1a; Java虚拟机在运行Java程序过程中管理的内存区域。 程序计数器&#xff1a; ​ 线程私有&#xff0c;程序控制流的指示器&#xff0c;分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。 ​ 每个线程都有一个程序计数…...

零知开源——STM32F103RBT6驱动 ICM20948 九轴传感器及 vofa + 上位机可视化教程

STM32F1 本教程使用零知标准板&#xff08;STM32F103RBT6&#xff09;通过I2C驱动ICM20948九轴传感器&#xff0c;实现姿态解算&#xff0c;并通过串口将数据实时发送至VOFA上位机进行3D可视化。代码基于开源库修改优化&#xff0c;适合嵌入式及物联网开发者。在基础驱动上新增…...

Linux-进程间的通信

1、IPC&#xff1a; Inter Process Communication&#xff08;进程间通信&#xff09;&#xff1a; 由于每个进程在操作系统中有独立的地址空间&#xff0c;它们不能像线程那样直接访问彼此的内存&#xff0c;所以必须通过某种方式进行通信。 常见的 IPC 方式包括&#…...

EasyRTC音视频实时通话功能在WebRTC与智能硬件整合中的应用与优势

一、WebRTC与智能硬件整合趋势​ 随着物联网和实时通信需求的爆发式增长&#xff0c;WebRTC作为开源实时通信技术&#xff0c;为浏览器与移动应用提供免插件的音视频通信能力&#xff0c;在智能硬件领域的融合应用已成必然趋势。智能硬件不再局限于单一功能&#xff0c;对实时…...