用python实战excel和word自动化
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
python实现excel和word自动化--批量处理
- 前言--需求
- 快要期末了需要,提交一个年级的学生成绩数据,也就是几百份。当前我们收集了一份excel表格,它里面有学生的班级、姓名、成绩等信息。
- 问题1: 每个学生一个docx要 有不同的文件名,要把文件名为 班级+姓名 (图片未改)
- 问题2: 每个docx文件中 需要填写一些不一样的东西 比如 文件里要填写
- 二、答案来了,艾佛森来了。于是我编写程序运行后就解决了这个问题:生成了全年级的成绩,并且文件名也按照excel表格的内容有序命名,然后文件里的班级姓名也自动更改成功
- 1.首先复制了需要的份数 -- 就是拿到一个docx样本,然后进行批量复制,文件名可以相同,这里没有出来,只是让他复制和execl表格一样的份数。
- 2.读入数据:就是去读xlsx中的数据,代码我已经详细加了注释。这里需要注意xlrd==1.2.0 ,下载这个版本的,然后运行的时候还有一个地方要稍微改下代码,网上搜索一下即可。这里有个函数就是operator_docx,我放到后面讲解。这段代码的意思就是从xlsx取相应的几列数据(我们要的),给生成一个特定的文件名,然后拼接好,将旧的文件名改为新的。同时调用operator_docx()函数,把文件里的内容也替换掉。
- 3.operator_docx():是我自己写的一个函数,然后这里有很多注释,代表打开docx文件,然后可以小时docx的段落以及表格。可以帮助我去定位想要的修改的内容,我就是这样精准的找到了,想要替换的内容。因为传进来的参数刚好是要修改的,所有此函数我放在了rename_from_excel()中调用,减少了一定的计算开销,提升了性能。
- 二、完整代码如下
- 1.完整代码:
- 2.运行结果:而且里面的内容也已经全部正确,就是班级和姓名 和文件名一一对应。
- 总结-- 有些操作可以放这里,大家可以更好的根据自己的需求,去出来自己的docx,然后批量生成。
- 1. 打开docx,查看内容
- 2. 打开docx后,如何修改我想要修改的那部分内容呢??
- 3. 打开xlsx,如何获取想要的数据??
- 4. 写在最后:主要我也最近着急交一份数据,然后有感而发,写的这份代码,希望可以对大家有所作用,我觉得python真的是一个很好用的工具,前几天也用它登录12306抢票成功了呢,大家可以去我的主页看看。我想继续学下去,每天进步一点点!重剑无锋,大巧不工。
前言–需求
提示:这里可以添加本文要记录的大概内容:
快要期末了需要,提交一个年级的学生成绩数据,也就是几百份。当前我们收集了一份excel表格,它里面有学生的班级、姓名、成绩等信息。

问题1: 每个学生一个docx要 有不同的文件名,要把文件名为 班级+姓名 (图片未改)

问题2: 每个docx文件中 需要填写一些不一样的东西 比如 文件里要填写

二、答案来了,艾佛森来了。于是我编写程序运行后就解决了这个问题:生成了全年级的成绩,并且文件名也按照excel表格的内容有序命名,然后文件里的班级姓名也自动更改成功
1.首先复制了需要的份数 – 就是拿到一个docx样本,然后进行批量复制,文件名可以相同,这里没有出来,只是让他复制和execl表格一样的份数。
def copy_files(original_file, num_copies):# 获取原始文件的目录和文件名(不包括扩展名)directory, file_base = os.path.split(original_file)file_name, file_ext = os.path.splitext(file_base)for i in range(1, num_copies + 1):# 构建新文件名new_file_name = f"{file_name}_copy{i}{file_ext}"new_file_path = os.path.join(directory, new_file_name)# 复制文件shutil.copy2(original_file, new_file_path)print(f"Copied to {new_file_path}")if __name__ == "__main__":# 指定要复制的文件路径original_file_path = "E:\要交的赶紧搞\过程性评价表\G201-XXX.docx"number_of_copies = 304
2.读入数据:就是去读xlsx中的数据,代码我已经详细加了注释。这里需要注意xlrd==1.2.0 ,下载这个版本的,然后运行的时候还有一个地方要稍微改下代码,网上搜索一下即可。这里有个函数就是operator_docx,我放到后面讲解。这段代码的意思就是从xlsx取相应的几列数据(我们要的),给生成一个特定的文件名,然后拼接好,将旧的文件名改为新的。同时调用operator_docx()函数,把文件里的内容也替换掉。
def rename_from_excel():"""根据excel表格的内容批量修改文件名"""# excel表格所在的位置excel_path = r"E:\要交的赶紧搞\11过程性评价成绩--信.xlsx"# 读取excel表:批量处理测试.xlsxxlsx1 = xlrd.open_workbook(excel_path)# 读取表格里第一个sheet(工作簿)sheet = xlsx1.sheet_by_index(0)# 获取表格第二列数据 -- 班级class_list = list(sheet.col_values(1))# 获取表格第四列数据 -- 姓名name_list = list(sheet.col_values(3))print(class_list)print(name_list)# 获取该文件夹下所有的文件(包括文件夹)original_file_path = "E:\要交的赶紧搞\过程性评价表"i = 0file_names = os.listdir(original_file_path)for file_name in file_names:original_rename = os.path.join(original_file_path, file_name) # 获取所有文件的路径directory, file_base = os.path.split(original_file_path)file_name, file_ext = os.path.splitext(file_base)print('original_rename',original_rename)print('directory',directory)print('file_base',file_base)print('file_name',file_name)print('file_ext',file_ext)file_name = class_list[i] + '-' + name_list[i] + '-信息技术过程性评价成绩第3学期.docx'new_file_path = os.path.join(original_file_path, file_name+file_ext)print('new_file_path',new_file_path)os.rename(original_rename, new_file_path)operator_docx(new_file_path, class_list[i], name_list[i])i = i + 1
3.operator_docx():是我自己写的一个函数,然后这里有很多注释,代表打开docx文件,然后可以小时docx的段落以及表格。可以帮助我去定位想要的修改的内容,我就是这样精准的找到了,想要替换的内容。因为传进来的参数刚好是要修改的,所有此函数我放在了rename_from_excel()中调用,减少了一定的计算开销,提升了性能。
def operator_docx(file_path,class_name, all_name):"""自动化操作--docx"""# 打开一个现有的Document对象doc = Document(f'{file_path}')# paras = list(doc.paragraphs)# print('==============')# 遍历所有段落并打印其内容# for para in doc.paragraphs:# print(para.text)# print(doc.paragraphs[3].text)doc.paragraphs[3].text = f'学校:XXX中学 班级:{class_name} 学生姓名:{all_name} 第 3学期/模块'doc.save(f'{file_path}')# print(type(para))# print(type(paras))# print('===========================')# 遍历所有表格并打印其内容 -- 你可以去看看里面的内容# for table in doc.tables:# for row in table.rows:# for cell in row.cells:# print(cell.text, end='\t')# print()
二、完整代码如下
1.完整代码:
import os
import shutil
import xlrd
from docx import Document
import pandasdef copy_files(original_file, num_copies):# 获取原始文件的目录和文件名(不包括扩展名)directory, file_base = os.path.split(original_file)file_name, file_ext = os.path.splitext(file_base)for i in range(1, num_copies + 1):# 构建新文件名new_file_name = f"{file_name}_copy{i}{file_ext}"new_file_path = os.path.join(directory, new_file_name)# 复制文件shutil.copy2(original_file, new_file_path)print(f"Copied to {new_file_path}")def rename_from_excel():"""根据excel表格的内容批量修改文件名"""# excel表格所在的位置excel_path = r"E:\要交的赶紧搞\11过程性评价成绩--信.xlsx"# 读取excel表:批量处理测试.xlsxxlsx1 = xlrd.open_workbook(excel_path)# 读取表格里第一个sheet(工作簿)sheet = xlsx1.sheet_by_index(0)# 获取表格第二列数据 -- 班级class_list = list(sheet.col_values(1))# 获取表格第四列数据 -- 姓名name_list = list(sheet.col_values(3))print(class_list)print(name_list)# 获取该文件夹下所有的文件(包括文件夹)original_file_path = "E:\要交的赶紧搞\过程性评价表"i = 0file_names = os.listdir(original_file_path)for file_name in file_names:original_rename = os.path.join(original_file_path, file_name) # 获取所有文件的路径directory, file_base = os.path.split(original_file_path)file_name, file_ext = os.path.splitext(file_base)print('original_rename',original_rename)print('directory',directory)print('file_base',file_base)print('file_name',file_name)print('file_ext',file_ext)file_name = class_list[i] + '-' + name_list[i] + '-信息技术过程性评价成绩第3学期.docx'new_file_path = os.path.join(original_file_path, file_name+file_ext)print('new_file_path',new_file_path)os.rename(original_rename, new_file_path)operator_docx(new_file_path, class_list[i], name_list[i])i = i + 1
def operator_docx(file_path,class_name, all_name):"""自动化操作--docx"""# 打开一个现有的Document对象doc = Document(f'{file_path}')# paras = list(doc.paragraphs)# print('==============')# 遍历所有段落并打印其内容# for para in doc.paragraphs:# print(para.text)# print(doc.paragraphs[3].text)doc.paragraphs[3].text = f'学校:深圳市红岭教育集团大鹏华侨中学 班级:{class_name} 学生姓名:{all_name} 第 3学期/模块'doc.save(f'{file_path}')# print(type(para))# print(type(paras))# print('===========================')# 遍历所有表格并打印其内容 -- 你可以去看看里面的内容# for table in doc.tables:# for row in table.rows:# for cell in row.cells:# print(cell.text, end='\t')# print()if __name__ == "__main__":# 指定要复制的文件路径original_file_path = "E:\要交的赶紧搞\过程性评价表\G201-蔡承君.docx"number_of_copies = 304# 1.批量复制文件copy_files(original_file_path, number_of_copies)# 2.用excel的行名得到想要的文件名 --> 自动化操作函数operator_docxrename_from_excel()
2.运行结果:而且里面的内容也已经全部正确,就是班级和姓名 和文件名一一对应。

总结-- 有些操作可以放这里,大家可以更好的根据自己的需求,去出来自己的docx,然后批量生成。
1. 打开docx,查看内容
from docx import Document# 打开一个现有的Document对象
doc = Document('demo.docx')# 遍历所有段落并打印其内容
for para in doc.paragraphs:print(para.text)# 遍历所有表格并打印其内容
for table in doc.tables:for row in table.rows:for cell in row.cells:print(cell.text, end='\t')print()
2. 打开docx后,如何修改我想要修改的那部分内容呢??
# 假设我们要修改第2个段落的内容
target_paragraph_index = 1 # 注意索引从0开始,所以第2个段落的索引是1# 确保文档中有足够的段落
if len(doc.paragraphs) > target_paragraph_index:# 修改第2个段落的内容doc.paragraphs[target_paragraph_index].text = '这是新的段落内容。'# 保存修改后的文档
doc.save('modified_by_index_example.docx')
3. 打开xlsx,如何获取想要的数据??
# excel表格所在的位置excel_path = r"E:\要交的赶紧搞\11过程性评价成绩--信.xlsx"# 读取excel表:批量处理测试.xlsxxlsx1 = xlrd.open_workbook(excel_path)# 读取表格里第一个sheet(工作簿)sheet = xlsx1.sheet_by_index(0)# 获取表格第二列数据 -- 班级class_list = list(sheet.col_values(1))# 获取表格第四列数据 -- 姓名name_list = list(sheet.col_values(3))print(class_list)print(name_list)# 获取该文件夹下所有的文件(包括文件夹)original_file_path = "E:\要交的赶紧搞\过程性评价表"
4. 写在最后:主要我也最近着急交一份数据,然后有感而发,写的这份代码,希望可以对大家有所作用,我觉得python真的是一个很好用的工具,前几天也用它登录12306抢票成功了呢,大家可以去我的主页看看。我想继续学下去,每天进步一点点!重剑无锋,大巧不工。
相关文章:
用python实战excel和word自动化
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 python实现excel和word自动化--批量处理 前言--需求快要期末了需要,提交一个年级的学生成绩数据,也就是几百份。当前我们收集了一份excel表格…...
【云计算】OpenStack云计算平台
OpenStack云计算平台框架搭建 1.先换源 先换成阿里源: curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 2.安装框架 yum -y install centos-release-openstack-train 3.安装客户端 yum -y install python-openstackclient 但…...
好用的php商城源码有哪些?
选择一个优秀的商城工具,能更好地帮助大家建立一个好用的商城系统。目前比较流行的都是开源PHP商城系统,那么现实中都有哪些好用的PHP商城源码值得推荐呢?下面就带大家一起来了解一下。 1.TigShop 【推荐指数】:★★★★★☆ 【推…...
docker安装Nginx UI
开源地址:nginx-ui/README-zh_CN.md at dev 0xJacky/nginx-ui GitHub docker run -dit \ --namenginx-ui \ --restartalways \ -e TZAsia/Shanghai \ -v /Users/xiaoping/docker/appdata/nginx:/etc/nginx \ -v /Users/xiaoping/docker/appdata/nginx-ui:/etc/ng…...
为深度学习创建PyTorch张量 - 最佳选项
为深度学习创建PyTorch张量 - 最佳选项 正如我们所看到的,PyTorch张量是torch.Tensor PyTorch类的实例。张量的抽象概念与PyTorch张量之间的区别在于,PyTorch张量为我们提供了一个可以在代码中操作的具体实现。 在上一篇文章中,我们看到了…...
详解数据增强中的平移shft操作
Shift 平移是指在数据增强(data augmentation)过程中,通过对输入图像或目标进行位置偏移(平移),让目标在图像中呈现出不同的位置。Shift 平移的目的是增加训练数据的多样性,从而提高模型对目标在…...
CCLINKIE转ModbusTCP网关,助机器人“掀起”工业智能的“惊涛骇浪”
以下是一个稳联技术CCLINKIE转ModbusTCP网关(WL-CCL-MTCP)连接三菱PLC与机器人的配置案例:设备与软件准备设备:稳联技术WL-CCL-MTCP网关、三菱FX5UPLC、支持ModbusTCP协议的机器人、网线等。 稳联技术ModbusTCP转CCLINKIE网关&…...
类型安全与代码复用的C# 泛型
一、引言:泛型 ——C# 编程的神奇钥匙 在 C# 编程的广袤天地里,泛型宛如一把神奇钥匙,能够开启高效、灵活且安全的代码之门🚪。 想象一下,你是一位经验丰富的建筑师,要建造各种各样的房子🏠。…...
卷积神经05-GAN对抗神经网络
卷积神经05-GAN对抗神经网络 使用Python3.9CUDA11.8Pytorch实现一个CNN优化版的对抗神经网络 简单的GAN图片生成 CNN优化后的图片生成 优化模型代码对比 0-核心逻辑脉络 1)Anacanda使用CUDAPytorch2)使用本地MNIST进行手写图片训练3)…...
vscode使用Marscode编程助手
下载 vscode 在插件里下载Marscode编程助手 插件完成 在这里点击安装,点击后这里出现AI编程插件。...
网络分析仪测试S参数
S参数的测试 一:S参数的定义 S参数(Scattering Parameters,散射参数)是一个表征器件在射频信号激励下的电气行为的工具,它以输入信号、输出信号为元素的矩阵来表现DUT的“传输”和“散射”效应,输入、输出…...
docker mysql5.7如何设置不区分大小写
环境 docker部署,镜像是5.7,操作系统是centos 操作方式 mysql 配置文件是放在 /etc/mysql/mysql.conf.d/mysqld.cnf, vim /etc/mysql/mysql.conf.d/mysqld.cnf lower_case_table_names1 重启mysql容器 验证 SHOW VARIABLES LIKE low…...
【1】Word:邀请函
目录 题目 文字解析 流程 题目 文字解析 考生文件夹☞Word.docx☞一定要用ms打开,wps打开作答无效☞作答完毕,F12或者手动另存为(考生文件夹:路径文件名) 注意:一定要检查,很有可能你前面步…...
【gin】中间件使用之jwt身份认证和Cors跨域,go案例
Gin-3 中间件编程及 JWT 身份认证 1. Gin 中间件概述 中间件是处理 HTTP 请求的函数,可以在请求到达路由处理函数之前或之后对请求进行处理。 在 Gin 框架中,中间件常用于处理日志记录、身份验证、权限控制等功能。 router : gin.Default() router.Us…...
【JAVA实战】@FeignClient注解类通用请求封装
背景 最近在编写多个系统数据集成过程中,经常会使用到FeignClient注解标记一个类,类里面编写很多请求方法,如果第三方系统有非常多的URL请求,每个方法对应一个URL请求,那么这个类就会非常的庞大,是否有一种…...
[c语言日寄]精英怪:三子棋(tic-tac-toe)3命慢通[附免费源码]
哈喽盆友们,今天带来《c语言》游戏中[三子棋boss]速通教程!我们的目标是一边编写博文,一边快速用c语言实现三子棋游戏。准备好瓜子,我们计时开始! 前期规划 在速通中,我们必须要有清晰的前期规划…...
GORM(Go语言数据交互库)
GORM(Go ORM,即对象关系映射)是Go语言中非常流行且功能强大的数据库交互库。它简化了与关系型数据库的交互过程,提供了丰富的API来处理各种数据库操作。下面将详细介绍GORM的功能、使用方法和一些高级特性。 1. 安装 首先&#…...
Redis主从同步是怎么实现的?
Redis主从同步是怎么实现的? 主从节点建立连接后,从节点会进行判断: 1.如果这是从节点之前没有同步过数据 属于初次复制,会进行全量重同步,那么从节点会向主节点发送PSYNC?-1 命令,请求主节点进行全量重…...
Flutter中Get.snackbar避免重复显示的实现
在pubspec.yaml中引入依赖框架。 #GetX依赖注解get: ^4.6.5创建一个SnackBarManager管理类去管理每个提示框。 import package:get/get.dart; import package:flutter/material.dart;class SnackBarManager {factory SnackBarManager() > instance;static final SnackBarMa…...
[Qt]常用控件介绍-多元素控件-QListWidget、QTableWidget、QQTreeWidget
目录 1.多元素控件介绍 2.ListWidget控件 属性 核心方法 核心信号 细节 Demo:编辑日程 3.TableWidget控件 核心方法 QTableWidgetItem核心信号 QTableWidgetItem核心方法 细节 Demo:编辑学生信息 4.TreeWidget控件 核心方法 核心信号…...
浏览器访问 AWS ECS 上部署的 Docker 容器(监听 80 端口)
✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义(Task Definition&…...
MPNet:旋转机械轻量化故障诊断模型详解python代码复现
目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...
系统设计 --- MongoDB亿级数据查询优化策略
系统设计 --- MongoDB亿级数据查询分表策略 背景Solution --- 分表 背景 使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log,共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题,不能使用ELK只能使用…...
Java 加密常用的各种算法及其选择
在数字化时代,数据安全至关重要,Java 作为广泛应用的编程语言,提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景,有助于开发者在不同的业务需求中做出正确的选择。 一、对称加密算法…...
Pinocchio 库详解及其在足式机器人上的应用
Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库,专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性,并提供了一个通用的框架&…...
20个超级好用的 CSS 动画库
分享 20 个最佳 CSS 动画库。 它们中的大多数将生成纯 CSS 代码,而不需要任何外部库。 1.Animate.css 一个开箱即用型的跨浏览器动画库,可供你在项目中使用。 2.Magic Animations CSS3 一组简单的动画,可以包含在你的网页或应用项目中。 3.An…...
【阅读笔记】MemOS: 大语言模型内存增强生成操作系统
核心速览 研究背景 研究问题:这篇文章要解决的问题是当前大型语言模型(LLMs)在处理内存方面的局限性。LLMs虽然在语言感知和生成方面表现出色,但缺乏统一的、结构化的内存架构。现有的方法如检索增强生成(RA…...
使用VMware克隆功能快速搭建集群
自己搭建的虚拟机,后续不管是学习java还是大数据,都需要集群,java需要分布式的微服务,大数据Hadoop的计算集群,如果从头开始搭建虚拟机会比较费时费力,这里分享一下如何使用克隆功能快速搭建一个集群 先把…...
Linux 内核内存管理子系统全面解析与体系构建
一、前言: 为什么内存管理是核心知识 内存管理是 Linux 内核最核心也最复杂的子系统之一,其作用包括: 为软件提供独立的虚拟内存空间,实现安全隔离分配/回收物理内存资源,维持系统稳定支持不同类型的内存分配器,最优…...
结构性-代理模式
动态代理主要是为了处理重复创建模板代码的场景。 使用示例 public interface MyInterface {String doSomething(); }public class MyInterfaceImpl implements MyInterface{Overridepublic String doSomething() {return "接口方法dosomething";} }public class M…...
