当前位置: 首页 > news >正文

用python实战excel和word自动化

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

python实现excel和word自动化--批量处理

  • 前言--需求
    • 快要期末了需要,提交一个年级的学生成绩数据,也就是几百份。当前我们收集了一份excel表格,它里面有学生的班级、姓名、成绩等信息。
    • 问题1: 每个学生一个docx要 有不同的文件名,要把文件名为 班级+姓名 (图片未改)
    • 问题2: 每个docx文件中 需要填写一些不一样的东西 比如 文件里要填写
  • 二、答案来了,艾佛森来了。于是我编写程序运行后就解决了这个问题:生成了全年级的成绩,并且文件名也按照excel表格的内容有序命名,然后文件里的班级姓名也自动更改成功
    • 1.首先复制了需要的份数 -- 就是拿到一个docx样本,然后进行批量复制,文件名可以相同,这里没有出来,只是让他复制和execl表格一样的份数。
    • 2.读入数据:就是去读xlsx中的数据,代码我已经详细加了注释。这里需要注意xlrd==1.2.0 ,下载这个版本的,然后运行的时候还有一个地方要稍微改下代码,网上搜索一下即可。这里有个函数就是operator_docx,我放到后面讲解。这段代码的意思就是从xlsx取相应的几列数据(我们要的),给生成一个特定的文件名,然后拼接好,将旧的文件名改为新的。同时调用operator_docx()函数,把文件里的内容也替换掉。
    • 3.operator_docx():是我自己写的一个函数,然后这里有很多注释,代表打开docx文件,然后可以小时docx的段落以及表格。可以帮助我去定位想要的修改的内容,我就是这样精准的找到了,想要替换的内容。因为传进来的参数刚好是要修改的,所有此函数我放在了rename_from_excel()中调用,减少了一定的计算开销,提升了性能。
  • 二、完整代码如下
    • 1.完整代码:
    • 2.运行结果:而且里面的内容也已经全部正确,就是班级和姓名 和文件名一一对应。
  • 总结-- 有些操作可以放这里,大家可以更好的根据自己的需求,去出来自己的docx,然后批量生成。
  • 1. 打开docx,查看内容
  • 2. 打开docx后,如何修改我想要修改的那部分内容呢??
  • 3. 打开xlsx,如何获取想要的数据??
  • 4. 写在最后:主要我也最近着急交一份数据,然后有感而发,写的这份代码,希望可以对大家有所作用,我觉得python真的是一个很好用的工具,前几天也用它登录12306抢票成功了呢,大家可以去我的主页看看。我想继续学下去,每天进步一点点!重剑无锋,大巧不工。


前言–需求

提示:这里可以添加本文要记录的大概内容:

快要期末了需要,提交一个年级的学生成绩数据,也就是几百份。当前我们收集了一份excel表格,它里面有学生的班级、姓名、成绩等信息。

在这里插入图片描述

问题1: 每个学生一个docx要 有不同的文件名,要把文件名为 班级+姓名 (图片未改)

在这里插入图片描述

问题2: 每个docx文件中 需要填写一些不一样的东西 比如 文件里要填写

在这里插入图片描述

二、答案来了,艾佛森来了。于是我编写程序运行后就解决了这个问题:生成了全年级的成绩,并且文件名也按照excel表格的内容有序命名,然后文件里的班级姓名也自动更改成功

1.首先复制了需要的份数 – 就是拿到一个docx样本,然后进行批量复制,文件名可以相同,这里没有出来,只是让他复制和execl表格一样的份数。

def copy_files(original_file, num_copies):# 获取原始文件的目录和文件名(不包括扩展名)directory, file_base = os.path.split(original_file)file_name, file_ext = os.path.splitext(file_base)for i in range(1, num_copies + 1):# 构建新文件名new_file_name = f"{file_name}_copy{i}{file_ext}"new_file_path = os.path.join(directory, new_file_name)# 复制文件shutil.copy2(original_file, new_file_path)print(f"Copied to {new_file_path}")if __name__ == "__main__":# 指定要复制的文件路径original_file_path = "E:\要交的赶紧搞\过程性评价表\G201-XXX.docx"number_of_copies = 304

2.读入数据:就是去读xlsx中的数据,代码我已经详细加了注释。这里需要注意xlrd==1.2.0 ,下载这个版本的,然后运行的时候还有一个地方要稍微改下代码,网上搜索一下即可。这里有个函数就是operator_docx,我放到后面讲解。这段代码的意思就是从xlsx取相应的几列数据(我们要的),给生成一个特定的文件名,然后拼接好,将旧的文件名改为新的。同时调用operator_docx()函数,把文件里的内容也替换掉。

def rename_from_excel():"""根据excel表格的内容批量修改文件名"""# excel表格所在的位置excel_path = r"E:\要交的赶紧搞\11过程性评价成绩--信.xlsx"# 读取excel表:批量处理测试.xlsxxlsx1 = xlrd.open_workbook(excel_path)# 读取表格里第一个sheet(工作簿)sheet = xlsx1.sheet_by_index(0)# 获取表格第二列数据 -- 班级class_list = list(sheet.col_values(1))# 获取表格第四列数据 -- 姓名name_list = list(sheet.col_values(3))print(class_list)print(name_list)# 获取该文件夹下所有的文件(包括文件夹)original_file_path = "E:\要交的赶紧搞\过程性评价表"i = 0file_names = os.listdir(original_file_path)for file_name in file_names:original_rename = os.path.join(original_file_path, file_name)  # 获取所有文件的路径directory, file_base = os.path.split(original_file_path)file_name, file_ext = os.path.splitext(file_base)print('original_rename',original_rename)print('directory',directory)print('file_base',file_base)print('file_name',file_name)print('file_ext',file_ext)file_name = class_list[i] + '-' + name_list[i] + '-信息技术过程性评价成绩第3学期.docx'new_file_path = os.path.join(original_file_path, file_name+file_ext)print('new_file_path',new_file_path)os.rename(original_rename, new_file_path)operator_docx(new_file_path, class_list[i], name_list[i])i = i + 1

3.operator_docx():是我自己写的一个函数,然后这里有很多注释,代表打开docx文件,然后可以小时docx的段落以及表格。可以帮助我去定位想要的修改的内容,我就是这样精准的找到了,想要替换的内容。因为传进来的参数刚好是要修改的,所有此函数我放在了rename_from_excel()中调用,减少了一定的计算开销,提升了性能。

def operator_docx(file_path,class_name, all_name):"""自动化操作--docx"""# 打开一个现有的Document对象doc = Document(f'{file_path}')# paras = list(doc.paragraphs)# print('==============')# 遍历所有段落并打印其内容# for para in doc.paragraphs:#     print(para.text)# print(doc.paragraphs[3].text)doc.paragraphs[3].text = f'学校:XXX中学 班级:{class_name}   学生姓名:{all_name}  第 3学期/模块'doc.save(f'{file_path}')#     print(type(para))# print(type(paras))# print('===========================')# 遍历所有表格并打印其内容 -- 你可以去看看里面的内容# for table in doc.tables:#     for row in table.rows:#         for cell in row.cells:#             print(cell.text, end='\t')#         print()

二、完整代码如下

1.完整代码:

import os
import shutil
import xlrd
from docx import Document
import pandasdef copy_files(original_file, num_copies):# 获取原始文件的目录和文件名(不包括扩展名)directory, file_base = os.path.split(original_file)file_name, file_ext = os.path.splitext(file_base)for i in range(1, num_copies + 1):# 构建新文件名new_file_name = f"{file_name}_copy{i}{file_ext}"new_file_path = os.path.join(directory, new_file_name)# 复制文件shutil.copy2(original_file, new_file_path)print(f"Copied to {new_file_path}")def rename_from_excel():"""根据excel表格的内容批量修改文件名"""# excel表格所在的位置excel_path = r"E:\要交的赶紧搞\11过程性评价成绩--信.xlsx"# 读取excel表:批量处理测试.xlsxxlsx1 = xlrd.open_workbook(excel_path)# 读取表格里第一个sheet(工作簿)sheet = xlsx1.sheet_by_index(0)# 获取表格第二列数据 -- 班级class_list = list(sheet.col_values(1))# 获取表格第四列数据 -- 姓名name_list = list(sheet.col_values(3))print(class_list)print(name_list)# 获取该文件夹下所有的文件(包括文件夹)original_file_path = "E:\要交的赶紧搞\过程性评价表"i = 0file_names = os.listdir(original_file_path)for file_name in file_names:original_rename = os.path.join(original_file_path, file_name)  # 获取所有文件的路径directory, file_base = os.path.split(original_file_path)file_name, file_ext = os.path.splitext(file_base)print('original_rename',original_rename)print('directory',directory)print('file_base',file_base)print('file_name',file_name)print('file_ext',file_ext)file_name = class_list[i] + '-' + name_list[i] + '-信息技术过程性评价成绩第3学期.docx'new_file_path = os.path.join(original_file_path, file_name+file_ext)print('new_file_path',new_file_path)os.rename(original_rename, new_file_path)operator_docx(new_file_path, class_list[i], name_list[i])i = i + 1
def operator_docx(file_path,class_name, all_name):"""自动化操作--docx"""# 打开一个现有的Document对象doc = Document(f'{file_path}')# paras = list(doc.paragraphs)# print('==============')# 遍历所有段落并打印其内容# for para in doc.paragraphs:#     print(para.text)# print(doc.paragraphs[3].text)doc.paragraphs[3].text = f'学校:深圳市红岭教育集团大鹏华侨中学 班级:{class_name}   学生姓名:{all_name}  第 3学期/模块'doc.save(f'{file_path}')#     print(type(para))# print(type(paras))# print('===========================')# 遍历所有表格并打印其内容 -- 你可以去看看里面的内容# for table in doc.tables:#     for row in table.rows:#         for cell in row.cells:#             print(cell.text, end='\t')#         print()if __name__ == "__main__":# 指定要复制的文件路径original_file_path = "E:\要交的赶紧搞\过程性评价表\G201-蔡承君.docx"number_of_copies = 304# 1.批量复制文件copy_files(original_file_path, number_of_copies)# 2.用excel的行名得到想要的文件名 --> 自动化操作函数operator_docxrename_from_excel()

2.运行结果:而且里面的内容也已经全部正确,就是班级和姓名 和文件名一一对应。

在这里插入图片描述


总结-- 有些操作可以放这里,大家可以更好的根据自己的需求,去出来自己的docx,然后批量生成。

1. 打开docx,查看内容

from docx import Document# 打开一个现有的Document对象
doc = Document('demo.docx')# 遍历所有段落并打印其内容
for para in doc.paragraphs:print(para.text)# 遍历所有表格并打印其内容
for table in doc.tables:for row in table.rows:for cell in row.cells:print(cell.text, end='\t')print()

2. 打开docx后,如何修改我想要修改的那部分内容呢??

# 假设我们要修改第2个段落的内容
target_paragraph_index = 1  # 注意索引从0开始,所以第2个段落的索引是1# 确保文档中有足够的段落
if len(doc.paragraphs) > target_paragraph_index:# 修改第2个段落的内容doc.paragraphs[target_paragraph_index].text = '这是新的段落内容。'# 保存修改后的文档
doc.save('modified_by_index_example.docx')

3. 打开xlsx,如何获取想要的数据??

    # excel表格所在的位置excel_path = r"E:\要交的赶紧搞\11过程性评价成绩--信.xlsx"# 读取excel表:批量处理测试.xlsxxlsx1 = xlrd.open_workbook(excel_path)# 读取表格里第一个sheet(工作簿)sheet = xlsx1.sheet_by_index(0)# 获取表格第二列数据 -- 班级class_list = list(sheet.col_values(1))# 获取表格第四列数据 -- 姓名name_list = list(sheet.col_values(3))print(class_list)print(name_list)# 获取该文件夹下所有的文件(包括文件夹)original_file_path = "E:\要交的赶紧搞\过程性评价表"

4. 写在最后:主要我也最近着急交一份数据,然后有感而发,写的这份代码,希望可以对大家有所作用,我觉得python真的是一个很好用的工具,前几天也用它登录12306抢票成功了呢,大家可以去我的主页看看。我想继续学下去,每天进步一点点!重剑无锋,大巧不工。

相关文章:

用python实战excel和word自动化

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 python实现excel和word自动化--批量处理 前言--需求快要期末了需要,提交一个年级的学生成绩数据,也就是几百份。当前我们收集了一份excel表格&#xf…...

【云计算】OpenStack云计算平台

OpenStack云计算平台框架搭建 1.先换源 先换成阿里源: curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 2.安装框架 yum -y install centos-release-openstack-train 3.安装客户端 yum -y install python-openstackclient 但…...

好用的php商城源码有哪些?

选择一个优秀的商城工具,能更好地帮助大家建立一个好用的商城系统。目前比较流行的都是开源PHP商城系统,那么现实中都有哪些好用的PHP商城源码值得推荐呢?下面就带大家一起来了解一下。 1.TigShop 【推荐指数】:★★★★★☆ 【推…...

docker安装Nginx UI

开源地址:nginx-ui/README-zh_CN.md at dev 0xJacky/nginx-ui GitHub docker run -dit \ --namenginx-ui \ --restartalways \ -e TZAsia/Shanghai \ -v /Users/xiaoping/docker/appdata/nginx:/etc/nginx \ -v /Users/xiaoping/docker/appdata/nginx-ui:/etc/ng…...

为深度学习创建PyTorch张量 - 最佳选项

为深度学习创建PyTorch张量 - 最佳选项 正如我们所看到的,PyTorch张量是torch.Tensor​ PyTorch类的实例。张量的抽象概念与PyTorch张量之间的区别在于,PyTorch张量为我们提供了一个可以在代码中操作的具体实现。 在上一篇文章中,我们看到了…...

详解数据增强中的平移shft操作

Shift 平移是指在数据增强(data augmentation)过程中,通过对输入图像或目标进行位置偏移(平移),让目标在图像中呈现出不同的位置。Shift 平移的目的是增加训练数据的多样性,从而提高模型对目标在…...

CCLINKIE转ModbusTCP网关,助机器人“掀起”工业智能的“惊涛骇浪”

以下是一个稳联技术CCLINKIE转ModbusTCP网关(WL-CCL-MTCP)连接三菱PLC与机器人的配置案例:设备与软件准备设备:稳联技术WL-CCL-MTCP网关、三菱FX5UPLC、支持ModbusTCP协议的机器人、网线等。 稳联技术ModbusTCP转CCLINKIE网关&…...

类型安全与代码复用的C# 泛型

一、引言:泛型 ——C# 编程的神奇钥匙 在 C# 编程的广袤天地里,泛型宛如一把神奇钥匙,能够开启高效、灵活且安全的代码之门🚪。 想象一下,你是一位经验丰富的建筑师,要建造各种各样的房子🏠。…...

卷积神经05-GAN对抗神经网络

卷积神经05-GAN对抗神经网络 使用Python3.9CUDA11.8Pytorch实现一个CNN优化版的对抗神经网络 简单的GAN图片生成 CNN优化后的图片生成 优化模型代码对比 0-核心逻辑脉络 1)Anacanda使用CUDAPytorch2)使用本地MNIST进行手写图片训练3)…...

vscode使用Marscode编程助手

下载 vscode 在插件里下载Marscode编程助手 插件完成 在这里点击安装,点击后这里出现AI编程插件。...

网络分析仪测试S参数

S参数的测试 一:S参数的定义 S参数(Scattering Parameters,散射参数)是一个表征器件在射频信号激励下的电气行为的工具,它以输入信号、输出信号为元素的矩阵来表现DUT的“传输”和“散射”效应,输入、输出…...

docker mysql5.7如何设置不区分大小写

环境 docker部署,镜像是5.7,操作系统是centos 操作方式 mysql 配置文件是放在 /etc/mysql/mysql.conf.d/mysqld.cnf, vim /etc/mysql/mysql.conf.d/mysqld.cnf lower_case_table_names1 重启mysql容器 验证 SHOW VARIABLES LIKE low…...

【1】Word:邀请函

目录 题目 文字解析 流程 题目 文字解析 考生文件夹☞Word.docx☞一定要用ms打开,wps打开作答无效☞作答完毕,F12或者手动另存为(考生文件夹:路径文件名) 注意:一定要检查,很有可能你前面步…...

【gin】中间件使用之jwt身份认证和Cors跨域,go案例

Gin-3 中间件编程及 JWT 身份认证 1. Gin 中间件概述 中间件是处理 HTTP 请求的函数,可以在请求到达路由处理函数之前或之后对请求进行处理。 在 Gin 框架中,中间件常用于处理日志记录、身份验证、权限控制等功能。 router : gin.Default() router.Us…...

【JAVA实战】@FeignClient注解类通用请求封装

背景 最近在编写多个系统数据集成过程中,经常会使用到FeignClient注解标记一个类,类里面编写很多请求方法,如果第三方系统有非常多的URL请求,每个方法对应一个URL请求,那么这个类就会非常的庞大,是否有一种…...

[c语言日寄]精英怪:三子棋(tic-tac-toe)3命慢通[附免费源码]

哈喽盆友们,今天带来《c语言》游戏中[三子棋boss]速通教程!我们的目标是一边编写博文,一边快速用c语言实现三子棋游戏。准备好瓜子,我们计时开始! 前期规划 在速通中,我们必须要有清晰的前期规划&#xf…...

GORM(Go语言数据交互库)

GORM(Go ORM,即对象关系映射)是Go语言中非常流行且功能强大的数据库交互库。它简化了与关系型数据库的交互过程,提供了丰富的API来处理各种数据库操作。下面将详细介绍GORM的功能、使用方法和一些高级特性。 1. 安装 首先&#…...

Redis主从同步是怎么实现的?

Redis主从同步是怎么实现的? 主从节点建立连接后,从节点会进行判断: 1.如果这是从节点之前没有同步过数据 属于初次复制,会进行全量重同步,那么从节点会向主节点发送PSYNC?-1 命令,请求主节点进行全量重…...

Flutter中Get.snackbar避免重复显示的实现

在pubspec.yaml中引入依赖框架。 #GetX依赖注解get: ^4.6.5创建一个SnackBarManager管理类去管理每个提示框。 import package:get/get.dart; import package:flutter/material.dart;class SnackBarManager {factory SnackBarManager() > instance;static final SnackBarMa…...

[Qt]常用控件介绍-多元素控件-QListWidget、QTableWidget、QQTreeWidget

目录 1.多元素控件介绍 2.ListWidget控件 属性 核心方法 核心信号 细节 Demo:编辑日程 3.TableWidget控件 核心方法 QTableWidgetItem核心信号 QTableWidgetItem核心方法 细节 Demo:编辑学生信息 4.TreeWidget控件 核心方法 核心信号…...

Java 8 Stream API 入门到实践详解

一、告别 for 循环&#xff01; 传统痛点&#xff1a; Java 8 之前&#xff0c;集合操作离不开冗长的 for 循环和匿名类。例如&#xff0c;过滤列表中的偶数&#xff1a; List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中,手势开发全攻略:

在 HarmonyOS 应用开发中&#xff0c;手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力&#xff0c;既支持点击、长按、拖拽等基础单一手势的精细控制&#xff0c;也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档&#xff0c…...

AtCoder 第409​场初级竞赛 A~E题解

A Conflict 【题目链接】 原题链接&#xff1a;A - Conflict 【考点】 枚举 【题目大意】 找到是否有两人都想要的物品。 【解析】 遍历两端字符串&#xff0c;只有在同时为 o 时输出 Yes 并结束程序&#xff0c;否则输出 No。 【难度】 GESP三级 【代码参考】 #i…...

Java多线程实现之Callable接口深度解析

Java多线程实现之Callable接口深度解析 一、Callable接口概述1.1 接口定义1.2 与Runnable接口的对比1.3 Future接口与FutureTask类 二、Callable接口的基本使用方法2.1 传统方式实现Callable接口2.2 使用Lambda表达式简化Callable实现2.3 使用FutureTask类执行Callable任务 三、…...

Frozen-Flask :将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是&#xff1a;将一个 Flask Web 应用生成成纯静态 HTML 文件&#xff0c;从而可以部署到静态网站托管服务上&#xff0c;如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

浅谈不同二分算法的查找情况

二分算法原理比较简单&#xff0c;但是实际的算法模板却有很多&#xff0c;这一切都源于二分查找问题中的复杂情况和二分算法的边界处理&#xff0c;以下是博主对一些二分算法查找的情况分析。 需要说明的是&#xff0c;以下二分算法都是基于有序序列为升序有序的情况&#xf…...

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式&#xff1a;dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一&#xff0c;腐蚀跟膨胀属于反向操作&#xff0c;膨胀是把图像图像变大&#xff0c;而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...

【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习

禁止商业或二改转载&#xff0c;仅供自学使用&#xff0c;侵权必究&#xff0c;如需截取部分内容请后台联系作者! 文章目录 介绍流程步骤1. 输入数据2. 特征选择3. 模型训练4. I-Genes 评分计算5. 输出结果 IntelliGenesR 安装包1. 特征选择2. 模型训练和评估3. I-Genes 评分计…...

HDFS分布式存储 zookeeper

hadoop介绍 狭义上hadoop是指apache的一款开源软件 用java语言实现开源框架&#xff0c;允许使用简单的变成模型跨计算机对大型集群进行分布式处理&#xff08;1.海量的数据存储 2.海量数据的计算&#xff09;Hadoop核心组件 hdfs&#xff08;分布式文件存储系统&#xff09;&a…...

Ubuntu Cursor升级成v1.0

0. 当前版本低 使用当前 Cursor v0.50时 GitHub Copilot Chat 打不开&#xff0c;快捷键也不好用&#xff0c;当看到 Cursor 升级后&#xff0c;还是蛮高兴的 1. 下载 Cursor 下载地址&#xff1a;https://www.cursor.com/cn/downloads 点击下载 Linux (x64) &#xff0c;…...