当前位置：首页 > news >正文

【python学习笔记】：Excel 数据的封装函数

news 2026/5/12 20:58:34

对比其它编程语言，我们都知道Python最大的优势是代码简单，有丰富的第三方开源库供开发者使用。伴随着近几年数据分析的热度，Python也成为最受欢迎的编程语言之一。而对于数据的读取和存储，对于普通人来讲，除了数据库之外，最常见的就是微软的Excel。

初识Excel

Microsoft Excel是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。

格式区别

Excel中有xls和xlsx两种格式，它们之间的区别是：

文件格式不同。xls是一个特有的二进制格式，其核心结构是复合文档类型的结构，而xlsx的核心结构是XML类型的结构，采用的是基于 XML的压缩方式，使其占用的空间更小。xlsx 中最后一个 x 的意义就在于此。
版本不同。xls是Excel2003及以前版本生成的文件格式，而xlsx是Excel2007及以后版本生成的文件格式。
兼容性不同。xlsx格式是向下兼容的，可兼容xls格式。

库的使用

Python自带的模块中有针对xls格式的xlrd和xlwt模块，但这两个库仅仅是针对xls的操作，当我们要操作xlsx格式文件时，则需要使用到openpyxl第三方库。

整体思路

当使用以上几个模块的时候，从理论上我们就可以完全操作不同格式的Excel的读和写，很多人就疑惑，那这篇文章的作用是什么？我们直接学习对应的这三个模块不就好了吗？

答案就是：虽然这几个库已经把Excel的文件、表、行、列的概念完全转换为Python中的对象，但每次操作都需要遍历每一个单元格，甚至很多时候我们要花费大量的时间在思考循环单元格的边界上，这本身就是在重复造轮子，因此我花了半天时间整理了以下六个函数。

代码展示

读取xls格式文件

def read_xls_excel(url,index):'''读取xls格式文件参数：url:文件路径index：工作表序号（第几个工作表，传入参数从1开始数）返回：data:表格中的数据'''# 打开指定的工作簿workbook = xlrd.open_workbook(url)# 获取工作簿中的所有表格sheets = workbook.sheet_names()# 获取工作簿中所有表格中的的第 index 个表格worksheet = workbook.sheet_by_name(sheets[index-1])# 定义列表存储表格数据data = []# 遍历每一行数据for i in range(0, worksheet.nrows):# 定义表格存储每一行数据da = []# 遍历每一列数据for j in range(0, worksheet.ncols):# 将行数据存储到da列表da.append(worksheet.cell_value(i, j))# 存储每一行数据data.append(da)# 返回数据return data

写入xls格式文件

def write_xls_excel(url,sheet_name,two_dimensional_data):'''写入xls格式文件参数：url:文件路径sheet_name:表名two_dimensional_data：将要写入表格的数据（二维列表）'''# 创建工作簿对象workbook = xlwt.Workbook()# 创建工作表对象sheet = workbook.add_sheet(sheet_name)# 遍历每一行数据for i in range(0,len(two_dimensional_data)):# 遍历每一列数据for j in range(0,len(two_dimensional_data[i])):# 写入数据sheet.write(i,j,two_dimensional_data[i][j])# 保存workbook.save(url)print("写入成功")

追加写入xls格式文件

def write_xls_excel_add(url, two_dimensional_data, index):'''追加写入xls格式文件参数：url:文件路径two_dimensional_data：将要写入表格的数据（二维列表）index：指定要追加的表的序号（第几个工作表，传入参数从1开始数）'''# 打开指定的工作簿workbook = xlrd.open_workbook(url)# 获取工作簿中的所有表格sheets = workbook.sheet_names()# 获取指定的表worksheet = workbook.sheet_by_name(sheets[index-1])# 获取表格中已存在的数据的行数rows_old = worksheet.nrows# 将xlrd对象拷贝转化为xlwt对象new_workbook = copy(workbook)# 获取转化后工作簿中的第index个表格new_worksheet = new_workbook.get_sheet(index-1)# 遍历每一行数据for i in range(0, len(two_dimensional_data)):# 遍历每一列数据for j in range(0, len(two_dimensional_data[i])):# 追加写入数据，注意是从i+rows_old行开始写入new_worksheet.write(i+rows_old, j, two_dimensional_data[i][j])# 保存工作簿new_workbook.save(url)print("追加写入成功")

读取xlsx格式文件

def read_xlsx_excel(url, sheet_name):'''读取xlsx格式文件参数：url:文件路径sheet_name:表名返回：data:表格中的数据'''# 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象workbook = openpyxl.load_workbook(url)# 根据指定表名获取表格并得到对应的sheet对象sheet = workbook[sheet_name]# 定义列表存储表格数据data = []# 遍历表格的每一行for row in sheet.rows:# 定义表格存储每一行数据da = []# 从每一行中遍历每一个单元格for cell in row:# 将行数据存储到da列表da.append(cell.value)# 存储每一行数据data.append(da)# 返回数据return data

写入xlsx格式文件

def write_xlsx_excel(url, sheet_name, two_dimensional_data):'''写入xlsx格式文件参数：url:文件路径sheet_name:表名two_dimensional_data：将要写入表格的数据（二维列表）'''# 创建工作簿对象workbook = openpyxl.Workbook()# 创建工作表对象sheet = workbook.active# 设置该工作表的名字sheet.title = sheet_name# 遍历表格的每一行for i in range(0, len(two_dimensional_data)):# 遍历表格的每一列for j in range(0, len(two_dimensional_data[i])):# 写入数据（注意openpyxl的行和列是从1开始的，和我们平时的认知是一样的）sheet.cell(row=i + 1, column=j + 1, value=str(two_dimensional_data[i][j]))# 保存到指定位置workbook.save(url)print("写入成功")

追加写入xlsx格式文件

def write_xlsx_excel_add(url, sheet_name, two_dimensional_data):'''追加写入xlsx格式文件参数：url:文件路径sheet_name:表名two_dimensional_data：将要写入表格的数据（二维列表）'''# 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象workbook = openpyxl.load_workbook(url)# 根据指定表名获取表格并得到对应的sheet对象sheet = workbook[sheet_name]for tdd in two_dimensional_data:sheet.append(tdd)# 保存到指定位置workbook.save(url)print("追加写入成功")

读取结果测试

先准备两个Excel文件，如图所示。

其内容如下：

测试代码：

输出结果：

结论：表明读取并没有问题！！！接下来测试写入

写入测试

测试代码：

结果输出：

看到数据被覆盖了！接下来在上面修改后的数据的基础上测试追加写入。

追加写入测试

测试代码：

结果输出：

追加也没有问题。

【python学习笔记】：Excel 数据的封装函数

读取xlsx格式文件

先准备两个Excel文件，如图所示。

相关文章：

【python学习笔记】：Excel 数据的封装函数

如何获取或设置CANoe以太网网卡信息（GET篇）

“终于我从字节离职了...“一个年薪50W的测试工程师的自白...

【Spring】八种常见Bean加载方式

第五回：样式色彩秀芳华

关于@Test单元测试

【项目实战】WebFlux整合r2dbc-mysql实战

go版本分布式锁redsync使用教程

大数据之Hudi数据湖_大数据治理_简介_发展历史_特性_应用场景---大数据之Hudi数据湖工作笔记0001

射频功率放大器基于纵向导波的杆状构件腐蚀诊断方法的研究

Leedcode 二分查找理解1

【告别篇】大家好,再见了,我转行了,在筹备创业

Java——岛屿数量

《代码整洁之道》笔记

个人网站如何集成QQ快捷登录功能？

从工厂打螺丝到月薪18k测试工程师，我该满足吗？

【相关分析-高阶绘图】MATLAB实现皮尔逊相关分析-散点直方图

Spark性能优化二 Shuffle机制分析

软测入门(四)Appium-APP移动测试基础

华为OD机试用Python实现 -【集五福】 |老题且简单

条件生成对抗网络实现可控人脸老化建模

基于GAN的端到端ISP：用AI学习从RAW到RGB的图像处理革命

RT-Thread Sensor框架实战：5分钟搞定INA226电流电压功率监测（含I2C避坑指南）

别再只用欧氏距离了！用Python手写曼哈顿距离，搞定KNN和聚类中的特征选择难题

【PHP】编写php扩展

OpenClaw 接入微信 / 企业微信完整教程

为AI智能体构建持久记忆系统：Claw Recall部署与MCP集成指南

AI原生多任务学习效能跃迁路径（SITS 2026工业级调参手册）

Gmail只读命令行工具gcli：云端自动化邮件查询与SSH隧道授权方案

一次搞清楚：Agent、Skill、Prompt、MCP