如何使用 Python 读取 Excel 文件:从零开始的超详细教程
“日出东海落西山 愁也一天 喜也一天 遇事不钻牛角尖”
文章目录
- 前言
- 文章有误敬请斧正 不胜感恩!||Day03
- 为什么要用 Python 读取 Excel 文件?
- 准备工作:安装所需工具
- 安装 Python
- 安装 Pandas
- 安装 openpyxl
- 使用 Pandas 读取 Excel 文件
- 什么是 Pandas?
- 读取 Excel 文件的简单示例
- 查看数据的前几行
- 选择特定工作表
- 只读取部分列
- 跳过特定行
- 使用 openpyxl 读取 Excel 文件
- 安装 openpyxl
- 读取 Excel 文件的示例
- 使用 xlwings 操作 Excel 文件
- 安装 xlwings
- 使用 xlwings 读取 Excel
- 选择最适合的工具
- 总结
前言
今天讲什么?:
Excel 文件是我们日常数据处理和管理中常见的工具,尤其是在学校、工作和日常生活中都非常有用。无论是用来做数据统计、制作报表,还是进行分析,Excel 文件都非常方便。而 Python 是一门强大的编程语言,可以帮助我们快速读取和处理 Excel 文件中的数据。这篇文章会详细讲解,如何使用 Python 来读取 Excel 文件。
在数学建模中,C题的数据处理部分更是离不开他。
今天,我们就一起从零开始如何使用 Python 读取 Excel 文件。
文章有误敬请斧正 不胜感恩!||Day03
提示:以下是本篇文章正文内容,
为什么要用 Python 读取 Excel 文件?
在 Excel 文件较少、较简单时,手动打开文件并处理可能是不错的选择。但如果数据量大,或者需要重复进行操作时,用编程来自动处理 Excel 文件就显得非常高效了。Python 是一门功能强大且易学的语言,借助它的各种工具库,我们可以非常轻松地读取、修改甚至创建 Excel 文件。
接下来,我会一步步教大家如何使用 Python 读取 Excel 文件。
准备工作:安装所需工具
在开始之前,我们需要先安装 Python 和一些必要的工具库。Python 自身并不能直接读取 Excel 文件,但借助一些强大的库,我们可以轻松实现这个目标。接下来介绍最常用的工具库。
安装 Python
首先,如果你的电脑还没有安装 Python,你可以去 Python 官方网站 下载并安装。
安装 Pandas
Pandas 是一个非常流行的 Python 库,它让我们可以像操作 Excel 一样操作数据。要使用 Pandas,首先需要安装它。打开命令行窗口(Windows 的 CMD 或者 macOS 的 Terminal),然后输入以下命令进行安装:
pip install pandas
或者也可以在IDE中找到
安装 openpyxl
有时候,Pandas 需要借助 openpyxl
来处理 Excel 文件,尤其是 .xlsx 格式的文件,所以我们也需要安装它:
pip install openpyxl
安装好这些工具后,我们就可以开始编写代码来读取 Excel 文件了!
使用 Pandas 读取 Excel 文件
什么是 Pandas?
Pandas 是一个专门用来处理数据的库。它非常适合用于处理 Excel 这样的表格数据。读取 Excel 文件后,Pandas 会把数据转换成类似于表格的格式,称为 DataFrame,让我们可以轻松地进行查看、修改和分析。
读取 Excel 文件的简单示例
假设你有一个名为 data.xlsx
的 Excel 文件,里面有一些数据。我们可以通过以下代码来读取这个文件:
import pandas as pd # 引入 pandas 库# 使用 pandas 读取 Excel 文件
df = pd.read_excel('data.xlsx')# 输出读取的数据
print(df)
这段代码的工作原理很简单:
- 首先,我们引入了
pandas
库,并将它命名为pd
以方便调用。 - 使用
pd.read_excel('文件名')
读取 Excel 文件。文件名可以是相对路径,也可以是绝对路径。 df
是读取后的数据对象,称为 DataFrame。我们可以把它理解为一个电子表格或表格数据。- 使用
print(df)
可以输出整个表格。
查看数据的前几行
有时候,Excel 文件可能会非常大,直接打印全部内容不太方便。我们可以使用 .head()
方法来只查看前几行数据:
print(df.head()) # 查看前5行数据
选择特定工作表
如果 Excel 文件里有多个工作表,Pandas 默认会读取第一个工作表。如果你想读取其他工作表,可以使用 sheet_name
参数指定工作表的名称:
df = pd.read_excel('data.xlsx', sheet_name='Sheet2')
这里,Sheet2
是工作表的名字。如果你不知道工作表的名字,也可以用索引数字,比如第一个工作表是 0,第二个工作表是 1,依此类推:
df = pd.read_excel('data.xlsx', sheet_name=1) # 读取第二个工作表
只读取部分列
如果 Excel 文件中有很多列,但你只需要其中的几列数据,可以通过 usecols
参数选择特定的列。例如:
df = pd.read_excel('data.xlsx', usecols=['A', 'C']) # 只读取 A 列和 C 列
这样你就可以只读取那些对你有用的列,省去不必要的内容。
跳过特定行
有时候,Excel 文件的前几行可能是标题或者一些无用的信息。你可以使用 skiprows
参数跳过这些行:
df = pd.read_excel('data.xlsx', skiprows=2) # 跳过前2行
这就会从第 3 行开始读取数据。
使用 openpyxl 读取 Excel 文件
Pandas 是最常用的工具,但如果,想更灵活地读取和修改 Excel 文件内容,openpyxl
是另一个不错的选择。它可以直接操作 Excel 文件里的数据、样式、公式等。
安装 openpyxl
如果你还没有安装 openpyxl
,可以通过以下命令来安装:
pip install openpyxl
读取 Excel 文件的示例
以下是使用 openpyxl
读取 Excel 文件的简单代码:
import openpyxl# 打开 Excel 文件
wb = openpyxl.load_workbook('data.xlsx')# 选择一个工作表
sheet = wb['Sheet1']# 读取某个单元格的值
cell_value = sheet['A1'].value
print(cell_value)# 读取多行数据
for row in sheet.iter_rows(min_row=1, max_row=5, values_only=True):print(row)
load_workbook
用于打开 Excel 文件。sheet['A1'].value
用于获取 A1 单元格的值。iter_rows
用于遍历多个单元格,比如上面的代码会打印前 5 行的数据。
使用 xlwings 操作 Excel 文件
如果我们需要与 Excel 应用程序直接交互(比如让 Excel 打开、显示并处理数据),或者类似操作。我们就可以使用 xlwings
这个库。
它甚至可以运行 VBA 宏,非常适合在需要大量操作 Excel 时使用。
安装 xlwings
pip install xlwings
使用 xlwings 读取 Excel
以下是使用 xlwings
读取 Excel 文件的简单代码:
import xlwings as xw# 启动 Excel 应用程序
app = xw.App(visible=False) # 设置为 False 时,Excel 不会在屏幕上显示# 打开 Excel 文件
wb = xw.Book('data.xlsx')# 选择工作表
sheet = wb.sheets['Sheet1']# 读取 A1 单元格的值
cell_value = sheet.range('A1').value
print(cell_value)# 关闭 Excel
wb.close()
app.quit()
xw.App(visible=False)
可以让 Excel 在后台运行,而不显示在桌面上。如果你想看到 Excel 操作,可以把visible
改为True
。range('A1').value
获取 A1 单元格的值。- 在我们实际应用时,就应该根据我们自己的情况,来选定。
选择最适合的工具
在 Python 中,不同的工具适合不同的场景,读取 Excel 文件有很多种方式,例如:
-
Pandas:万金油:适合大多数数据分析任务,快速读取和处理 Excel 数据。
-
openpyxl:复杂处理:适合需要对 Excel 文件进行复杂操作(如修改样式、编辑单元格)的场景。
-
xlwings:交互大王:适合与 Excel 应用程序交互,特别是在需要打开 Excel 并操作时。
总结
通过本文的介绍,我们学习了使用 Python 读取 Excel 文件的几种常用方法。
不管是在I/O中的简单的数据读取,还是复杂的 Excel 操作,Python 都能提供强大的工具帮助你处理这些任务。
哈哈
我们python真是世界上最好的语言.java
除此之外,根据我们的需求选择合适的库,既能提高效率,也能避免手动操作中的繁琐和错误。
希望这篇文章能帮助到大家来更好地掌握 Python 读取 Excel
文章如有错误是小生才疏学浅,还望各位看官海涵!
有问题欢迎各位多多评论交流。
我们下一篇再见!
相关文章:

如何使用 Python 读取 Excel 文件:从零开始的超详细教程
“日出东海落西山 愁也一天 喜也一天 遇事不钻牛角尖” 文章目录 前言文章有误敬请斧正 不胜感恩!||Day03为什么要用 Python 读取 Excel 文件?准备工作:安装所需工具安装 Python安装 Pandas安装 openpyxl 使用 Pandas 读取 Excel 文件什么是 …...

仕考网:公务员笔试和面试哪个难?
公务员笔试和面试哪个难?二者之间考察的方向不同,难度也是不同的。 笔试部分因其广泛的知识点和有限的考试时间显得难度更高一些,在笔试环节中,考生需在有限的时间内应对各种问题,而且同时还要面对激烈的竞争,在众多…...
C++知识点总结(55):时间优化
时间优化 一、调试方法1. 输出调试2. 构造样例 二、时间优化1. 前缀和1.1 概念1.2 例题Ⅰ 区间最多数码Ⅱ 双字母字符串Ⅲ Wandering...Ⅳ 数对数目 2. 排序例题选择排序过程 一、调试方法 1. 输出调试 cout 是一个强大的调试工具,可以帮助我们查看程序的状态和变…...
GitHub每日最火火火项目(9.7)
项目名称:polarsource / polar 项目介绍:polar 是一个开源的项目,它是 Lemon Squeezy 的替代方案,具有更优惠的价格。该项目旨在让开发者能够凭借自己的热情进行编码并获得报酬。通过使用 polar,开发者可以更轻松地实现…...

11Python的Pandas:可视化
Pandas本身并没有直接的可视化功能,但它与其他Python库(如Matplotlib和Seaborn)无缝集成,允许你快速创建各种图表和可视化。这里是一些使用Pandas数据进行可视化的常见方法: 1. 使用Matplotlib Pandas中的plot()方法…...

【周易哲学】生辰八字入门讲解(二)
😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【周易哲学】生辰八字入门讲解,期待与你一同探索、学习、进步,一起卷起来叭! 目录 十神十神判断十神类象十神与五行案例 地支藏干藏…...

传统CV算法——基于Opencv的多目标追踪算法
基于 OpenCV 的跟踪算法有多种,每种算法都有其特定的应用场景和优缺点。以下是一些常见的基于 OpenCV 的目标跟踪算法: 1. BOOSTING 跟踪器 描述:基于 AdaBoost 算法的跟踪器。它是一种早期的跟踪算法,使用的是基于弱分类器的强…...
人生苦短我用Python excel转csv
人生苦短我用Python excel转csv 前言准备工作pandas库主要类和方法ExcelFile 类DataFrame 类read_excel 函数to_csv 函数 示例 前言 Excel 文件和csv文件都是常用的电子表格文件格式,其中csv格式更便于用于数据交换和处理。本文使用pandas库将Excel文件转化为csv文…...
Web2和Web3笔记
KimiAI: Web2和Web3是互联网发展的不同阶段,它们代表了不同的技术、理念和用户交互方式。 Web2: Web2通常指的是第二代互联网,它始于2000年代中期,以用户生成内容和社交网络的兴起为标志。 在Web2中,用户不仅是内容的消…...

单元测试 Mock不Mock?
文章目录 前言单元测试没必要?Mock不Mock?什么是Mock?Mock的意义何在? 如何Mock?应该Mock什么?Mock 编写示例 总结 前言 前段时间,我们团队就单元测试是否采用 Mock 进行了一番交流,各有各的说法。本文就单元测试 Mock不Mock…...

常用排序算法(上)
目录 前言: 1.排序的概念及其运用 1.1排序的概念 1.2排序运用 1.3 常见的排序算法 2.常见排序算法的实现 2.1 堆排序 2.1 1 向下调整算法 2.1 2 建堆 2.1 3 排序 2.2 插入排序 2.1.1基本思想: 2.1.2直接插入排序: 2.1.3 插…...
【从问题中去学习k8s】k8s中的常见面试题(夯实理论基础)(二十六)
本站以分享各种运维经验和运维所需要的技能为主 《python零基础入门》:python零基础入门学习 《python运维脚本》: python运维脚本实践 《shell》:shell学习 《terraform》持续更新中:terraform_Aws学习零基础入门到最佳实战 《k8…...
小程序的页面跳转方式
102. 小程序的页面跳转方式 小程序是一种快速发展的应用形式,为用户提供了便捷的功能和交互体验。其中,页面跳转是小程序中常用的功能之一,本文将介绍小程序的页面跳转方式,并提供代码示例,帮助读者更好地理解和实现页…...
第 21 章 DOM 操作表格及样式
第 21 章 DOM 操作表格及样式 1.操作表格 2.操作样式 DOM 在操作生成 HTML 上,还是比较简明的。不过,由于浏览器总是存在兼容和陷阱,导致最终的操作就不是那么简单方便了。本章主要了解一下 DOM 操作表格和样式的一些知识。 一࿰…...

vc-align源码分析 -- ant-design-vue系列
vc-align源码分析 源码地址:https://github.com/vueComponent/ant-design-vue/tree/main/components/vc-align 1 基础代码 1.1 名词约定 需要对齐的节点叫source,对齐的目标叫target。 1.2 props 提供了两个参数: align:对…...

计算机网络(四) —— 简单Tcp网络程序
目录 一,服务器初始化 1.0 部分文件代码 1.1 关于Tcp协议 1.2 创建和绑定套接字 1.3 监听 二,服务器启动 2.1 获取连接 2.2 提供服务 2.3 客户端启动源文件 Main.cc 二,客户端编写 2.1 关于Tcp客户端 2.2 客户端代码 2.3 效果…...

简单的Linux Ftp服务搭建
简单的Linux FTP服务搭建 1.需求 公司有一个esb文件传输代理,其中我们程序有文件传输功能,需要将本地文件传输到esb文件代理服务器上,传输成功之后发送http请求,告知esb将固定文件进行传输到对应外围其他服务的文件目录中&#…...

SQL的高级查询练习知识点(day24)
目录 1 学习目标 2 基础查询 2.1 语法 2.2 例子 3 条件查询 3.1 含义 3.2 语法 3.3 条件表达式 3.3.1 条件运算符 3.3.2 例子 3.4 逻辑表达式 3.4.1 逻辑运算符 3.4.2 例子 3.5 模糊查询 3.5.1 概述 3.5.2 例子 4 DISTINCT关键字 4.1 含义 4.2 例子 5 总结…...
Python条件表达式优化的10个实例
Python 中的条件表达式(也称为三元运算符)是一种简洁的语法,用于在单个表达式中执行 if-else 逻辑。虽然它们本身并不直接“优化”代码的执行速度,但它们可以使代码更加简洁、易读,并且有助于避免不必要的嵌套或复杂的…...

oatpp apiclient 客户端get,post请求python fastapi demo
最新用fastapi搞了个服务端,python功能太强了,就是环境不好弄,弄好后,不要轻易换python版本,不要装多个python版本 前面搞了个oatpp webapi服务端,现在要用客户端,为什么用opatpp客户端,因为他不再带其他库了 demo: 我的请求比较简单,就是向python 的 fastapi服务端…...
Leetcode 3577. Count the Number of Computer Unlocking Permutations
Leetcode 3577. Count the Number of Computer Unlocking Permutations 1. 解题思路2. 代码实现 题目链接:3577. Count the Number of Computer Unlocking Permutations 1. 解题思路 这一题其实就是一个脑筋急转弯,要想要能够将所有的电脑解锁&#x…...
django filter 统计数量 按属性去重
在Django中,如果你想要根据某个属性对查询集进行去重并统计数量,你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求: 方法1:使用annotate()和Count 假设你有一个模型Item,并且你想…...

C++ 求圆面积的程序(Program to find area of a circle)
给定半径r,求圆的面积。圆的面积应精确到小数点后5位。 例子: 输入:r 5 输出:78.53982 解释:由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982,因为我们只保留小数点后 5 位数字。 输…...
C++.OpenGL (14/64)多光源(Multiple Lights)
多光源(Multiple Lights) 多光源渲染技术概览 #mermaid-svg-3L5e5gGn76TNh7Lq {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-3L5e5gGn76TNh7Lq .error-icon{fill:#552222;}#mermaid-svg-3L5e5gGn76TNh7Lq .erro…...
jmeter聚合报告中参数详解
sample、average、min、max、90%line、95%line,99%line、Error错误率、吞吐量Thoughput、KB/sec每秒传输的数据量 sample(样本数) 表示测试中发送的请求数量,即测试执行了多少次请求。 单位,以个或者次数表示。 示例:…...

PHP 8.5 即将发布:管道操作符、强力调试
前不久,PHP宣布了即将在 2025 年 11 月 20 日 正式发布的 PHP 8.5!作为 PHP 语言的又一次重要迭代,PHP 8.5 承诺带来一系列旨在提升代码可读性、健壮性以及开发者效率的改进。而更令人兴奋的是,借助强大的本地开发环境 ServBay&am…...

HubSpot推出与ChatGPT的深度集成引发兴奋与担忧
上周三,HubSpot宣布已构建与ChatGPT的深度集成,这一消息在HubSpot用户和营销技术观察者中引发了极大的兴奋,但同时也存在一些关于数据安全的担忧。 许多网络声音声称,这对SaaS应用程序和人工智能而言是一场范式转变。 但向任何技…...

【Linux手册】探秘系统世界:从用户交互到硬件底层的全链路工作之旅
目录 前言 操作系统与驱动程序 是什么,为什么 怎么做 system call 用户操作接口 总结 前言 日常生活中,我们在使用电子设备时,我们所输入执行的每一条指令最终大多都会作用到硬件上,比如下载一款软件最终会下载到硬盘上&am…...
前端调试HTTP状态码
1xx(信息类状态码) 这类状态码表示临时响应,需要客户端继续处理请求。 100 Continue 服务器已收到请求的初始部分,客户端应继续发送剩余部分。 2xx(成功类状态码) 表示请求已成功被服务器接收、理解并处…...
怎么开发一个网络协议模块(C语言框架)之(六) ——通用对象池总结(核心)
+---------------------------+ | operEntryTbl[] | ← 操作对象池 (对象数组) +---------------------------+ | 0 | 1 | 2 | ... | N-1 | +---------------------------+↓ 初始化时全部加入 +------------------------+ +-------------------------+ | …...