python zip()函数(将多个可迭代对象的元素配对,创建一个元组的迭代器)zip_longest()
文章目录
- Python `zip()` 函数深入解析
- 基本用法
- 函数原型
- 基础示例
- 处理不同长度的迭代器
- 高级用法
- 多个迭代器
- 使用 `zip()` 与 `dict()`
- 解压序列
- 注意事项
- 内存效率:`zip()` 返回的是一个迭代器,这意味着直到迭代发生前,元素不会被消耗。这使得 `zip()` 特别内存效率。
- 迭代器和内存效率
- `zip()` 函数的工作原理
- 延迟计算:`zip()` 并不会预先计算出所有的元组。它仅在迭代到某个位置时,才会生成那个位置的元组。这就是所谓的“惰性计算”(lazy evaluation)。
- 内存使用:因为数据是按需生成的,`zip()` 在任何给定时间点不需要将所有组合的元组存储在内存中。这样可以避免在处理大量数据时占用大量内存。
- 实际例子
- 一次性使用:由于 `zip()` 返回的是一个迭代器,所以迭代过后,它将无法再次使用。
- 使用技巧
- 与 `enumerate` 结合使用
- 处理不等长序列的替代方法(需要处理不等长的序列而又不想在最短序列结束时停止,可以使用 `itertools.zip_longest` 方法)
- 与列表推导式结合
- 应用场景
- 数据科学中的应用
- 多语言数据处理
- 结论
Python zip()
函数深入解析
Python 的 zip()
函数是一个内置函数,用于将多个可迭代对象的元素配对,创建一个元组的迭代器。这个功能在处理并行数据时非常有用。本文将深入探讨 zip()
函数的使用方法、高级应用场景以及一些注意事项。
基本用法
函数原型
zip()
函数的基本语法如下:
zip(*iterables)
*iterables
:一个或多个可迭代对象,如列表、元组或字典。
基础示例
开始之前,先看一个简单的例子,演示如何使用 zip()
将两个列表中的相对应元素组合在一起:
list1 = [1, 2, 3]
list2 = ['a', 'b', 'c']
zipped = zip(list1, list2)
print(list(zipped))
输出:
[(1, 'a'), (2, 'b'), (3, 'c')]
这里,zip()
函数接受两个列表作为输入,并返回一个迭代器。迭代器中的每个元素都是一个元组,包含来自所有输入可迭代对象的对应元素。
处理不同长度的迭代器
当输入的可迭代对象长度不一致时,zip()
会根据最短的对象结束。看下面的例子:
numbers = [1, 2, 3, 4]
letters = ['a', 'b', 'c']
zipped = zip(numbers, letters)
print(list(zipped))
输出:
[(1, 'a'), (2, 'b'), (3, 'c')]
可以看到,虽然 numbers
列表有四个元素,但输出只包含三个元组,因为 letters
只有三个元素。
高级用法
多个迭代器
zip()
可以同时处理多于两个的迭代器。例如,将三个列表组合在一起:
list1 = [1, 2, 3]
list2 = ['a', 'b', 'c']
list3 = [0.1, 0.2, 0.3]
zipped = zip(list1, list2, list3)
print(list(zipped))
输出:
[(1, 'a', 0.1), (2, 'b', 0.2), (3, 'c', 0.3)]
使用 zip()
与 dict()
zip()
和dict()
结合使用,常用于将两个列表转换成字典,其中一个列表包含键,另一个列表包含值:
keys = ['name', 'age', 'gender']
values = ['Alice', 25, 'Female']
dictionary = dict(zip(keys, values))
print(dictionary)
输出:
{'name': 'Alice', 'age': 25, 'gender': 'Female'}
解压序列
使用 zip(*iterable)
可以实现解压,即反向操作,将配对的数据序列解开成多个独立的序列:
pairs = [(1, 'a'), (2, 'b'), (3, 'c')]
numbers, letters = zip(*pairs)
print(list(numbers))
print(list(letters))
输出:
[1, 2, 3]
['a', 'b', 'c']
这里,*pairs
将列表中的每个元组解包,然后 zip()
将所有第一项组合成一个元组,所有第二项组合成另一个元组。
注意事项
内存效率:zip()
返回的是一个迭代器,这意味着直到迭代发生前,元素不会被消耗。这使得 zip()
特别内存效率。
当谈到 zip()
函数的内存效率时,关键在于它返回的是一个迭代器(iterator),而不是直接返回整个数据集合。这一点非常重要,因为它涉及到如何在内存中处理和存储数据。
迭代器和内存效率
迭代器是一种访问集合元素的方式,但它不会在内存中同时存储所有元素。相反,迭代器会一个接一个地生成元素,仅在迭代过程中才处理每个元素。这意味着,与直接生成并存储整个数据列表相比,使用迭代器可以显著减少内存的使用。
zip()
函数的工作原理
当使用 zip()
函数时,如果传入多个可迭代对象,zip()
会创建一个迭代器,这个迭代器会组合这些对象中相对应的元素形成一个个元组。关键点在于:
延迟计算:zip()
并不会预先计算出所有的元组。它仅在迭代到某个位置时,才会生成那个位置的元组。这就是所谓的“惰性计算”(lazy evaluation)。
内存使用:因为数据是按需生成的,zip()
在任何给定时间点不需要将所有组合的元组存储在内存中。这样可以避免在处理大量数据时占用大量内存。
实际例子
假设有两个非常大的列表,如果使用传统的方法(如列表推导或循环)来组合这些列表,将会创建一个包含所有组合的新列表,这需要足够的内存来一次性存储所有的元组。
list1 = range(1000000) # 大列表1
list2 = range(1000000, 2000000) # 大列表2# 传统方法,占用大量内存
combined_list = [(x, y) for x, y in zip(list1, list2)]
相比之下,使用 zip()
:
# 使用 zip() 创建迭代器
zipped = zip(list1, list2)# 可以逐个处理元组,不必存储整个组合列表
for item in zipped:process(item) # 处理每个元组
在第二种方法中,zipped
迭代器会一个接一个地生成每个元组,只有当前的元组会占用内存。这对于内存管理来说是非常有效的,特别是在处理大数据集时。
总之,zip()
通过生成迭代器来实现内存效率,使得即使是处理大规模数据集,也不会导致大量的内存消耗,这对于资源有限的环境非常关键。这种按需访问数据的方式也帮助程序员写出更加高效和可扩展的程序。
一次性使用:由于 zip()
返回的是一个迭代器,所以迭代过后,它将无法再次使用。
使用技巧
与 enumerate
结合使用
在处理数据时,往往不仅需要元素值,还需要元素的索引。结合使用 enumerate
和 zip
可以同时获得索引和来自多个序列的元素。下面是一个示例,展示如何在循环中同时获取索引和来自两个列表的元素:
names = ['Alice', 'Bob', 'Charlie']
ages = [25, 30, 35]
for index, (name, age) in enumerate(zip(names, ages)):print(f"Index {index}: {name} is {age} years old.")
输出:
Index 0: Alice is 25 years old.
Index 1: Bob is 30 years old.
Index 2: Charlie is 35 years old.
处理不等长序列的替代方法(需要处理不等长的序列而又不想在最短序列结束时停止,可以使用 itertools.zip_longest
方法)
如果需要处理不等长的序列而又不想在最短序列结束时停止,可以使用 itertools.zip_longest
方法。这个方法在 itertools
模块中,它允许用一个填充值填充短序列的缺失部分。例如:
from itertools import zip_longestnumbers = [1, 2, 3, 4, 5]
letters = ['a', 'b', 'c']
zipped_longest = zip_longest(numbers, letters, fillvalue='?')
print(list(zipped_longest))
输出:
[(1, 'a'), (2, 'b'), (3, 'c'), (4, '?'), (5, '?')]
与列表推导式结合
zip()
函数与列表推导式结合使用可以更加便捷地创建列表。这在数据处理和数据转换中尤为有用。例如,可以快速创建一个元组列表,每个元组包含不同列表中相应位置的元素:
numbers = [1, 2, 3, 4]
squares = [x**2 for x in numbers]
cubes = [x**3 for x in numbers]
combined = [(n, s, c) for n, s, c in zip(numbers, squares, cubes)]
print(combined)
输出:
[(1, 1, 1), (2, 4, 8), (3, 9, 27), (4, 16, 64)]
应用场景
数据科学中的应用
在数据科学和机器学习中,经常需要将多个数据集(通常是特征列表)组合起来进行进一步处理。zip()
函数在这种情况下非常有用,因为它可以轻松地将多个数据列表合并为一个列表,每个列表元素都是一个包含所有对应特征的元组。
多语言数据处理
在处理多语言文本数据时,zip()
同样非常有用。比如在翻译系统中,原始文本和翻译文本可能存储在两个列表中,使用 zip()
可以方便地将它们对齐,进而处理对应的文本对。
结论
zip()
是 Python 中一个强大而灵活的内置函数,适用于多种数据处理场景。它不仅能够简化代码,还能提高代码效率。在日常编程或数据处理工作中合理利用 zip()
可以大大提高开发效率和数据处理能力。
相关文章:

python zip()函数(将多个可迭代对象的元素配对,创建一个元组的迭代器)zip_longest()
文章目录 Python zip() 函数深入解析基本用法函数原型基础示例 处理不同长度的迭代器高级用法多个迭代器使用 zip() 与 dict()解压序列 注意事项内存效率:zip() 返回的是一个迭代器,这意味着直到迭代发生前,元素不会被消耗。这使得 zip() 特别…...
React.forwardRef 使用
React.forwardRef 是一个React提供的高阶组件函数,用于向函数组件传递ref。在函数组件中无法直接访问ref,如果需要在函数组件中操作子组件的DOM元素或组件实例,就可以使用React.forwardRef来转发ref给子组件。 当使用React.forwardRef包裹一…...
C# 中的值类型与引用类型:内存大小解析
在 C# 中,类型可以被归类为值类型或引用类型,它们在内存中的存储和管理方式不同。了解这些差异对于优化程序性能和资源管理至关重要。 值类型 (Value Types) 值类型包括所有内置的数值类型(如 int, double 等)、char 类型、bool…...
object对象列表使用sorted函数按照对象的某个字段排序
在Python中,如果你想要根据列表中对象的某个属性(比如create_time)来进行逆序排序,你可以使用sorted()函数并指定一个key参数。key参数应该是一个函数,该函数接受一个列表元素并返回一个用于排序的值。 假设你的objec…...

【再探】设计模式—中介者模式、观察者模式及模板方法模式
中介者模式让多对多的复杂引用关系变成一对多,同时能通过中间类来封装多个类中的行为,观察者模式在目标状态更新时能自动通知给订阅者,模版方法模式则是控制方法的执行顺序,子类在不改变算法的结构基础上可以扩展功能实现。 1 中…...

vue中使用svg图像
一 、svg图像是什么 SVG(可缩放矢量图形)是一种图像格式,它以XML文档的形式存在,用以描述图像中的形状、线条、文本和颜色等元素。由于其基于矢量的特性,SVG图像在放大或改变尺寸时能够保持图形质量不受影响。这种格式…...

Deconfounding Duration Bias in Watch-time Prediction for Video Recommendation
Abstract 观看时间预测仍然是通过视频推荐加强用户粘性的关键因素。然而,观看时间的预测不仅取决于用户与视频的匹配,而且经常被视频本身的持续时间所误导。为了提高观看时间,推荐总是偏向于长时间的视频。在这种不平衡的数据上训练的模型面…...
python多进程
python多进程的使用有两种方式: multiprocessingconcurrent的使用方式 multiprocessing的使用方式 定义线程池的数量开始处理,结果回调 下面以多进程下载图像为例: import multiprocessing import requests from io import BytesIO from…...
springboot 的yaml配置文件加密
springboot 的yaml配置文件加密 一、采用yaml 插件加密添加依赖创建启动类配置加密密钥加密需要加密的内容用过测试类编写加密的YAML配置解密配置可选:自定义配置扩展:修改ENC() 一、采用yaml 插件加密 使用Jasypt对Spring Boot的YAML配置文件进行加密是…...

npm发布、更新、删除包
如何将自己开发的依赖包发布到npmjs上供别人使用?五个步骤搞定! 实现步骤: 创建自己的工具包项目,进行开发。注册npmjs账号。执行npm login在控制台登录,填写用户信息。执行npm publish发布包。更新及删除。 步骤一…...

【JavaEE进阶】——Mybatis操作数据库(使用注解和XML方式)
目录 🚩三层架构 🎈JDBC操作回顾 🚩什么是MyBatis 🚩MyBatis⼊⻔ 🎈准备工作 📝创建⼯程 📝数据准备 🎈配置数据库连接字符串 🎈写持久层代码 🎈单…...

【数据结构】六种排序实现方法及区分比较
文章目录 前言插入排序希尔排序选择排序堆排序快速排序冒泡排序总结 前言 众所周知,存在许多种排序方法,作为新手,最新接触到的就是冒泡排序,这种排序方法具有较好的教学意义,但是实用意义不高,原因就在于…...
QT之QTableWidget详细介绍
本文来自于学习QT时遇到QTableWidget类时进行总结的知识点,涵盖了QTableWidget主要函数。本人文笔有限,欢迎大家评论区讨论。 一、QTableWidget介绍 QTableWidget 类是 Qt 框架中的一个用于展示和编辑二维表格数据的控件。它是对 QTableView 和 QStand…...

mac电脑安卓设备文件传输助手:MacDroid pro 中文激活版
MacDroid Pro是一款专为Mac电脑和Android设备设计的软件,旨在简化两者之间的文件传输和数据管理,双向文件传输:支持从Mac电脑向Android设备传输文件,也可以将Android设备上的文件轻松传输到Mac电脑上。完整的文件访问和管理&#…...

车流量监控系统
1.项目介绍 本文档是对于“车流量检测平台”的应用技术进行汇总,适用于此系统所有开发,测试以及使用人员,其中包括设计背景,应用场景,系统架构,技术分析,系统调度,环境依赖…...

LAMP集群分布式实验报告
前景: 1.技术成熟度和稳定性: LAMP架构(Linux、Apache、MySQL、PHP)自1998年提出以来,经过长时间的发展和完善,已经成为非常成熟和稳定的Web开发平台。其中,Linux操作系统因其高度的灵活性和稳…...
vue3中函数必须有返回值么?
在 Vue 3 中,特别是涉及到Composition API的使用时,setup() 函数确实必须有返回值。setup() 函数是组件的入口点,它的返回值会被用来决定哪些数据和方法是可被模板访问的。返回的对象中的属性和方法可以直接在模板中使用。如果setup()没有返回…...
经常用到的函数
创建文件夹和删除文件夹的函数 def make_dirs(*dirs):for new_dir in dirs:if not os.path.exists(new_dir):try:os.makedirs(new_dir)except RuntimeError:return Falsereturn Truedef remove_files(file_path_list):""" 删除列表中指定路径文件Args:file_pat…...

vue3学习(六)
前言 接上一篇学习笔记,今天主要是抽空学习了vue的状态管理,这里学习的是vuex,版本4.1。学习还没有学习完,里面有大坑,难怪现在官网出的状态管理用Pinia。 一、vuex状态管理知识点 上面的方式没有写全,还有…...

[数据集][目标检测]猫狗检测数据集VOC+YOLO格式8291张2类别
数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):8291 标注数量(xml文件个数):8291 标注数量(txt文件个数):8291 标注…...

UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)
UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中,UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化…...
React---day11
14.4 react-redux第三方库 提供connect、thunk之类的函数 以获取一个banner数据为例子 store: 我们在使用异步的时候理应是要使用中间件的,但是configureStore 已经自动集成了 redux-thunk,注意action里面要返回函数 import { configureS…...
高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数
高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...
scikit-learn机器学习
# 同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可: # Also add the following code, # so that every time the environment (kernel) starts, # just run the following code: import sys sys.path.append(/home/aistudio/external-libraries)机…...
比较数据迁移后MySQL数据库和OceanBase数据仓库中的表
设计一个MySQL数据库和OceanBase数据仓库的表数据比较的详细程序流程,两张表是相同的结构,都有整型主键id字段,需要每次从数据库分批取得2000条数据,用于比较,比较操作的同时可以再取2000条数据,等上一次比较完成之后,开始比较,直到比较完所有的数据。比较操作需要比较…...

pikachu靶场通关笔记19 SQL注入02-字符型注入(GET)
目录 一、SQL注入 二、字符型SQL注入 三、字符型注入与数字型注入 四、源码分析 五、渗透实战 1、渗透准备 2、SQL注入探测 (1)输入单引号 (2)万能注入语句 3、获取回显列orderby 4、获取数据库名database 5、获取表名…...

【Veristand】Veristand环境安装教程-Linux RT / Windows
首先声明,此教程是针对Simulink编译模型并导入Veristand中编写的,同时需要注意的是老用户编译可能用的是Veristand Model Framework,那个是历史版本,且NI不会再维护,新版本编译支持为VeriStand Model Generation Suppo…...

Python训练营-Day26-函数专题1:函数定义与参数
题目1:计算圆的面积 任务: 编写一个名为 calculate_circle_area 的函数,该函数接收圆的半径 radius 作为参数,并返回圆的面积。圆的面积 π * radius (可以使用 math.pi 作为 π 的值)要求:函数接收一个位置参数 radi…...

基于stm32F10x 系列微控制器的智能电子琴(附完整项目源码、详细接线及讲解视频)
注:文章末尾网盘链接中自取成品使用演示视频、项目源码、项目文档 所用硬件:STM32F103C8T6、无源蜂鸣器、44矩阵键盘、flash存储模块、OLED显示屏、RGB三色灯、面包板、杜邦线、usb转ttl串口 stm32f103c8t6 面包板 …...

RabbitMQ 各类交换机
为什么要用交换机? 交换机用来路由消息。如果直发队列,这个消息就被处理消失了,那别的队列也需要这个消息怎么办?那就要用到交换机 交换机类型 1,fanout:广播 特点 广播所有消息:将消息…...