4个鲜为人知的Python迭代过滤函数
在Python中,迭代器可以帮助你编写更多Pythonic的代码,并在处理长序列时提高效率,内置的itertools
模块提供了几个有用的函数来创建迭代器。
当你只需要遍历迭代器、检索序列中的元素并对其进行处理,而无需将它们存储在内存中时,这些函数尤其有用。今天本文将学习如何使用以下四个itertools
过滤函数:filterfalse;takewhile;dropwhile;islice。
我们将讨论的所有四个函数都返回了迭代器,为了清楚起见,本文将使用简单的序列,并使用list()
获取包含迭代器返回的所有元素的列表。但在处理长序列时,除非必要,否则请不要这样做,因为这样做会失去迭代器带来的内存节省。
对于简单的谓词函数,也可以使用lambdas
。但为了提高可读性,本文将定义常规函数并将它们用作谓词。
1. filterfalse
如果你在Python中编程已经有一段时间了,可能已经使用过内置的filter
函数,语法如下:
filter(pred,seq)
# pred:谓词函数
# seq:任何有效的Python可迭代对象
filter
函数返回一个迭代器,该迭代器返回谓词函数返回True
的序列中的元素,示例如下:
nums = list(range(1,11)) #[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]def is_even(n):return n % 2 == 0
在这里,nums
列表和is_even
函数分别是序列和谓词。要获取nums
中所有偶数的列表,需要使用如下所示的filter
:
nums_even = filter(is_even, nums)
print(list(nums_even))
Output >>> [2, 4, 6, 8, 10]
现在跟随本文来学习一下filterfalse
。本文将从itertools
模块中导入filterfalse
函数(以及本文将要讨论的所有其他函数)。
正如其名称所示,filterfalse
执行与filter
函数相反的操作。它返回一个迭代器,该迭代器返回谓词返回False
的元素。以下是使用filterfalse
函数的语法:
from itertools import filterfalse
filterfalse(pred,seq)
is_even
函数对于nums
中的所有奇数返回False,
因此,使用filterfalse
得到的nums_odd
列表是nums
中所有奇数的列表:
from itertools import filterfalsenums_odd = filterfalse(is_even, nums)
print(list(nums_odd))
Output >>> [1, 3, 5, 7, 9]
2. takewhile
使用takewhile
函数的语法如下:
from itertools import takewhile
takewhile(pred,seq)
takewhile
函数返回了一个迭代器,只要谓词函数返回True
,它就会返回元素。当谓词函数第一次返回False
时,它就停止返回元素。
对于长度为n的序列,如果seq[k]
是第一个使谓词函数返回False
的元素,则迭代器会返回seq[0]
、seq[1]
、...、seq[k-1]
。
考虑以下的nums
列表和谓词函数is_less_than_5
。本文使用takewhile
函数,如下所示:
from itertools import takewhiledef is_less_than_5(n):return n < 5nums = [1, 3, 5, 2, 4, 6]
filtered_nums_1 = takewhile(is_less_than_5, nums)
print(list(filtered_nums_1))
在这里,谓词is_less_than_5
对于数字5
首次返回False
:
Output >>> [1, 3]
3. dropwhile
从功能上讲,dropwhile
函数的作用与takewhile
函数相反,以下是如何使用dropwhile
函数的示例:
from itertools import dropwhile
dropwhile(pred,seq)
dropwhile
函数返回一个迭代器,只要谓词为True
,该迭代器就会持续删除元素。也就是说,迭代器在谓词第一次返回False
之前不返回任何元素。一旦谓词返回False
,迭代器就会返回序列中的所有后续元素。
对于长度为n的序列,如果谓词函数第一次返回False
的元素是seq[k]
,那么迭代器会返回seq[k]
、seq[k+1]
、…、seq[n-1]
。
接下来使用相同的序列和谓词函数:
from itertools import dropwhiledef is_less_than_5(n):return n < 5nums = [1, 3, 5, 2, 4, 6]
filtered_nums_2 = dropwhile(is_less_than_5, nums)
print(list(filtered_nums_2))
由于谓词函数is_less_than_5
第一次返回False
是在元素5上,因此本文得到从5开始的序列中的所有元素:
Output >>> [5, 2, 4, 6]
4. islice
你可能已经熟悉了对Python可迭代对象(如列表、元组和字符串)进行切片操作。切片的语法是:iterable[start:stop:step]
。
然而,这种切片操作具有以下缺点:
-
在处理大型序列时,每个切片或子序列都是一个占用内存的副本,这可能会降低效率。
-
由于步长也可以取负值,使用起始、停止和步长值会影响可读性。
islice
函数解决了上述限制:
-
它返回一个迭代器。
-
它不允许步长取负值。
可以按以下方式使用islice
函数:
from itertools import islice
islice(seq,start,stop,step)
下面是使用islice
函数的几种不同方式:
-
使用
islice(seq, stop)
函数返回一个迭代器,该迭代器遍历切片seq[0]
、seq[1]
、...、seq[stop - 1]
。 -
如果指定了起始和停止值:
islice(seq, start, stop)
,该函数会返回一个迭代器,该迭代器遍历切片seq[start]
、seq[start + 1]
、...、seq[start + stop - 1]
。 -
当指定起始、停止和步长参数时,该函数返回一个迭代器,该迭代器遍历切片
seq[start]
、seq[start + step]
、seq[start + 2*step]
、...、seq[start + k*step]
,其中start + k*step < stop
且start + (k+1)*step >= stop
。
接下来以一个示例列表来更好地理解这个问题:
nums = list(range(10)) #[0,1, 2, 3, 4, 5, 6, 7, 8, 9]
仅使用停止值
这里本文只指定停止索引:
from itertools import islice# 仅指定停止索引
sliced_nums = islice(nums, 5)
print(list(sliced_nums))
以下是输出结果:
Output >>> [0, 1, 2, 3, 4]
使用起始和停止值
在这里,本文同时使用起始值和停止值:
# 指定起始和停止索引
sliced_nums = islice(nums, 2, 7)
print(list(sliced_nums))
切片从索引2开始,一直延伸到索引7但不包括索引7:
Output >>> [2, 3, 4, 5, 6]
使用起始、停止和步长值
当本文使用起始、停止和步长值时:
# 使用起始、停止和步长
sliced_nums = islice(nums, 2, 8, 2)
print(list(sliced_nums))
得到一个从索引2开始、一直延伸到索引8但不包括索引8的切片,步长为2(每隔一个元素返回一次))。
Output >>> [2, 4, 6]
综上,希望本文能帮助你理解itertools
过滤函数的基础知识。通过查看一些简单的示例,可以更好地理解这些函数的工作原理。
相关文章:
4个鲜为人知的Python迭代过滤函数
在Python中,迭代器可以帮助你编写更多Pythonic的代码,并在处理长序列时提高效率,内置的itertools模块提供了几个有用的函数来创建迭代器。 当你只需要遍历迭代器、检索序列中的元素并对其进行处理,而无需将它们存储在内存中时&am…...

使用logger.error(“自定义错误信息描述“,e)将错误信息输出到日志文件上
之前一直用e.getMessage()来获取错误信息 import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController;RestController public class ClassF…...

音乐的数字未来:虚拟演唱会与TikTok的巅峰融合
在数字时代,音乐产业正在经历着革命性的变革。虚拟演唱会与TikTok的融合正引领着音乐的数字未来,为艺术家、粉丝和创作者带来了前所未有的互动性和娱乐体验。本文将深入探讨这一巅峰融合,以揭示音乐产业的新前景。 虚拟演唱会的崛起 虚拟演唱…...

基于图像识别的跌倒检测算法 计算机竞赛
前言 🔥 优质竞赛项目系列,今天要分享的是 基于图像识别的跌倒检测算法 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/…...

NSS [SWPUCTF 2021 新生赛]PseudoProtocols
NSS [SWPUCTF 2021 新生赛]PseudoProtocols 先看题目,题目要求我们先找到hint.php。 看这个get请求头,我们先用php://filter协议读一波 得到提示,让我们前往/test2222222222222.php 源码如下 <?php ini_set("max_execution_time&qu…...

字节码进阶之JVM Attach API详解
字节码进阶之JVM Attach API详解 文章目录 字节码进阶之JVM Attach API详解附加到虚拟机加载代理和获取信息分离虚拟机 使用Attach API的基本步骤1. **获取虚拟机实例**:2. **附加到虚拟机**:3. **加载代理或获取信息**4. **从虚拟机分离**:…...

Kubernetes 部署 kubeflow1.6.1
前言 安装前请注意捋清楚版本关系,如kubeflow版本对应的K8S版本及其相关工具版本等等 我们此处使用的是是kubeflow-1.6.1和K8s-v1.22.8 单机部署 部署K8S 初始化Linux 1.关闭selinux setenforce 0 && sed -i "s/SELINUXenforcing/SELINUXdisable…...

设计模式:建造者模式(C#、JAVA、JavaScript、C++、Python、Go、PHP)
上一篇《策略模式》 下一篇《适配器模式》 简介: 建造者模式,它是一种对象构建模式,它提供了一种构建对象的最佳方式。这种模式适用于当对象的构建过程需要涉及到多个部分ÿ…...
Maxon Cinema 4D 2024:打造独一无二的视觉效果 模拟模块大更新
在视觉效果和3D建模领域,Maxon的Cinema 4D一直以其卓越的性能和创新的功能引领着时代潮流。今天,我们很高兴地宣布推出最新版本——Maxon Cinema 4D 2024(C4D 2024),它将再次提升行业标准,为设计师提供更强…...

16.2 ARP 主机探测技术
ARP (Address Resolution Protocol,地址解析协议),是一种用于将 IP 地址转换为物理地址(MAC地址)的协议。它在 TCP/IP 协议栈中处于链路层,为了在局域网中能够正确传输数据包而设计,…...

三级等保-linux服务器三权分立设置
安全问题 安全控制点 风险分析 风险等级 标准要求 加固建议 服务器未严格按照系统管理员权限、审计管理员权限、安全管理员权限进行分配管理员账户,未实现管理员用户的最小权限划分。 访问控制 可能存在管理员越权操作的风险 中 d)应授予管理用户所需的最…...

抓取网页的含义和URL基本构成
抓取网页是指通过爬虫程序从互联网上获取网页的内容和数据。抓取网页是爬虫的核心功能之一,通过抓取网页,可以获取到网页中的文本、图片、链接等信息,用于后续的数据分析、挖掘和应用。 URL(Uniform Resource Locator)…...
计算机毕业设计 机器学习深度学习人工智能
视频参考: 计算机毕业设计项目分享_哔哩哔哩_bilibili 基于深度学习的农业病虫害识别基于SpringBootVue的博客系统基于SpringBootVue的仓库管理系统基于卷积网络的花卉图像识别 毕业设计选题: VX:whbwqq123 基于机器学习的大气数据的污染物pm2.5预测基…...

施密特正交化
相信大家在平时的期末考试中一定少不了对某某向量组执行标准正交化类型的题目。今天我们从这个题目入手,说明这个如何执行施密特正交化,以及为什么要进行正交化。 一、例子 例子:设 a 1 [ 1 2 − 1 ] a_1\begin{bmatrix}1\\2\\-1\end{bmat…...
低代码开发:加速应用开发的利器
目录 一、引言 二、低代码开发的定义和原理 三、低代码开发的关键特性和优势 四、低代码开发的应用场景 五、低代码开发平台的市场现状和发展趋势 六、成功案例分析 七、结论 一、引言 随着信息技术的快速发展,企业对于应用开发的需求也日益增长。传统的应用…...

数据安全发展趋势与密码保护技术研究
随着数据跃升为新型生产要素,数据安全的内涵也从数据本身安全、数据资源安全,发展到数据资产安全三个层面提出了不同的要求,本文就是详细探讨数据安全的这三个层面的安全内容进行分析。 通过对数据安全不同发展阶段的安全需求和保障对象进行研…...
368周赛leetcode
1 2题元素和最小的山形三元组 经典动规 题目内容 给你一个下标从 0 开始的整数数组 nums 。 如果下标三元组 (i, j, k) 满足下述全部条件,则认为它是一个 山形三元组 : i < j < k nums[i] < nums[j] 且 nums[k] < nums[j] 请你找出 num…...
Vue 的 nextTick:深入理解异步更新机制
目录 一、前言 二、Vue.js 异步更新机制简述 三、Vue.nextTick原理 四、nextTick 的应用场景 1. 获取更新后的 DOM 元素 2. 在 DOM 更新后执行自定义的回调函数 3. 解决事件监听器中的更新问题 五、Vue.nextTick与其他异步更新方法的比较 六、总结 一、前言 Vue.js&a…...

SQL关于日期的计算合集
前言 在SQL Server中,时间和日期是常见的数据类型,也是数据处理中重要的一部分。SQL Server提供了许多内置函数,用于处理时间和日期数据类型。这些函数可以帮助我们执行各种常见的任务,例如从日期中提取特定的部分,计…...
shell_44.Linux使用 getopt 命令
使用 getopt 命令 getopt 命令在处理命令行选项和参数时非常方便。它能够识别命令行参数,简化解析过程 1. 命令格式 getopt 命令可以接受一系列任意形式的命令行选项和参数,并自动将其转换成适当的格式。 getopt 的命令格式如下: getopt opt…...
golang循环变量捕获问题
在 Go 语言中,当在循环中启动协程(goroutine)时,如果在协程闭包中直接引用循环变量,可能会遇到一个常见的陷阱 - 循环变量捕获问题。让我详细解释一下: 问题背景 看这个代码片段: fo…...
Go 语言接口详解
Go 语言接口详解 核心概念 接口定义 在 Go 语言中,接口是一种抽象类型,它定义了一组方法的集合: // 定义接口 type Shape interface {Area() float64Perimeter() float64 } 接口实现 Go 接口的实现是隐式的: // 矩形结构体…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...
Java - Mysql数据类型对应
Mysql数据类型java数据类型备注整型INT/INTEGERint / java.lang.Integer–BIGINTlong/java.lang.Long–––浮点型FLOATfloat/java.lang.FloatDOUBLEdouble/java.lang.Double–DECIMAL/NUMERICjava.math.BigDecimal字符串型CHARjava.lang.String固定长度字符串VARCHARjava.lang…...

【2025年】解决Burpsuite抓不到https包的问题
环境:windows11 burpsuite:2025.5 在抓取https网站时,burpsuite抓取不到https数据包,只显示: 解决该问题只需如下三个步骤: 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...
Java + Spring Boot + Mybatis 实现批量插入
在 Java 中使用 Spring Boot 和 MyBatis 实现批量插入可以通过以下步骤完成。这里提供两种常用方法:使用 MyBatis 的 <foreach> 标签和批处理模式(ExecutorType.BATCH)。 方法一:使用 XML 的 <foreach> 标签ÿ…...
MySQL 8.0 事务全面讲解
以下是一个结合两次回答的 MySQL 8.0 事务全面讲解,涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容,并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解 一、事务的核心概念(ACID) 事务是…...

计算机基础知识解析:从应用到架构的全面拆解
目录 前言 1、 计算机的应用领域:无处不在的数字助手 2、 计算机的进化史:从算盘到量子计算 3、计算机的分类:不止 “台式机和笔记本” 4、计算机的组件:硬件与软件的协同 4.1 硬件:五大核心部件 4.2 软件&#…...

HubSpot推出与ChatGPT的深度集成引发兴奋与担忧
上周三,HubSpot宣布已构建与ChatGPT的深度集成,这一消息在HubSpot用户和营销技术观察者中引发了极大的兴奋,但同时也存在一些关于数据安全的担忧。 许多网络声音声称,这对SaaS应用程序和人工智能而言是一场范式转变。 但向任何技…...

在 Spring Boot 中使用 JSP
jsp? 好多年没用了。重新整一下 还费了点时间,记录一下。 项目结构: pom: <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://ww…...