4个鲜为人知的Python迭代过滤函数
在Python中,迭代器可以帮助你编写更多Pythonic的代码,并在处理长序列时提高效率,内置的itertools模块提供了几个有用的函数来创建迭代器。
当你只需要遍历迭代器、检索序列中的元素并对其进行处理,而无需将它们存储在内存中时,这些函数尤其有用。今天本文将学习如何使用以下四个itertools过滤函数:filterfalse;takewhile;dropwhile;islice。
我们将讨论的所有四个函数都返回了迭代器,为了清楚起见,本文将使用简单的序列,并使用list()获取包含迭代器返回的所有元素的列表。但在处理长序列时,除非必要,否则请不要这样做,因为这样做会失去迭代器带来的内存节省。
对于简单的谓词函数,也可以使用lambdas。但为了提高可读性,本文将定义常规函数并将它们用作谓词。
1. filterfalse
如果你在Python中编程已经有一段时间了,可能已经使用过内置的filter函数,语法如下:
filter(pred,seq)
# pred:谓词函数
# seq:任何有效的Python可迭代对象
filter函数返回一个迭代器,该迭代器返回谓词函数返回True的序列中的元素,示例如下:
nums = list(range(1,11)) #[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]def is_even(n):return n % 2 == 0
在这里,nums列表和is_even函数分别是序列和谓词。要获取nums中所有偶数的列表,需要使用如下所示的filter:
nums_even = filter(is_even, nums)
print(list(nums_even))
Output >>> [2, 4, 6, 8, 10]
现在跟随本文来学习一下filterfalse。本文将从itertools模块中导入filterfalse函数(以及本文将要讨论的所有其他函数)。
正如其名称所示,filterfalse执行与filter函数相反的操作。它返回一个迭代器,该迭代器返回谓词返回False的元素。以下是使用filterfalse函数的语法:
from itertools import filterfalse
filterfalse(pred,seq)
is_even函数对于nums中的所有奇数返回False,因此,使用filterfalse得到的nums_odd列表是nums中所有奇数的列表:
from itertools import filterfalsenums_odd = filterfalse(is_even, nums)
print(list(nums_odd))
Output >>> [1, 3, 5, 7, 9]
2. takewhile
使用takewhile函数的语法如下:
from itertools import takewhile
takewhile(pred,seq)
takewhile函数返回了一个迭代器,只要谓词函数返回True,它就会返回元素。当谓词函数第一次返回False时,它就停止返回元素。
对于长度为n的序列,如果seq[k]是第一个使谓词函数返回False的元素,则迭代器会返回seq[0]、seq[1]、...、seq[k-1]。
考虑以下的nums列表和谓词函数is_less_than_5。本文使用takewhile函数,如下所示:
from itertools import takewhiledef is_less_than_5(n):return n < 5nums = [1, 3, 5, 2, 4, 6]
filtered_nums_1 = takewhile(is_less_than_5, nums)
print(list(filtered_nums_1))
在这里,谓词is_less_than_5对于数字5首次返回False:
Output >>> [1, 3]
3. dropwhile
从功能上讲,dropwhile函数的作用与takewhile函数相反,以下是如何使用dropwhile函数的示例:
from itertools import dropwhile
dropwhile(pred,seq)
dropwhile函数返回一个迭代器,只要谓词为True,该迭代器就会持续删除元素。也就是说,迭代器在谓词第一次返回False之前不返回任何元素。一旦谓词返回False,迭代器就会返回序列中的所有后续元素。
对于长度为n的序列,如果谓词函数第一次返回False的元素是seq[k],那么迭代器会返回seq[k]、seq[k+1]、…、seq[n-1]。
接下来使用相同的序列和谓词函数:
from itertools import dropwhiledef is_less_than_5(n):return n < 5nums = [1, 3, 5, 2, 4, 6]
filtered_nums_2 = dropwhile(is_less_than_5, nums)
print(list(filtered_nums_2))
由于谓词函数is_less_than_5第一次返回False是在元素5上,因此本文得到从5开始的序列中的所有元素:
Output >>> [5, 2, 4, 6]
4. islice
你可能已经熟悉了对Python可迭代对象(如列表、元组和字符串)进行切片操作。切片的语法是:iterable[start:stop:step]。
然而,这种切片操作具有以下缺点:
-
在处理大型序列时,每个切片或子序列都是一个占用内存的副本,这可能会降低效率。
-
由于步长也可以取负值,使用起始、停止和步长值会影响可读性。
islice函数解决了上述限制:
-
它返回一个迭代器。
-
它不允许步长取负值。
可以按以下方式使用islice函数:
from itertools import islice
islice(seq,start,stop,step)
下面是使用islice函数的几种不同方式:
-
使用
islice(seq, stop)函数返回一个迭代器,该迭代器遍历切片seq[0]、seq[1]、...、seq[stop - 1]。 -
如果指定了起始和停止值:
islice(seq, start, stop),该函数会返回一个迭代器,该迭代器遍历切片seq[start]、seq[start + 1]、...、seq[start + stop - 1]。 -
当指定起始、停止和步长参数时,该函数返回一个迭代器,该迭代器遍历切片
seq[start]、seq[start + step]、seq[start + 2*step]、...、seq[start + k*step],其中start + k*step < stop且start + (k+1)*step >= stop。
接下来以一个示例列表来更好地理解这个问题:
nums = list(range(10)) #[0,1, 2, 3, 4, 5, 6, 7, 8, 9]
仅使用停止值
这里本文只指定停止索引:
from itertools import islice# 仅指定停止索引
sliced_nums = islice(nums, 5)
print(list(sliced_nums))
以下是输出结果:
Output >>> [0, 1, 2, 3, 4]
使用起始和停止值
在这里,本文同时使用起始值和停止值:
# 指定起始和停止索引
sliced_nums = islice(nums, 2, 7)
print(list(sliced_nums))
切片从索引2开始,一直延伸到索引7但不包括索引7:
Output >>> [2, 3, 4, 5, 6]
使用起始、停止和步长值
当本文使用起始、停止和步长值时:
# 使用起始、停止和步长
sliced_nums = islice(nums, 2, 8, 2)
print(list(sliced_nums))
得到一个从索引2开始、一直延伸到索引8但不包括索引8的切片,步长为2(每隔一个元素返回一次))。
Output >>> [2, 4, 6]
综上,希望本文能帮助你理解itertools过滤函数的基础知识。通过查看一些简单的示例,可以更好地理解这些函数的工作原理。
相关文章:
4个鲜为人知的Python迭代过滤函数
在Python中,迭代器可以帮助你编写更多Pythonic的代码,并在处理长序列时提高效率,内置的itertools模块提供了几个有用的函数来创建迭代器。 当你只需要遍历迭代器、检索序列中的元素并对其进行处理,而无需将它们存储在内存中时&am…...
使用logger.error(“自定义错误信息描述“,e)将错误信息输出到日志文件上
之前一直用e.getMessage()来获取错误信息 import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController;RestController public class ClassF…...
音乐的数字未来:虚拟演唱会与TikTok的巅峰融合
在数字时代,音乐产业正在经历着革命性的变革。虚拟演唱会与TikTok的融合正引领着音乐的数字未来,为艺术家、粉丝和创作者带来了前所未有的互动性和娱乐体验。本文将深入探讨这一巅峰融合,以揭示音乐产业的新前景。 虚拟演唱会的崛起 虚拟演唱…...
基于图像识别的跌倒检测算法 计算机竞赛
前言 🔥 优质竞赛项目系列,今天要分享的是 基于图像识别的跌倒检测算法 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/…...
NSS [SWPUCTF 2021 新生赛]PseudoProtocols
NSS [SWPUCTF 2021 新生赛]PseudoProtocols 先看题目,题目要求我们先找到hint.php。 看这个get请求头,我们先用php://filter协议读一波 得到提示,让我们前往/test2222222222222.php 源码如下 <?php ini_set("max_execution_time&qu…...
字节码进阶之JVM Attach API详解
字节码进阶之JVM Attach API详解 文章目录 字节码进阶之JVM Attach API详解附加到虚拟机加载代理和获取信息分离虚拟机 使用Attach API的基本步骤1. **获取虚拟机实例**:2. **附加到虚拟机**:3. **加载代理或获取信息**4. **从虚拟机分离**:…...
Kubernetes 部署 kubeflow1.6.1
前言 安装前请注意捋清楚版本关系,如kubeflow版本对应的K8S版本及其相关工具版本等等 我们此处使用的是是kubeflow-1.6.1和K8s-v1.22.8 单机部署 部署K8S 初始化Linux 1.关闭selinux setenforce 0 && sed -i "s/SELINUXenforcing/SELINUXdisable…...
设计模式:建造者模式(C#、JAVA、JavaScript、C++、Python、Go、PHP)
上一篇《策略模式》 下一篇《适配器模式》 简介: 建造者模式,它是一种对象构建模式,它提供了一种构建对象的最佳方式。这种模式适用于当对象的构建过程需要涉及到多个部分ÿ…...
Maxon Cinema 4D 2024:打造独一无二的视觉效果 模拟模块大更新
在视觉效果和3D建模领域,Maxon的Cinema 4D一直以其卓越的性能和创新的功能引领着时代潮流。今天,我们很高兴地宣布推出最新版本——Maxon Cinema 4D 2024(C4D 2024),它将再次提升行业标准,为设计师提供更强…...
16.2 ARP 主机探测技术
ARP (Address Resolution Protocol,地址解析协议),是一种用于将 IP 地址转换为物理地址(MAC地址)的协议。它在 TCP/IP 协议栈中处于链路层,为了在局域网中能够正确传输数据包而设计,…...
三级等保-linux服务器三权分立设置
安全问题 安全控制点 风险分析 风险等级 标准要求 加固建议 服务器未严格按照系统管理员权限、审计管理员权限、安全管理员权限进行分配管理员账户,未实现管理员用户的最小权限划分。 访问控制 可能存在管理员越权操作的风险 中 d)应授予管理用户所需的最…...
抓取网页的含义和URL基本构成
抓取网页是指通过爬虫程序从互联网上获取网页的内容和数据。抓取网页是爬虫的核心功能之一,通过抓取网页,可以获取到网页中的文本、图片、链接等信息,用于后续的数据分析、挖掘和应用。 URL(Uniform Resource Locator)…...
计算机毕业设计 机器学习深度学习人工智能
视频参考: 计算机毕业设计项目分享_哔哩哔哩_bilibili 基于深度学习的农业病虫害识别基于SpringBootVue的博客系统基于SpringBootVue的仓库管理系统基于卷积网络的花卉图像识别 毕业设计选题: VX:whbwqq123 基于机器学习的大气数据的污染物pm2.5预测基…...
施密特正交化
相信大家在平时的期末考试中一定少不了对某某向量组执行标准正交化类型的题目。今天我们从这个题目入手,说明这个如何执行施密特正交化,以及为什么要进行正交化。 一、例子 例子:设 a 1 [ 1 2 − 1 ] a_1\begin{bmatrix}1\\2\\-1\end{bmat…...
低代码开发:加速应用开发的利器
目录 一、引言 二、低代码开发的定义和原理 三、低代码开发的关键特性和优势 四、低代码开发的应用场景 五、低代码开发平台的市场现状和发展趋势 六、成功案例分析 七、结论 一、引言 随着信息技术的快速发展,企业对于应用开发的需求也日益增长。传统的应用…...
数据安全发展趋势与密码保护技术研究
随着数据跃升为新型生产要素,数据安全的内涵也从数据本身安全、数据资源安全,发展到数据资产安全三个层面提出了不同的要求,本文就是详细探讨数据安全的这三个层面的安全内容进行分析。 通过对数据安全不同发展阶段的安全需求和保障对象进行研…...
368周赛leetcode
1 2题元素和最小的山形三元组 经典动规 题目内容 给你一个下标从 0 开始的整数数组 nums 。 如果下标三元组 (i, j, k) 满足下述全部条件,则认为它是一个 山形三元组 : i < j < k nums[i] < nums[j] 且 nums[k] < nums[j] 请你找出 num…...
Vue 的 nextTick:深入理解异步更新机制
目录 一、前言 二、Vue.js 异步更新机制简述 三、Vue.nextTick原理 四、nextTick 的应用场景 1. 获取更新后的 DOM 元素 2. 在 DOM 更新后执行自定义的回调函数 3. 解决事件监听器中的更新问题 五、Vue.nextTick与其他异步更新方法的比较 六、总结 一、前言 Vue.js&a…...
SQL关于日期的计算合集
前言 在SQL Server中,时间和日期是常见的数据类型,也是数据处理中重要的一部分。SQL Server提供了许多内置函数,用于处理时间和日期数据类型。这些函数可以帮助我们执行各种常见的任务,例如从日期中提取特定的部分,计…...
shell_44.Linux使用 getopt 命令
使用 getopt 命令 getopt 命令在处理命令行选项和参数时非常方便。它能够识别命令行参数,简化解析过程 1. 命令格式 getopt 命令可以接受一系列任意形式的命令行选项和参数,并自动将其转换成适当的格式。 getopt 的命令格式如下: getopt opt…...
Lombok 的 @Data 注解失效,未生成 getter/setter 方法引发的HTTP 406 错误
HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误,它们的含义、原因和解决方法都有显著区别。以下是详细对比: 1. HTTP 406 (Not Acceptable) 含义: 客户端请求的内容类型与服务器支持的内容类型不匹…...
云计算——弹性云计算器(ECS)
弹性云服务器:ECS 概述 云计算重构了ICT系统,云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台,包含如下主要概念。 ECS(Elastic Cloud Server):即弹性云服务器,是云计算…...
遍历 Map 类型集合的方法汇总
1 方法一 先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...
【第二十一章 SDIO接口(SDIO)】
第二十一章 SDIO接口 目录 第二十一章 SDIO接口(SDIO) 1 SDIO 主要功能 2 SDIO 总线拓扑 3 SDIO 功能描述 3.1 SDIO 适配器 3.2 SDIOAHB 接口 4 卡功能描述 4.1 卡识别模式 4.2 卡复位 4.3 操作电压范围确认 4.4 卡识别过程 4.5 写数据块 4.6 读数据块 4.7 数据流…...
智能在线客服平台:数字化时代企业连接用户的 AI 中枢
随着互联网技术的飞速发展,消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁,不仅优化了客户体验,还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用,并…...
OkHttp 中实现断点续传 demo
在 OkHttp 中实现断点续传主要通过以下步骤完成,核心是利用 HTTP 协议的 Range 请求头指定下载范围: 实现原理 Range 请求头:向服务器请求文件的特定字节范围(如 Range: bytes1024-) 本地文件记录:保存已…...
.Net Framework 4/C# 关键字(非常用,持续更新...)
一、is 关键字 is 关键字用于检查对象是否于给定类型兼容,如果兼容将返回 true,如果不兼容则返回 false,在进行类型转换前,可以先使用 is 关键字判断对象是否与指定类型兼容,如果兼容才进行转换,这样的转换是安全的。 例如有:首先创建一个字符串对象,然后将字符串对象隐…...
Redis的发布订阅模式与专业的 MQ(如 Kafka, RabbitMQ)相比,优缺点是什么?适用于哪些场景?
Redis 的发布订阅(Pub/Sub)模式与专业的 MQ(Message Queue)如 Kafka、RabbitMQ 进行比较,核心的权衡点在于:简单与速度 vs. 可靠与功能。 下面我们详细展开对比。 Redis Pub/Sub 的核心特点 它是一个发后…...
Java求职者面试指南:Spring、Spring Boot、MyBatis框架与计算机基础问题解析
Java求职者面试指南:Spring、Spring Boot、MyBatis框架与计算机基础问题解析 一、第一轮提问(基础概念问题) 1. 请解释Spring框架的核心容器是什么?它在Spring中起到什么作用? Spring框架的核心容器是IoC容器&#…...
DingDing机器人群消息推送
文章目录 1 新建机器人2 API文档说明3 代码编写 1 新建机器人 点击群设置 下滑到群管理的机器人,点击进入 添加机器人 选择自定义Webhook服务 点击添加 设置安全设置,详见说明文档 成功后,记录Webhook 2 API文档说明 点击设置说明 查看自…...
