当前位置: 首页 > news >正文

4个鲜为人知的Python迭代过滤函数

在Python中,迭代器可以帮助你编写更多Pythonic的代码,并在处理长序列时提高效率,内置的itertools模块提供了几个有用的函数来创建迭代器。

当你只需要遍历迭代器、检索序列中的元素并对其进行处理,而无需将它们存储在内存中时,这些函数尤其有用。今天本文将学习如何使用以下四个itertools过滤函数:filterfalse;takewhile;dropwhile;islice。

 我们将讨论的所有四个函数都返回了迭代器,为了清楚起见,本文将使用简单的序列,并使用list()获取包含迭代器返回的所有元素的列表。但在处理长序列时,除非必要,否则请不要这样做,因为这样做会失去迭代器带来的内存节省。

对于简单的谓词函数,也可以使用lambdas。但为了提高可读性,本文将定义常规函数并将它们用作谓词。

1. filterfalse

如果你在Python中编程已经有一段时间了,可能已经使用过内置的filter函数,语法如下:

filter(pred,seq)
# pred:谓词函数
# seq:任何有效的Python可迭代对象

filter函数返回一个迭代器,该迭代器返回谓词函数返回True的序列中的元素,示例如下:

nums = list(range(1,11)) #[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]def is_even(n):return n % 2 == 0

在这里,nums列表和is_even函数分别是序列和谓词。要获取nums中所有偶数的列表,需要使用如下所示的filter

nums_even = filter(is_even, nums)
print(list(nums_even))
Output >>> [2, 4, 6, 8, 10]

现在跟随本文来学习一下filterfalse。本文将从itertools模块中导入filterfalse函数(以及本文将要讨论的所有其他函数)。

正如其名称所示,filterfalse执行与filter函数相反的操作。它返回一个迭代器,该迭代器返回谓词返回False的元素。以下是使用filterfalse函数的语法:

from itertools import filterfalse
filterfalse(pred,seq)

is_even函数对于nums中的所有奇数返回False,因此,使用filterfalse得到的nums_odd列表是nums中所有奇数的列表:

from itertools import filterfalsenums_odd = filterfalse(is_even, nums)
print(list(nums_odd)) 
Output >>> [1, 3, 5, 7, 9]

2. takewhile

使用takewhile函数的语法如下:

from itertools import takewhile
takewhile(pred,seq)

takewhile函数返回了一个迭代器,只要谓词函数返回True,它就会返回元素。当谓词函数第一次返回False时,它就停止返回元素。

对于长度为n的序列,如果seq[k]是第一个使谓词函数返回False的元素,则迭代器会返回seq[0]seq[1]、...、seq[k-1]

考虑以下的nums列表和谓词函数is_less_than_5。本文使用takewhile函数,如下所示:

from itertools import takewhiledef is_less_than_5(n):return n < 5nums = [1, 3, 5, 2, 4, 6]
filtered_nums_1 = takewhile(is_less_than_5, nums)
print(list(filtered_nums_1)) 

在这里,谓词is_less_than_5对于数字5首次返回False

Output >>> [1, 3]

3. dropwhile

从功能上讲,dropwhile函数的作用与takewhile函数相反,以下是如何使用dropwhile函数的示例:

from itertools import dropwhile
dropwhile(pred,seq) 

dropwhile函数返回一个迭代器,只要谓词为True,该迭代器就会持续删除元素。也就是说,迭代器在谓词第一次返回False之前不返回任何元素。一旦谓词返回False,迭代器就会返回序列中的所有后续元素。

对于长度为n的序列,如果谓词函数第一次返回False的元素是seq[k],那么迭代器会返回seq[k]seq[k+1]、…、seq[n-1]

接下来使用相同的序列和谓词函数:

from itertools import dropwhiledef is_less_than_5(n):return n < 5nums = [1, 3, 5, 2, 4, 6]
filtered_nums_2 = dropwhile(is_less_than_5, nums)
print(list(filtered_nums_2)) 

由于谓词函数is_less_than_5第一次返回False是在元素5上,因此本文得到从5开始的序列中的所有元素:

Output >>> [5, 2, 4, 6]

4. islice

你可能已经熟悉了对Python可迭代对象(如列表、元组和字符串)进行切片操作。切片的语法是:iterable[start:stop:step]

然而,这种切片操作具有以下缺点:

  • 在处理大型序列时,每个切片或子序列都是一个占用内存的副本,这可能会降低效率。

  • 由于步长也可以取负值,使用起始、停止和步长值会影响可读性。

islice函数解决了上述限制:

  • 它返回一个迭代器。

  • 它不允许步长取负值。

可以按以下方式使用islice函数:

from itertools import islice
islice(seq,start,stop,step) 

下面是使用islice函数的几种不同方式:

  • 使用islice(seq, stop)函数返回一个迭代器,该迭代器遍历切片seq[0]seq[1]、...、seq[stop - 1]

  • 如果指定了起始和停止值:islice(seq, start, stop),该函数会返回一个迭代器,该迭代器遍历切片seq[start]seq[start + 1]、...、seq[start + stop - 1]

  • 当指定起始、停止和步长参数时,该函数返回一个迭代器,该迭代器遍历切片seq[start]seq[start + step]seq[start + 2*step]、...、seq[start + k*step],其中start + k*step < stopstart + (k+1)*step >= stop

接下来以一个示例列表来更好地理解这个问题:

nums = list(range(10)) #[0,1, 2, 3, 4, 5, 6, 7, 8, 9]

仅使用停止值

这里本文只指定停止索引:

from itertools import islice# 仅指定停止索引
sliced_nums = islice(nums, 5)
print(list(sliced_nums))

以下是输出结果:

Output >>> [0, 1, 2, 3, 4]

使用起始和停止值

在这里,本文同时使用起始值和停止值:

# 指定起始和停止索引
sliced_nums = islice(nums, 2, 7)
print(list(sliced_nums))

切片从索引2开始,一直延伸到索引7但不包括索引7:

Output >>> [2, 3, 4, 5, 6]

使用起始、停止和步长值

当本文使用起始、停止和步长值时:

# 使用起始、停止和步长
sliced_nums = islice(nums, 2, 8, 2)
print(list(sliced_nums))  

得到一个从索引2开始、一直延伸到索引8但不包括索引8的切片,步长为2(每隔一个元素返回一次))。

Output >>> [2, 4, 6]

综上,希望本文能帮助你理解itertools过滤函数的基础知识。通过查看一些简单的示例,可以更好地理解这些函数的工作原理。

相关文章:

4个鲜为人知的Python迭代过滤函数

在Python中&#xff0c;迭代器可以帮助你编写更多Pythonic的代码&#xff0c;并在处理长序列时提高效率&#xff0c;内置的itertools模块提供了几个有用的函数来创建迭代器。 当你只需要遍历迭代器、检索序列中的元素并对其进行处理&#xff0c;而无需将它们存储在内存中时&am…...

使用logger.error(“自定义错误信息描述“,e)将错误信息输出到日志文件上

之前一直用e.getMessage()来获取错误信息 import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController;RestController public class ClassF…...

音乐的数字未来:虚拟演唱会与TikTok的巅峰融合

在数字时代&#xff0c;音乐产业正在经历着革命性的变革。虚拟演唱会与TikTok的融合正引领着音乐的数字未来&#xff0c;为艺术家、粉丝和创作者带来了前所未有的互动性和娱乐体验。本文将深入探讨这一巅峰融合&#xff0c;以揭示音乐产业的新前景。 虚拟演唱会的崛起 虚拟演唱…...

基于图像识别的跌倒检测算法 计算机竞赛

前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于图像识别的跌倒检测算法 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c;学长非常推荐&#xff01; &#x1f9ff; 更多资料, 项目分享&#xff1a; https://gitee.com/dancheng-senior/…...

NSS [SWPUCTF 2021 新生赛]PseudoProtocols

NSS [SWPUCTF 2021 新生赛]PseudoProtocols 先看题目&#xff0c;题目要求我们先找到hint.php。 看这个get请求头&#xff0c;我们先用php://filter协议读一波 得到提示&#xff0c;让我们前往/test2222222222222.php 源码如下 <?php ini_set("max_execution_time&qu…...

字节码进阶之JVM Attach API详解

字节码进阶之JVM Attach API详解 文章目录 字节码进阶之JVM Attach API详解附加到虚拟机加载代理和获取信息分离虚拟机 使用Attach API的基本步骤1. **获取虚拟机实例**&#xff1a;2. **附加到虚拟机**&#xff1a;3. **加载代理或获取信息**4. **从虚拟机分离**&#xff1a;…...

Kubernetes 部署 kubeflow1.6.1

前言 安装前请注意捋清楚版本关系&#xff0c;如kubeflow版本对应的K8S版本及其相关工具版本等等 我们此处使用的是是kubeflow-1.6.1和K8s-v1.22.8 单机部署 部署K8S 初始化Linux 1.关闭selinux setenforce 0 && sed -i "s/SELINUXenforcing/SELINUXdisable…...

设计模式:建造者模式(C#、JAVA、JavaScript、C++、Python、Go、PHP)

上一篇《策略模式》 下一篇《适配器模式》 简介&#xff1a; 建造者模式&#xff0c;它是一种对象构建模式&#xff0c;它提供了一种构建对象的最佳方式。这种模式适用于当对象的构建过程需要涉及到多个部分&#xff…...

Maxon Cinema 4D 2024:打造独一无二的视觉效果 模拟模块大更新

在视觉效果和3D建模领域&#xff0c;Maxon的Cinema 4D一直以其卓越的性能和创新的功能引领着时代潮流。今天&#xff0c;我们很高兴地宣布推出最新版本——Maxon Cinema 4D 2024&#xff08;C4D 2024&#xff09;&#xff0c;它将再次提升行业标准&#xff0c;为设计师提供更强…...

16.2 ARP 主机探测技术

ARP &#xff08;Address Resolution Protocol&#xff0c;地址解析协议&#xff09;&#xff0c;是一种用于将 IP 地址转换为物理地址&#xff08;MAC地址&#xff09;的协议。它在 TCP/IP 协议栈中处于链路层&#xff0c;为了在局域网中能够正确传输数据包而设计&#xff0c;…...

三级等保-linux服务器三权分立设置

安全问题 安全控制点 风险分析 风险等级 标准要求 加固建议 服务器未严格按照系统管理员权限、审计管理员权限、安全管理员权限进行分配管理员账户&#xff0c;未实现管理员用户的最小权限划分。 访问控制 可能存在管理员越权操作的风险 中 d)应授予管理用户所需的最…...

抓取网页的含义和URL基本构成

抓取网页是指通过爬虫程序从互联网上获取网页的内容和数据。抓取网页是爬虫的核心功能之一&#xff0c;通过抓取网页&#xff0c;可以获取到网页中的文本、图片、链接等信息&#xff0c;用于后续的数据分析、挖掘和应用。 URL&#xff08;Uniform Resource Locator&#xff09…...

计算机毕业设计 机器学习深度学习人工智能

视频参考&#xff1a; 计算机毕业设计项目分享_哔哩哔哩_bilibili 基于深度学习的农业病虫害识别基于SpringBootVue的博客系统基于SpringBootVue的仓库管理系统基于卷积网络的花卉图像识别 毕业设计选题&#xff1a; VX:whbwqq123 基于机器学习的大气数据的污染物pm2.5预测基…...

施密特正交化

相信大家在平时的期末考试中一定少不了对某某向量组执行标准正交化类型的题目。今天我们从这个题目入手&#xff0c;说明这个如何执行施密特正交化&#xff0c;以及为什么要进行正交化。 一、例子 例子&#xff1a;设 a 1 [ 1 2 − 1 ] a_1\begin{bmatrix}1\\2\\-1\end{bmat…...

低代码开发:加速应用开发的利器

目录 一、引言 二、低代码开发的定义和原理 三、低代码开发的关键特性和优势 四、低代码开发的应用场景 五、低代码开发平台的市场现状和发展趋势 六、成功案例分析 七、结论 一、引言 随着信息技术的快速发展&#xff0c;企业对于应用开发的需求也日益增长。传统的应用…...

数据安全发展趋势与密码保护技术研究

随着数据跃升为新型生产要素&#xff0c;数据安全的内涵也从数据本身安全、数据资源安全&#xff0c;发展到数据资产安全三个层面提出了不同的要求&#xff0c;本文就是详细探讨数据安全的这三个层面的安全内容进行分析。 通过对数据安全不同发展阶段的安全需求和保障对象进行研…...

368周赛leetcode

1 2题元素和最小的山形三元组 经典动规 题目内容 给你一个下标从 0 开始的整数数组 nums 。 如果下标三元组 (i, j, k) 满足下述全部条件&#xff0c;则认为它是一个 山形三元组 &#xff1a; i < j < k nums[i] < nums[j] 且 nums[k] < nums[j] 请你找出 num…...

Vue 的 nextTick:深入理解异步更新机制

目录 一、前言 二、Vue.js 异步更新机制简述 三、Vue.nextTick原理 四、nextTick 的应用场景 1. 获取更新后的 DOM 元素 2. 在 DOM 更新后执行自定义的回调函数 3. 解决事件监听器中的更新问题 五、Vue.nextTick与其他异步更新方法的比较 六、总结 一、前言 Vue.js&a…...

SQL关于日期的计算合集

前言 在SQL Server中&#xff0c;时间和日期是常见的数据类型&#xff0c;也是数据处理中重要的一部分。SQL Server提供了许多内置函数&#xff0c;用于处理时间和日期数据类型。这些函数可以帮助我们执行各种常见的任务&#xff0c;例如从日期中提取特定的部分&#xff0c;计…...

shell_44.Linux使用 getopt 命令

使用 getopt 命令 getopt 命令在处理命令行选项和参数时非常方便。它能够识别命令行参数&#xff0c;简化解析过程 1. 命令格式 getopt 命令可以接受一系列任意形式的命令行选项和参数&#xff0c;并自动将其转换成适当的格式。 getopt 的命令格式如下&#xff1a; getopt opt…...

VB.net复制Ntag213卡写入UID

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?ftt&id615391857885 一、读取旧Ntag卡的UID和数据 Private Sub Button15_Click(sender As Object, e As EventArgs) Handles Button15.Click轻松读卡技术支持:网站:Dim i, j As IntegerDim cardidhex, …...

练习(含atoi的模拟实现,自定义类型等练习)

一、结构体大小的计算及位段 &#xff08;结构体大小计算及位段 详解请看&#xff1a;自定义类型&#xff1a;结构体进阶-CSDN博客&#xff09; 1.在32位系统环境&#xff0c;编译选项为4字节对齐&#xff0c;那么sizeof(A)和sizeof(B)是多少&#xff1f; #pragma pack(4)st…...

相机Camera日志实例分析之二:相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【关注我&#xff0c;后续持续新增专题博文&#xff0c;谢谢&#xff01;&#xff01;&#xff01;】 上一篇我们讲了&#xff1a; 这一篇我们开始讲&#xff1a; 目录 一、场景操作步骤 二、日志基础关键字分级如下 三、场景日志如下&#xff1a; 一、场景操作步骤 操作步…...

centos 7 部署awstats 网站访问检测

一、基础环境准备&#xff08;两种安装方式都要做&#xff09; bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

1.3 VSCode安装与环境配置

进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件&#xff0c;然后打开终端&#xff0c;进入下载文件夹&#xff0c;键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...

TRS收益互换:跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 &#xff08;一&#xff09;概念解析 TRS&#xff08;Total Return Swap&#xff09;收益互换是一种金融衍生工具&#xff0c;指交易双方约定在未来一定期限内&#xff0c;基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

零基础设计模式——行为型模式 - 责任链模式

第四部分&#xff1a;行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习&#xff01;行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。 核心思想&#xff1a;使多个对象都有机会处…...

工业自动化时代的精准装配革新:迁移科技3D视觉系统如何重塑机器人定位装配

AI3D视觉的工业赋能者 迁移科技成立于2017年&#xff0c;作为行业领先的3D工业相机及视觉系统供应商&#xff0c;累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成&#xff0c;通过稳定、易用、高回报的AI3D视觉系统&#xff0c;为汽车、新能源、金属制造等行…...

JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作

一、上下文切换 即使单核CPU也可以进行多线程执行代码&#xff0c;CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短&#xff0c;所以CPU会不断地切换线程执行&#xff0c;从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...

实现弹窗随键盘上移居中

实现弹窗随键盘上移的核心思路 在Android中&#xff0c;可以通过监听键盘的显示和隐藏事件&#xff0c;动态调整弹窗的位置。关键点在于获取键盘高度&#xff0c;并计算剩余屏幕空间以重新定位弹窗。 // 在Activity或Fragment中设置键盘监听 val rootView findViewById<V…...