玩转python:通俗易懂掌握高级数据结构-collections模块之Counter
引言
Counter是Python中collections模块提供的一个强大工具,用于统计可哈希对象的出现次数。它非常适合用于频率统计、词频分析、数据聚合等场景。本文将详细介绍Counter的关键用法和特性,并通过8个丰富的案例帮助读者掌握其应用。
关键用法和特性表格
| 特性/方法 | 描述 |
|---|---|
| 统计频率 | 快速统计可哈希对象的出现次数。 |
| 字典子类 | Counter是dict的子类,支持所有字典操作。 |
| 初始化 | 使用Counter(iterable)或Counter(mapping)创建。 |
elements() | 返回一个迭代器,包含所有元素(按出现次数重复)。 |
most_common(n) | 返回出现次数最多的n个元素及其计数。 |
update(iterable) | 更新计数器,增加元素的计数。 |
subtract(iterable) | 更新计数器,减少元素的计数。 |
| 算术操作 | 支持加法(+)、减法(-)、交集(&)、并集(|)操作。 |
1. Counter的概念
Counter是collections模块中的一个类,用于统计可哈希对象的出现次数。它的主要特点是:
- 统计频率:快速统计元素的出现次数。
- 字典子类:支持所有字典操作,如键值访问、更新等。
- 高效性能:统计和更新操作的时间复杂度为O(1)。
2. Counter的用法
2.1 创建Counter
from collections import Counter# 从列表创建Counter
c = Counter(['apple', 'banana', 'apple', 'orange', 'banana', 'apple'])
print(c) # 输出: Counter({'apple': 3, 'banana': 2, 'orange': 1})# 从字符串创建Counter
c = Counter('abracadabra')
print(c) # 输出: Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})
2.2 访问元素计数
# 访问元素的计数
print(c['a']) # 输出: 5
print(c['z']) # 输出: 0(不存在时返回0)
2.3 更新计数器
# 更新计数器
c.update(['a', 'b', 'a'])
print(c) # 输出: Counter({'a': 7, 'b': 3, 'r': 2, 'c': 1, 'd': 1})
3. Counter的常见方法
3.1 elements():返回所有元素
# 返回所有元素(按计数重复)
print(list(c.elements())) # 输出: ['a', 'a', 'a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'r', 'r', 'c', 'd']
3.2 most_common(n):返回最常见的元素
# 返回最常见的2个元素
print(c.most_common(2)) # 输出: [('a', 7), ('b', 3)]
3.3 subtract(iterable):减少元素计数
# 减少元素计数
c.subtract(['a', 'b', 'a'])
print(c) # 输出: Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})
3.4 算术操作
# 加法操作
c1 = Counter(['a', 'b', 'a'])
c2 = Counter(['b', 'c', 'b'])
print(c1 + c2) # 输出: Counter({'a': 2, 'b': 3, 'c': 1})# 交集操作
print(c1 & c2) # 输出: Counter({'b': 1})
4. Counter的8个应用案例
案例1:统计词频
# 统计一段文本的词频
text = "Python is great. Python is easy. Python is powerful."
words = text.split()
word_count = Counter(words)
print(word_count) # 输出: Counter({'Python': 3, 'is': 3, 'great.': 1, 'easy.': 1, 'powerful.': 1})
案例2:统计字符频率
# 统计字符串中字符的频率
s = "abracadabra"
char_count = Counter(s)
print(char_count) # 输出: Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})
案例3:找出最常见的元素
# 找出列表中最常见的元素
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
c = Counter(data)
print(c.most_common(2)) # 输出: [(4, 4), (3, 3)]
案例4:统计文件中的单词频率
# 统计文件中单词的频率
with open('example.txt', 'r') as file:words = file.read().split()word_count = Counter(words)print(word_count.most_common(5)) # 输出文件中出现频率最高的5个单词
案例5:数据聚合
# 统计多个数据集的聚合结果
data1 = ['apple', 'banana', 'apple']
data2 = ['banana', 'orange', 'banana']
c1 = Counter(data1)
c2 = Counter(data2)
combined = c1 + c2
print(combined) # 输出: Counter({'banana': 3, 'apple': 2, 'orange': 1})
案例6:统计投票结果
# 统计投票结果
votes = ['Alice', 'Bob', 'Alice', 'Charlie', 'Bob', 'Alice']
vote_count = Counter(votes)
print(vote_count.most_common(1)) # 输出: [('Alice', 3)]
案例7:统计列表中元素的频率
# 统计列表中元素的频率
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
c = Counter(data)
print(c) # 输出: Counter({4: 4, 3: 3, 2: 2, 1: 1})
案例8:统计多个计数器的交集
# 统计多个计数器的交集
c1 = Counter(['a', 'b', 'a'])
c2 = Counter(['b', 'c', 'b'])
print(c1 & c2) # 输出: Counter({'b': 1})
总结
Counter是Python中一个非常实用的工具,能够快速统计元素的出现次数,并支持丰富的操作。通过本文的详细讲解和8个实际案例,读者可以快速掌握Counter的使用方法,并在实际项目中灵活应用。无论是词频统计、数据聚合,还是投票分析,Counter都能轻松应对!
相关文章:
玩转python:通俗易懂掌握高级数据结构-collections模块之Counter
引言 Counter是Python中collections模块提供的一个强大工具,用于统计可哈希对象的出现次数。它非常适合用于频率统计、词频分析、数据聚合等场景。本文将详细介绍Counter的关键用法和特性,并通过8个丰富的案例帮助读者掌握其应用。 关键用法和特性表格 …...
Windows远程桌面黑屏怎么办?
在使用Windows远程桌面连接另一台电脑时,用户经常会遇到Windows远程桌面黑屏的问题。那么,该如何有效地解决Windows远程桌面黑屏的问题呢?遇到远程桌面连接黑屏的问题时,可以通过在本地组策略编辑器中禁用WDDM图形显示驱动来解决。…...
82.HarmonyOS NEXT 性能优化指南:从理论到实践
温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! HarmonyOS NEXT 性能优化指南:从理论到实践 文章目录 HarmonyOS NEXT 性能优化指南:从理论到实践1. 性能优化概述1.1 性能指…...
python笔记2
变量:含义 一个容器,计算机当中的存储空间。 可以理解为一个用于标识或引用数据的名字或标签。 作用: 可以通过定义一个变量来给需要使用多次的数据命名,就像一个标签一样。下次需要使用这个数据时,只需要通过这个变…...
深度学习 Deep Learning 第1章 深度学习简介
第1章 深度学习简介 概述 本章介绍人工智能(AI)和深度学习领域,讨论其历史发展、关键概念和应用。解释深度学习如何从早期的AI和机器学习方法演变而来,以及如何有效解决之前方法无法应对的挑战。 关键概念 1. 人工智能的演变 …...
Nest系列:NestJS 中 Logger 完全指南:从基础到企业级实践-04
一、Logger 的核心价值 在服务端应用中,日志系统承担着三大核心职责: 系统监控:实时反馈应用健康状态问题追踪:快速定位异常根源行为审计:记录关键业务操作NestJS 内置的日志系统提供了开箱即用的解决方案,支持: ✅ 多日志级别管理 ✅ 上下文感知日志 ✅ 自定义输出格式…...
机器学习 [白板推导](二)[线性回归]
3. 线性回归 3.1. 问题定义 假设两个变量 x ⃗ \vec{x} x 和 y y y 之间存在线性关系(例如 y w ⃗ T x ⃗ b y\vec{w}^T\vec{x}b yw Tx b),如何利用数据 D a t a : { ( x ⃗ i , y i ) } i 1 N Data:\{(\vec{x}_i,y_i)\}_{i1}^N Data…...
解决Windows版Redis无法远程连接的问题
🌟 解决Windows版Redis无法远程连接的问题 在Windows系统下使用Redis时,很多用户会遇到无法远程连接的问题。尤其是在配置了Redis并尝试通过工具如RedisDesktopManager连接时,可能会报错“Cannot connect to ‘redisconnection’”。今天&am…...
麒麟服务器操作系统Sqlite部署手册
软件简介 SQLite****介绍 SQLite是一个进程内的轻量级嵌入式数据库,它的数据库就是一个文件,实现了自给自足、无服务器、零配置的、事务性的SQL数据库引擎。它是一个零配置的数据库,这就体现出来SQLite与其他数据库的最大的区别:SQLite不需要在系统中配置,直接可以使用。…...
Qt C++ 常用压缩库推荐 快速压缩 解压缩数据
在Qt C中,如果你需要快速压缩和解压缩数据,可以使用以下几种库: 1. zlib 简介: zlib 是一个非常流行的压缩库,支持 DEFLATE 压缩算法。它被广泛用于各种应用程序中,包括Qt。 集成: Qt 本身已经集成了 zlib࿰…...
架构师面试(十五):熔断设计
问题 某电商平台经常需要在大促运营活动中暂停评论、退款等业务,基于服务治理的设计理念,我们需要对该电商平台微服务系统的【服务熔断】进行设计,对此下面描述中说法正确的有哪几项呢? A. 服务管控系统管理着平台中所有服务之间…...
解析GNGGA数据,C语言单片机
GPS模块的一帧数据是: $GNGGA,130333.000,4143.43651,N,12328.96485,E,1,14,1.2,93.1,M,0.0,M,,*45 $GNGLL,4143.43651,N,12328.96485,E,130333.000,A,A*4D $GPGSA,A,3,05,07,11,13,20,29,30,195,,,,,2.3,1.2,2.0*05 $BDGSA,A,3,08,13,28,33,38,42,,,,,,,2.3,1.2,2.0*2E $GPG…...
Navicat如何查看密码
近期遇到需要将大部分已存储的navicat数据库转发给其他人,于是乎进行导出文件 奈何对方不用navicat,无法进行文件的导入从而导入链接 搜罗navicat的密码查看,大部分都为php代码解析 以下转载GitHub上看到的一个python代码解析的脚本 这里是对…...
力扣143重排链表
143. 重排链表 给定一个单链表 L 的头节点 head ,单链表 L 表示为: L0 → L1 → … → Ln - 1 → Ln 请将其重新排列后变为: L0 → Ln → L1 → Ln - 1 → L2 → Ln - 2 → … 不能只是单纯的改变节点内部的值,而是需要实际的…...
【GPT入门】第24课 langfuse介绍
【GPT入门】第24课 langfuse介绍 1. langfuse概念与作用2. 代码3. 页面效果4. 设计模式1. 装饰器模式2. 上下文管理模式1. langfuse概念与作用 Langfuse是一款专为大规模语言模型(LLM)应用开发设计的开源平台。其作用主要包括以下几个方面: 提升开发效率:通过消除LLM应用构…...
HarmonyOS NEXT个人开发经验总结
文章目录 1. 开发环境配置1.1 工具链安装流程1.2 环境配置代码 2. 项目架构设计2.1 分层架构图2.2 模块化配置 3. 核心开发实践3.1 声明式UI开发3.2 分布式数据管理 4. 性能优化策略4.1 性能优化流程图4.2 优化实践代码 5. 安全与权限管理5.1 权限申请流程5.2 安全存储示例 6. …...
Python基于深度学习的多模态人脸情绪识别研究与实现
一、系统架构设计 A[数据采集] --> B[预处理模块] B --> C[特征提取] C --> D[多模态融合] D --> E[情绪分类] E --> F[系统部署] F --> G[用户界面] 二、数据准备与处理 1. 数据收集 - 视频数据:FER2013(静态图像࿰…...
golang快速上手基础语法
变量 第一种,指定变量类型,声明后若不赋值,使用默认值0 package mainimport "fmt"func main() {var a int //第一种,指定变量类型,声明后若不赋值,使用默认值0。fmt.Printf(" a %d\n"…...
【MySQL】多表操作 —— 外键约束
目录 多表关系一对一关系一对多/多对一关系多对多关系 外键约束基本概念一对多/多对一创建外键约束外键约束下的数据操作数据插入数据删除 删除外键约束 多对多创建外键约束外键约束下的数据操作数据插入数据删除 删除外键约束 多表关系 MySQL 多表之间的关系可以概括为&#…...
⭐算法OJ⭐两数之和【哈希表】(C++ 实现)Two Sum
“两数之和”(Two Sum)是一道非常经典的算法题目,几乎是算法入门和面试准备的必做题之一。它的经典性体现在以下几个方面: 1. 算法入门的基础题目 这道题目是许多初学者接触 哈希表(Hash Table) 或 字典&…...
从被动响应到主动预见:智能可观测性技术的变革与实践
思维导图 一、引言 🌃 想象一下,在一个深夜 🌙,你的关键业务系统突然出现故障 🚨。传统情况下,你可能会收到大量不相关的告警 📱💬💬💬,然后花费数小时甚至数天时间 ⏳,在错综复杂的系统架构中寻找根本原因 🔍。而在智能可观测性的世界里,故障发生前系统…...
【GPT入门】第22课 langchain LCEL介绍
【GPT入门】第22课 langchain LCEL介绍 1. LCEL介绍与特点2. 原生API与LCEL的对比2. 简单demo 1. LCEL介绍与特点 LCEL 即 LangChain Expression Language,是 LangChain 推出的一种声明式语言,用于简化和优化在 LangChain 框架内构建复杂链和应用的过程…...
LeetCode1005☞K次取反后最大的数组和
关联LeetCode题号1005 本题特点 贪心:局部最优解:将负数取反得到比原值大的值,进而全局最优解整体和为最大二次贪心: 如果取反次数大于负数个数,那么剩下次数如果为奇数,那么就将绝对值最小的数取反(贪心…...
7、基于osg引擎实现读取vtk数据通过着色器实现简单体渲染(1)
基于光线投射原理实现的体渲染 一、什么是体绘制?二、为什么不直接用3D模型渲染三、原理及部分代码解析1、什么是光线?2、什么是光线投射?3、为什么需要光线投射3D纹理?4、为什么必须是3D纹理?5、为什么还需要1D纹理&a…...
二、vtkCommand的使用
一、概述 vtkCommand是VTK中的一个重要的类,用于处理事件和回调机制。它允许用户在特定事件发生时执行自定义的操作,例如在交互操作、数据更新或渲染过程中触发某些功能。 二、主要功能 1、事件处理:vtkCommand用于监听和处理VTK管线中的各…...
Git的详细使用方法
Git 是一个分布式版本控制系统,用于跟踪和管理代码的变更。以下是 Git 的详细使用方法: 1. 安装 Git Windows:从 Git 官网 下载安装包。 Linux(Ubuntu/Debian) sudo apt install git macOS: 使用 Homebr…...
在 Windows 上使用 choco 安装 mkcert 并配置 Vue 运行HTTPS
解决在Windows上使用Vue本地运行HTTPS的问题,vue-cli或vite都可以使用 步骤 1:确认 Chocolatey 是否已安装 1. 检查 choco 命令是否可用 打开 PowerShell(管理员权限),输入: choco -v如果显示版本号(如…...
spring声明式事务原理01-调用第1层@Transactional方法(事务访问入口)
文章目录 【README】【步骤1】UserAppService调用userSupport.saveNewUser()【步骤2】获取到TransactionInterceptor【步骤3】chain不为空,接着执行CglibMethodInvocation#proceed方法【补充】AopContext作用 【步骤4】CglibMethodInvocation#proceed方法【步骤5】调…...
Qt-D指针与Q指针的设计哲学
文章目录 前言PIMLP与二进制兼容性D指针Q指针优化d指针继承Q_D和Q_Q 前言 在探索Qt源码的过程中会看到类的成员有一个d指针,d指针类型是一个private的类,这种设计模式称为PIMPL(pointer to implementation),本文根据Q…...
数据结构——单链表list
前言:大家好😍,本文主要介绍数据结构——单链表 目录 一、单链表 二、使用步骤 1.结构体定义 2.初始化 3.插入 3.1 头插 3.2 尾插 3.3 按位置插 四.删除 4.1头删 4.2 尾删 4.3 按位置删 4.4按值删 五 统计有效值个数 六 销毁…...
