当前位置: 首页 > article >正文

Python中NumPy的统计运算

在数据分析和科学计算领域,Python凭借其丰富的库生态系统成为首选工具之一,而NumPy作为Python数值计算的核心库,凭借其高效的数组操作和强大的统计运算功能,广泛应用于机器学习、信号处理、统计分析等场景。本文将系统介绍NumPy在统计运算中的核心功能,涵盖基础统计量计算、多维数组操作、高级统计方法及实际应用案例,帮助读者全面掌握NumPy的统计运算能力。

一、NumPy统计运算基础

NumPy提供了丰富的统计函数,可对数组元素进行快速计算。以下是常用统计函数的分类与示例:

1. 基础统计量

  • 求和与均值sum()mean()
    示例:arr = np.array([1, 2, 3, 4, 5])
    print(arr.sum()) 输出 15print(arr.mean()) 输出 3.0
  • 最大值与最小值max()min()
    示例:print(arr.max()) 输出 5print(arr.min()) 输出 1
  • 标准差与方差std()var()
    示例:print(arr.std()) 输出标准差,print(arr.var()) 输出方差。

2. 累计运算

  • 累计和与累计积cumsum()cumprod()
    示例:print(arr.cumsum()) 输出 [1, 3, 6, 10, 15]

3. 索引定位

  • 最大/最小值索引argmax()argmin()
    示例:print(arr.argmax()) 输出 4(最大值5的索引)。

4. 高级统计量

  • 中位数median()
    示例:print(np.median(arr)) 输出 3.0
  • 四分位数与极差percentile()ptp()
    示例:print(np.percentile(arr, 75)) 输出 4.0(75%分位数)。

二、多维数组的统计运算

NumPy支持对多维数组按指定轴(axis)进行统计运算,这是其核心优势之一。

1. 示例数据

import numpy as np
data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

2. 按轴计算

  • 按列计算axis=0
    示例:print(data.mean(axis=0)) 输出 [4. 5. 6.](每列均值)。
  • 按行计算axis=1
    示例:print(data.sum(axis=1)) 输出 [ 6 15 24](每行和)。

3. 广播机制

NumPy的广播机制允许对不同形状的数组进行运算。例如:

a = np.array([1, 2, 3])
b = 2
print(a + b)  # 输出 `[3 4 5]`

三、高级统计方法

1. 协方差与相关系数

  • 协方差矩阵np.cov()
    示例:print(np.cov(data.T)) 输出变量间的协方差矩阵。
  • 相关系数矩阵np.corrcoef()
    示例:print(np.corrcoef(data.T)) 输出变量间的相关系数矩阵。

2. 偏度与峰度

需借助scipy.stats模块:

from scipy.stats import skew, kurtosis
data = np.random.normal(0, 1, 1000)
print(skew(data))  # 偏度
print(kurtosis(data))  # 峰度

3. 离群值检测

通过四分位距(IQR)检测离群值:

Q1 = np.percentile(data, 25)
Q3 = np.percentile(data, 75)
IQR = Q3 - Q1
outliers = (data < (Q1 - 1.5 * IQR)) | (data > (Q3 + 1.5 * IQR))
print(outliers.sum())  # 输出离群值数量

4. 几何平均数与调和平均数

  • 几何平均数
    geom_mean = np.exp(np.mean(np.log(data[data > 0])))
    
  • 调和平均数
    harm_mean = len(data) / np.sum(1.0 / data[data > 0])
    

四、实际应用案例

1. 数据标准化

将数据转换为均值为0、标准差为1的分布:

normalized_data = (data - np.mean(data, axis=0)) / np.std(data, axis=0)

2. 累积分布与插值

  • 累积分布
    sorted_data = np.sort(data.flatten())
    cdf = np.arange(1, len(sorted_data)+1) / len(sorted_data)
    
  • 插值
    x = np.array([0, 1, 2, 3])
    y = np.array([0, 1, 4, 9])
    x_new = np.linspace(0, 3, 5)
    y_new = np.interp(x_new, x, y)
    

3. 随机数生成与统计

生成正态分布随机数并计算其统计量:

random_data = np.random.normal(0, 1, 1000)
print(random_data.mean(), random_data.std())

五、性能优化技巧

1. 使用向量化操作

避免显式循环,充分利用NumPy的底层优化。例如:

# 低效
result = []
for i in range(len(data)):result.append(data[i] * 2)# 高效
result = data * 2

2. 利用NumPy的内置函数

NumPy的内置函数通常经过高度优化,例如使用np.sum()替代sum()

3. 内存管理

对于大规模数据,可使用np.memmap()创建内存映射数组,避免内存溢出。

六、总结

NumPy的统计运算功能覆盖了从基础统计量到高级数据分析的完整需求,其核心优势包括:

  • 高效的多维数组操作:支持按轴计算,满足复杂数据分析需求。
  • 丰富的统计函数:提供从基础到高级的统计量计算方法。
  • 与科学计算生态的深度集成:与scipypandas等库无缝协作。

通过掌握NumPy的统计运算功能,开发者能够显著提升数据处理与分析的效率,为后续的机器学习、数据可视化等任务奠定坚实基础。


参考文献

  • NumPy官方文档
  • 《Python数据科学手册》
  • 相关技术博客与开源项目示例

相关文章:

Python中NumPy的统计运算

在数据分析和科学计算领域&#xff0c;Python凭借其丰富的库生态系统成为首选工具之一&#xff0c;而NumPy作为Python数值计算的核心库&#xff0c;凭借其高效的数组操作和强大的统计运算功能&#xff0c;广泛应用于机器学习、信号处理、统计分析等场景。本文将系统介绍NumPy在…...

uniapp实现H5页面麦克风权限获取与录音功能

1.权限配置 在uni-app开发H5页面时&#xff0c;需要在manifest.json文件中添加录音权限的配置。具体如下&#xff1a; {"h5": {"permissions": {"scope.record": {"desc": "请授权使用录音功能"}}} }这段配置代码是用于向…...

两个树莓派如何通过wifi direct传输视频并显示

这里写自定义目录标题 在两台设备上安装必要软件Wi-Fi Direct接收端IP&#xff08;自动发现或静态设置&#xff09;设置摄像头参数显示初始化网络设置 系统架构概述 发送端树莓派&#xff1a;捕获视频&#xff08;摄像头或视频文件&#xff09;→ 编码 → 通过Wi-Fi Direct传输…...

ubuntu 系统安装Mysql

安装 mysql sudo apt update sudo apt install mysql-server 启动服务 sudo systemctl start mysql 设置为开机自启 sudo systemctl enable mysql 查看服务状态 &#xff08;看到类似“active (running)”的状态信息代表成功&#xff09; sudo systemctl status mysql …...

selenium快速入门

一、操作浏览器 from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By# 设置选项 q1 Options() q1.add_argument("--no-sandbo…...

Redis:线程模型

单线程模型 Redis 自诞生以来&#xff0c;一直以高性能著称。很多人好奇&#xff0c;Redis 为什么早期采用单线程模型&#xff0c;它真的比多线程还快吗&#xff1f; 其实&#xff0c;Redis 的“快”并不在于并发线程&#xff0c;而在于其整体架构设计极致简单高效&#xff0c;…...

Transformer模型解析与实例:搭建一个自己的预测语言模型

目录 1. 前言 2. Transformer 的核心结构 2.1 编码器&#xff08;Encoder&#xff09; 2.2 解码器&#xff08;Decoder&#xff09; 2.3 位置编码&#xff08;Positional Encoding&#xff09; 3. 使用 PyTorch 构建 Transformer 3.1 导入所需的模块&#xff1a; 3.2 定…...

Java常用安全编码的规范整理及工具

对Java安全编码的主要规范及要求的一些整理&#xff1a; 一、输入验证与数据校验 ‌外部输入校验‌ 对所有外部输入&#xff08;如用户输入、文件、网络数据&#xff09;进行合法性校验&#xff0c;采用白名单机制限制输入内容范围 ‌。校验前对输入数据做归一化处理&#xff…...

重返JAVA之路——面向对象

目录 面向对象 1.什么是面向对象&#xff1f; 2.面向对象的特点有哪些&#xff1f; 3.什么是对象&#xff1f; 4.什么是类&#xff1f; 5.什么是构造方法? 6.构造方法的特性有哪些&#xff1f; 封装 1.什么是封装&#xff1f; 2.封装有哪些特点&#xff1f; 数据隐…...

Java设计模式全解析(共 23 种)

一、设计模式全解&#xff1a; Java 中的设计模式是为了解决在软件开发中常见问题的一些“最佳实践”总结。设计模式分为三大类&#xff0c;共 23 种经典模式&#xff1a; 1. 创建型模式&#xff08;5 种&#xff09; 用于对象的创建&#xff0c;解决对象实例化过程中的问题。…...

Python10天突击--Day 2: 实现观察者模式

以下是 Python 实现观察者模式的完整方案&#xff0c;包含同步/异步支持、类型注解、线程安全等特性&#xff1a; 1. 经典观察者模式实现 from abc import ABC, abstractmethod from typing import List, Anyclass Observer(ABC):"""观察者抽象基类""…...

springboot框架集成websocket依赖实现物联网设备、前端网页实时通信!

需求&#xff1a; 最近在对接一个物联网里设备&#xff0c;他的通信方式是 websocket 。所以我需要在 springboot框架中集成websocket 依赖&#xff0c;从而实现与设备实时通信&#xff01; 框架&#xff1a;springboot2.7 java版本&#xff1a;java8 好了&#xff0c;还是直接…...

【玩泰山派】5、点灯,驱动led-(2)ubuntu18.04 升级python3.6到python3.7,安装pip3

文章目录 前言升级python3.71、安装 software-properties-common 包2、添加 deadsnakes PPA 源3、安装 Python 3.71. 安装 Python 3.72. 安装 Python 3.7 的开发包和虚拟环境支持&#xff08;可选但推荐&#xff09;3. 设置 Python 3.7 为默认版本4. 验证 Python 版本注意事项 …...

ES6学习03-字符串扩展(unicode、for...of、字符串模板)和新方法()

一、字符串扩展 1. eg: 2.for...of eg: 3. eg: 二。字符串新增方法 1. 2. 3. 4. 5....

c++中的this

在 C 中&#xff0c;this 是一个指向当前对象实例的指针&#xff0c;它隐式地存在于类的非静态成员函数中。以下是 this 的详细用法和常见场景&#xff1a; 1. 常见场景 明确成员归属&#xff1a;当成员变量与局部变量同名时&#xff0c;用 this-> 显式访问成员。当成员变量…...

目前状况下,计算机和人工智能是什么关系?

目录 一、计算机和人工智能的关系 &#xff08;一&#xff09;从学科发展角度看 计算机是基础 人工智能是计算机的延伸和拓展 &#xff08;二&#xff09;从技术应用角度看 二、计算机系学生对人工智能的了解程度 &#xff08;一&#xff09;基础层面的了解 必备知识 …...

Flutter 2025 Roadmap

2025 这个路线图是有抱负的。它主要代表了我们这些在谷歌工作的人收集的内容。到目前为止&#xff0c;非Google贡献者的数量超过了谷歌雇佣的贡献者&#xff0c;所以这并不是一个详尽的列表&#xff0c;列出了我们希望今年Flutter能够出现的所有令人兴奋的新事物&#xff01;在…...

[数据结构]排序 --2

目录 8、快速排序 8.1、Hoare版 8.2、挖坑法 8.3、前后指针法 9、快速排序优化 9.1、三数取中法 9.2、采用插入排序 10、快速排序非递归 11、归并排序 12、归并排序非递归 13、排序类算法总结 14、计数排序 15、其他排序 15.1、基数排序 15.2、桶排序 8、快速排…...

第16届蓝桥杯c++省赛c组个人题解

偷偷吐槽&#xff1a; c组没人写题解吗&#xff0c;找不到题解啊 P12162 [蓝桥杯 2025 省 C/研究生组] 数位倍数 题目背景 本站蓝桥杯 2025 省赛测试数据均为洛谷自造&#xff0c;与官方数据可能存在差异&#xff0c;仅供学习参考。 题目描述 请问在 1 至 202504&#xff…...

记一次InternVL3- 2B 8B的部署测验日志

1、模型下载魔搭社区 2、运行环境&#xff1a; 1、硬件 RTX 3090*1 云主机[普通性能] 8核15G 200G 免费 32 Mbps付费68Mbps ubuntu22.04 cuda12.4 2、软件&#xff1a; flash_attn&#xff08;好像不用装 忘记了&#xff09; numpy Pillow10.3.0 Requests2.31.0 transfo…...

Android PowerManager功能接口详解

PowerManager 是 Android 系统中用于管理设备电源状态的核心服务&#xff0c;开发者可以通过它控制设备的唤醒、休眠、屏幕亮灭等行为。以下是对 PowerManager 核心功能接口的详细说明&#xff0c;包含使用场景、注意事项和代码示例。 1. 获取 PowerManager 实例 通过 Context…...

使用SSH解决在IDEA中Push出现403的问题

错误截图&#xff1a; 控制台日志&#xff1a; 12:15:34.649: [xxx] git -c core.quotepathfalse -c log.showSignaturefalse push --progress --porcelain master refs/heads/master:master fatal: unable to access https://github.com/xxx.git/: The requested URL return…...

Tauri 2.3.1+Leptos 0.7.8开发桌面应用--Sqlite数据库的写入、展示和选择删除

在前期工作的基础上&#xff08;Tauri2Leptos开发桌面应用--Sqlite数据库操作_tauri sqlite-CSDN博客&#xff09;&#xff0c;尝试制作产品化学成分录入界面&#xff0c;并展示数据库内容&#xff0c;删除选中的数据。具体效果如下&#xff1a; 一、前端Leptos程序 前端程序主…...

关于 Java 预先编译(AOT)技术的详细说明,涵盖 GraalVM 的配置、Spring Boot 3.x 的集成、使用示例及优缺点对比

以下是关于 Java 预先编译&#xff08;AOT&#xff09;技术的详细说明&#xff0c;涵盖 GraalVM 的配置、Spring Boot 3.x 的集成、使用示例及优缺点对比&#xff1a; 1. 预先编译&#xff08;AOT&#xff09;技术详解 1.1 核心概念 AOT&#xff08;Ahead-of-Time&#xff09…...

《车辆人机工程-》实验报告

汽车驾驶操纵实验 汽车操纵装置有哪几种&#xff0c;各有什么特点 汽车操纵装置是驾驶员直接控制车辆行驶状态的关键部件&#xff0c;主要包括以下几种&#xff0c;其特点如下&#xff1a; 一、方向盘&#xff08;转向操纵装置&#xff09; 作用&#xff1a;控制车辆行驶方向…...

使用多进程和 Socket 接收解析数据并推送到 Kafka 的高性能架构

使用多进程和 Socket 接收解析数据并推送到 Kafka 的高性能架构 在现代应用程序中&#xff0c;实时数据处理和高并发性能是至关重要的。本文将介绍如何使用 Python 的多进程和 Socket 技术来接收和解析数据&#xff0c;并将处理后的数据推送到 Kafka&#xff0c;从而实现高效的…...

Redis 哨兵模式 搭建

1 . 哨兵模式拓扑 与 简介 本文介绍如何搭建 单主双从 多哨兵模式的搭建 哨兵有12个作用 。通过发送命令&#xff0c;让Redis服务器返回监控其运行状态&#xff0c;包括主服务器和从服务器。 当哨兵监测到master宕机&#xff0c;会自动将slave切换成master&#xff0c;然后通过…...

【网络安全 | 项目开发】Web 安全响应头扫描器(提升网站安全性)

原创项目,未经许可,不得转载。 文章目录 项目简介工作流程示例输出技术栈项目代码使用说明项目简介 安全响应头是防止常见 Web 攻击(如点击劫持、跨站脚本攻击等)的有效防线,因此合理的配置这些头部信息对任何网站的安全至关重要。 Web 安全响应头扫描器(Security Head…...

构建灵活的接口抽象层:支持多种后端数据存取的实战指南

构建灵活的接口抽象层:支持多种后端数据存取的实战指南 引言 在现代软件开发中,数据存取成为业务逻辑的核心组成部分。然而,由于后端数据存储方式的多样性(如关系型数据库、NoSQL数据库和文件存储),如何设计一套能够适配多种后端数据存取的接口抽象层,成为技术团队关注…...

计算机的发展及应用

一、计算机的发展历程 计算机的发展经历了从机械计算到电子计算的跨越&#xff0c;其核心驱动力是 硬件技术革新 和 体系结构演进&#xff0c;大致可分为以下阶段&#xff1a; 1. 前电子计算机时代&#xff08;19世纪-20世纪40年代&#xff09; 机械计算装置&#xff1a; 16…...