当前位置：首页 > news >正文

Pandas常用计算函数

news 2026/2/7 17:38:32

排序函数

nlargest函数

nsmallest函数

sort_values函数

df.sort_values

Series.sort_values

聚合函数

corr函数-相关性

min函数-最小值

max函数-最大值

mean函数-平均值

sum函数-求和

count函数-统计非空数据

std函数-标准偏差

quantile函数-分位数

排序函数

准备函数

# 加载csv数据, 返回df对象
import pandas as pddf = pd.read_csv('../data/b_LJdata.csv')
# print(df.head())
# 获取前10条数据
df2 = df.head(10)
df2

nlargest函数

通过 df.nlargest(n, 列名) 方法实现对指定列的值由大到小排序, 返回前n行数据

# df.nsmallest(n, '列名') # 根据指定列的值由小到大排列，返回n行数据
print(df2.nsmallest(5, '看房人数'))

nsmallest函数

通过 df.nsmallest(n, 列名) 方法实现对指定列的值由小到大排序, 返回前n行数据

# df.nsmallest(n, '列名') # 根据指定列的值由小到大排列，返回n行数据
print(df2.nsmallest(5, '看房人数'))

sort_values函数

通过 df.sort_values(列名列表, ascending=) 方法根据指定列指定排序方式排序

ascending: True或False, 默认True->升序, 也可以接收布尔值列表, 每列指定排序方式

df.sort_values

df.sort_values函数可以按照指定的一列或多列的值进行排序

1) 按价格列的数值由小到大进行排序

print(df2.sort_values(['价格']))

2) 按价格列的数值由大到小进行排序

print(df2.sort_values(['价格'], ascending=False))

3) 先对看房人数列由小到大排序, 再对价格列由大到小排序

print(df2.sort_values(['看房人数', '价格'], ascending=[True, False]))

Series.sort_values

Series.sort_values 函数可以按照指定的一列或多列的值进行排序

1) 按价格列的数值由小到大进行排序


print(df2['价格'].sort_values())

2) 按价格列的数值由大到小进行排序

print(df2['价格'].sort_values(ascending=False))

聚合函数

corr函数-相关性

相关性得分越接近1, 代表正相关性越强; 越接近-1, 代表负相关性越强自己和自己相关性为1 面积和价格呈现正相关, 面积越大, 价格越贵

df.corr()

“面积” 与 “面积” 的相关系数为 1.000000，这是必然的，因为一个变量与自身完全相关。
“面积” 与 “价格” 的相关系数为 0.710056，呈正相关关系。这表明在该数据集中，一般情况下，房屋面积越大，价格越高。但需要注意的是，相关系数为 0.710056 表明这种关系并非完全线性相关，可能存在其他因素影响价格。
“面积” 与 “看房人数” 的相关系数为 -0.114706，呈较弱的负相关关系。这意味着房屋面积的大小与看房人数之间的关系不是很密切，面积的增加不一定会导致看房人数的减少，反之亦然。
“价格” 与 “价格” 的相关系数为 1.000000，同理，一个变量与自身完全相关。
“价格” 与 “看房人数” 的相关系数为 0.019457，接近 0，表明价格与看房人数之间几乎没有线性关系。房屋价格的高低对看房人数的影响不明显。
“看房人数” 与 “看房人数” 的相关系数为 1.000000，自身完全相关。

min函数-最小值

print(df2.min())

max函数-最大值

print(df2.max())

mean函数-平均值

print(df2.mean())

sum函数-求和

print(df2.sum())
print('======================')
print(df2['看房人数'].sum())

count函数-统计非空数据

# 构造空值
df2.loc[0, '看房人数'] = None
print(df2.count())
print(df2['看房人数'].count())

std函数-标准偏差

一、方差

方差是用来衡量一组数据离散程度的统计量。具体计算方法是先求出这组数据的平均值，然后对于每个数据值，计算它与平均值的差值，再将这个差值进行平方，最后把所有数据值的差值平方加起来求平均。

方差越大，说明这组数据的波动越大，数据点相对平均值的分散程度越高；方差越小，说明数据相对更加集中在平均值附近。

二、标准差

标准差是方差的算术平方根。

即标准差

print(df2.std())

quantile函数-分位数

分位数（Quantile），亦称分位点，常用的有中位数（即二分位数）、四分位数、百分位数等；那什么是分位数呢？我们以中位数为例：通过把一堆数字按大小排序后找出正中间的一个数字作为中位数，如果这一堆数字有偶数个，则中位数不唯一，通常取最中间的两个数值的平均数作为中位数，即二分位数。
quantile函数默认返回二分位数；可以通过传入参数来控制返回的四分位数，或其他分位数

print(df2.quantile())
print(df2['看房人数'].quantile())

print(df2.quantile([0.25, 0.5, 0.75]))
print('==============================')
print(df2['看房人数'].quantile([0.25, 0.5, 0.75]))

Pandas常用计算函数

目录排序函数 nlargest函数 nsmallest函数 sort_values函数 df.sort_values Series.sort_values 聚合函数 corr函数-相关性 min函数-最小值 max函数-最大值 mean函数-平均值 sum函数-求和 count函数-统计非空数据 std函数-标准偏差 quantile函数-分位数排序函…...

编程日记 2024/10/18 19:52:21

C++ | Leetcode C++题解之第473题火柴拼正方形

题目： 题解： class Solution { public:bool makesquare(vector<int>& matchsticks) {int totalLen accumulate(matchsticks.begin(), matchsticks.end(), 0);if (totalLen % 4 ! 0) {return false;}int len totalLen / 4, n matchsticks.s…...

编程日记 2024/10/18 19:51:20

深度解析RLS（Recursive Least Squares）算法

目录一、引言二、RLS算法的基本思想三、RLS算法的数学推导四、RLS算法的特点五、RLS算法的应用场景六、RLS算法的局限性七、总结一、引言在自适应滤波领域，LMS（Least Mean Squares）算法因其计算简单、实现方便而广受欢迎。然而&#xff0…...

编程日记 2024/10/18 19:49:18

Centos 7.9NFS搭建

原创作者：运维工程师谢晋 Centos 7.9NFS搭建 NFS服务端安装客户机访问共享配置 NFS服务端安装 SSH连接系统登录到服务端安装nfs服务 # yum -y install nfs-utils2. 安装完成后，查看需要共享的目录，这边共享的是/home目录，如…...

编程日记 2024/10/18 19:48:16

Python库numpy之三

Python库numpy之三 # NumPy数组创建函数二维数组创建函数numpy.eye应用例子numpy.diag应用例子numpy.vander应用例子 # NumPy数组创建函数二维数组创建函数 numpy.eye 词法：numpy.eye(N, MNone, k0, dtype<class ‘float’>, order‘C’, *, deviceNone, …...

编程日记 2024/10/18 19:47:16

postgresql 安装

一、下载 PostgreSQL: File Browser 下载地址 PostgreSQL: File Browser 上传到服务器，并解压二、安装依赖 yum install -y perl-ExtUtils-Embed readline-devel zlib-devel pam-devel libxml2-devel libxslt-devel openldap-devel 创建postgresql 和目录 useradd …...

编程日记 2024/10/18 19:46:15

基于机器学习的天气数据分析与预测系统

天气预报是日常生活中非常重要的信息来源，能够帮助人们合理安排日程、预防自然灾害。随着数据科学和机器学习的快速发展，传统的天气预报方法逐渐向基于数据驱动的机器学习方法转变。本文将探讨如何构建一个基于机器学习的天气数据分析与预测系统&#xf…...

编程日记 2024/10/18 19:45:14

Java项目-基于Springboot的在线外卖系统项目(源码+说明).zip

作者：计算机学长阿伟开发技术：SpringBoot、SSM、Vue、MySQL、ElementUI等，“文末源码”。开发运行环境开发语言：Java数据库：MySQL技术：SpringBoot、Vue、Mybaits Plus、ELementUI工具：IDEA/…...

编程日记 2024/10/18 19:44:13

ANSYS Workbench纤维混凝土3D

在ANSYS Workbench建立三维纤维混凝土模型可采用CAD随机几何3D插件建模后导入，模型包含球体粗骨料、圆柱体长纤维、水泥砂浆基体等不同组分。在CAD随机几何3D插件内设置模型参数后运行，即可在AutoCAD内建立三维纤维混凝土模型，插件支持任意…...

编程日记 2024/10/18 19:42:11

【Vue】Vue3.0（十）toRefs()和toRef()的区别及使用示例

上篇文章：Vue】Vue（九）OptionsAPI与CompositionAPI的区别 🏡作者主页：点击！ 🤖Vue专栏：点击！ ⏰️创作时间：2024年10月15日11点13分文章目录 toRefs()和toRe…...

编程日记 2024/10/18 19:39:07

中科星图（GVE）——使用随机森林方法进行土地分类

目录简介函数 gve.Classifier.smileRandomForest(numberOfTrees,variablesPerSplit,minLeafPopulation,bagFraction,maxNodes,seed) 代码结果简介使用随机森林方法进行土地分类的步骤如下： 数据准备：收集所需的土地分类数据，并对数…...

编程日记 2024/10/18 19:37:04

【蓝队技能】【C2流量分析】MSFCSSliver

蓝队技能 MSF&CS&Sliver 蓝队技能总结前言一、MSF1.1 流量分析1.2 特征提取二、CS1.1 流量分析1.2 特征提取二、Sliver1. 特征分析总结前言不同C2工具的流量特征都有细微差别，学会分析方法后就可以进行分析一、MSF 1.1 流量分析 MSF流量特征过于明显…...

编程日记 2024/10/18 19:36:03

不推荐使用Scilab作为MATLAB的开源替代

安装了Scilab2024.1.0，随便试了几分钟就发现有严重影响使用的Bug(也可能是就是这样设计的，有一个所谓的“暂停模式”)，复现步骤：主界面上点击“Scilab示例”按钮，打开“演示”窗口，点击左侧列表中的“多项式…...

编程日记 2024/10/18 19:34:01

C++智能指针及其应用

C11之后出现了 shared_ptr 和 unique_ptr，这两个类都是基于RAII技术进行设计的 RAII 利用对象生命周期来控制程序资源（如内存，文件句柄，网络连接，互斥量等资源）的技术，具体地说，就是…...

编程日记 2024/10/18 19:31:58

06 算法基础：算法的定义、表现形式（自然语言、伪代码、流程图）、五个特性（有穷性、确定性、可行性、输入、输出）、好算法的设计目标

目录 1 算法的定义 2 算法的三种表现形式 2.1 自然语言 2.2 伪代码 2.3 流程图 3 算法的五个特性 3.1 有穷性 3.2 确定性 3.3 可行性 3.4 输入 3.5 输出 4 好算法的设计目标 4.1 正确性 4.2 可读性 4.3 健壮性 4.4 通用性 4.5 高效率与低存储量 1 算法的定义 …...

编程日记 2024/10/18 19:30:56

【红外传感器】STM32C8T6标准库使用红外对管

好好学习，天天向上前言一、了解红外二、标准库的代码1.infrared.c2.infrared.h3.main.c4 现象总结前言红外线：频率介于微波与可见光之间的电磁波。参考如下【STM32】标准库与HAL库对照学习教程外设篇–红外避障传感器光电红外传感器详解&#…...

编程日记 2024/10/18 19:29:55

STM32L010F4 最小系统设计

画一个 STM32L010F4 的测试板子...... by 矜辰所致前言最近需要用到一个新的 MCU： STM32L010F4 ，上次测试的 VL53L0X 需要移植到这个芯片上，网上一搜 STM32L010F4，都是介绍资料，没有最小系统，使用说明等。…...

编程日记 2024/10/18 19:28:53

AI 工具大赏：探索智能时代的得力助手

在当今这个科技飞速发展的时代，人工智能（AI）技术已经深入到我们生活的方方面面。从日常办公到创意设计，从学术研究到娱乐休闲，AI 工具正以其强大的功能和便捷的使用体验，成为人们不可或缺的得力助手。那么&…...

编程日记 2024/10/18 19:25:49

安通物流借助CRM重塑企业客户关系管理新格局

安通控股股份有限公司(以下简称"安通控股")是一家扎根集装箱多式联运物流产业的现代综合物流服务企业,致力于为客户提供绿色、经济、高效、安全的集装箱全程物流解决方案。据Alphaliner排名统计,截至2023年10月,安通控股综合运力全球排名21位,位居国内内贸集装箱物…...

编程日记 2024/10/18 19:24:48

C++标准模板库--vector

vector 介绍 vector（向量）是一种序列容器，表示为可以改变大小的数组。vector中的元素使用连续的存储位置，这意味着也可以使用指向其元素的常规指针偏移量来访问任意元素，且与数组一样高效。但与数组不同的是&#xff…...

编程日记 2024/10/18 19:23:45

大数据学习栈记——Neo4j的安装与使用

本文介绍图数据库Neofj的安装与使用，操作系统：Ubuntu24.04，Neofj版本：2025.04.0。 Apt安装 Neofj可以进行官网安装：Neo4j Deployment Center - Graph Database & Analytics 我这里安装是添加软件源的方法最新版…...

编程新知 2026/2/6 3:56:50

docker详细操作--未完待续

docker介绍 docker官网: Docker：加速容器应用程序开发 harbor官网：Harbor - Harbor 中文使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像是什么 Docker 是一种开源的容器化平台，用于将应用程序及其依赖项（如库、运行时环…...

编程新知 2026/2/5 4:33:24

K8S认证|CKS题库+答案| 11. AppArmor

目录 11. AppArmor 免费获取并激活 CKA_v1.31_模拟系统题目开始操作： 1）、切换集群 2）、切换节点 3）、切换到 apparmor 的目录 4）、执行 apparmor 策略模块 5）、修改 pod 文件 6）、…...

编程新知 2026/1/29 2:11:35

条件运算符

C中的三目运算符（也称条件运算符，英文：ternary operator）是一种简洁的条件选择语句，语法如下： 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true，则整个表达式的结果为“表达式1”…...

编程新知 2025/12/6 22:50:48

NLP学习路线图（二十三）：长短期记忆网络（LSTM）

在自然语言处理（NLP）领域，我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感，还是实现语言的翻译，都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心，而循环神经网络（RNN）曾被视为…...

编程新知 2026/2/1 7:05:28

多模态大语言模型arxiv论文略读（108）

CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题：CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者：Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...

编程新知 2026/2/1 6:11:51

使用LangGraph和LangSmith构建多智能体人工智能系统

现在，通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战，比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。在这篇博客〔原作者&a…...

编程新知 2026/1/26 13:48:59

安卓基础（Java 和 Gradle 版本）

1. 设置项目的 JDK 版本方法1：通过 Project Structure File → Project Structure... (或按 CtrlAltShiftS) 左侧选择 SDK Location 在 Gradle Settings 部分，设置 Gradle JDK 方法2：通过 Settings File → Settings... (或 CtrlAltS)…...

编程新知 2025/7/10 0:32:50

WPF八大法则：告别模态窗口卡顿

⚙️ 核心问题：阻塞式模态窗口的缺陷原始代码中ShowDialog()会阻塞UI线程，导致后续逻辑无法执行： var result modalWindow.ShowDialog(); // 线程阻塞 ProcessResult(result); // 必须等待窗口关闭根本问题&#xff1a…...

编程新知 2026/1/26 17:26:03

uniapp 实现腾讯云IM群文件上传下载功能

UniApp 集成腾讯云IM实现群文件上传下载功能全攻略一、功能背景与技术选型在团队协作场景中，群文件共享是核心需求之一。本文将介绍如何基于腾讯云IMCOS，在uniapp中实现： 群内文件上传/下载文件元数据管理下载进度追踪跨平台文件预览二…...

编程新知 2025/9/14 20:44:53

排序函数

nlargest函数

nsmallest函数

sort_values函数

df.sort_values

Series.sort_values

聚合函数

corr函数-相关性

min函数-最小值

max函数-最大值

mean函数-平均值

sum函数-求和

count函数-统计非空数据

std函数-标准偏差

quantile函数-分位数

相关文章：