当前位置: 首页 > news >正文

Pandas常用计算函数

目录

排序函数

nlargest函数

nsmallest函数 

sort_values函数

df.sort_values

Series.sort_values

聚合函数

corr函数-相关性

min函数-最小值

max函数-最大值

mean函数-平均值

sum函数-求和

count函数-统计非空数据

std函数-标准偏差

quantile函数-分位数


排序函数

准备函数

# 加载csv数据, 返回df对象
import pandas as pddf = pd.read_csv('../data/b_LJdata.csv')
# print(df.head())
# 获取前10条数据
df2 = df.head(10)
df2

 

nlargest函数

通过 df.nlargest(n, 列名) 方法实现对指定列的值由大到小排序, 返回前n行数据
# df.nsmallest(n, '列名') # 根据指定列的值由小到大排列,返回n行数据
print(df2.nsmallest(5, '看房人数'))

nsmallest函数 

通过 df.nsmallest(n, 列名) 方法实现对指定列的值由小到大排序, 返回前n行数据
# df.nsmallest(n, '列名') # 根据指定列的值由小到大排列,返回n行数据
print(df2.nsmallest(5, '看房人数'))

sort_values函数

通过 df.sort_values(列名列表, ascending=) 方法根据指定列指定排序方式排序
ascending: True或False, 默认True->升序, 也可以接收布尔值列表, 每列指定排序方式

df.sort_values

  • df.sort_values函数可以按照指定的一列或多列的值进行排序

1) 按价格列的数值由小到大进行排序

print(df2.sort_values(['价格']))

2) 按价格列的数值由大到小进行排序

print(df2.sort_values(['价格'], ascending=False))

3)  先对看房人数列由小到大排序, 再对价格列由大到小排序

print(df2.sort_values(['看房人数', '价格'], ascending=[True, False]))

Series.sort_values

Series.sort_values 函数可以按照指定的一列或多列的值进行排序

1) 按价格列的数值由小到大进行排序


print(df2['价格'].sort_values())

2)  按价格列的数值由大到小进行排序

print(df2['价格'].sort_values(ascending=False))

聚合函数

corr函数-相关性

相关性得分越接近1, 代表正相关性越强; 越接近-1, 代表负相关性越强 自己和自己相关性为1 面积和价格呈现正相关, 面积越大, 价格越贵

df.corr()

  • “面积” 与 “面积” 的相关系数为 1.000000,这是必然的,因为一个变量与自身完全相关。

  • “面积” 与 “价格” 的相关系数为 0.710056,呈正相关关系。这表明在该数据集中,一般情况下,房屋面积越大,价格越高。但需要注意的是,相关系数为 0.710056 表明这种关系并非完全线性相关,可能存在其他因素影响价格。

  • “面积” 与 “看房人数” 的相关系数为 -0.114706,呈较弱的负相关关系。这意味着房屋面积的大小与看房人数之间的关系不是很密切,面积的增加不一定会导致看房人数的减少,反之亦然。

  • “价格” 与 “价格” 的相关系数为 1.000000,同理,一个变量与自身完全相关。

  • “价格” 与 “看房人数” 的相关系数为 0.019457,接近 0,表明价格与看房人数之间几乎没有线性关系。房屋价格的高低对看房人数的影响不明显。

  • “看房人数” 与 “看房人数” 的相关系数为 1.000000,自身完全相关。

min函数-最小值

print(df2.min())

max函数-最大值

print(df2.max())

mean函数-平均值

print(df2.mean())

sum函数-求和

print(df2.sum())
print('======================')
print(df2['看房人数'].sum())

count函数-统计非空数据

# 构造空值
df2.loc[0, '看房人数'] = None
print(df2.count())
print(df2['看房人数'].count())

std函数-标准偏差

一、方差

方差是用来衡量一组数据离散程度的统计量。具体计算方法是先求出这组数据的平均值,然后对于每个数据值,计算它与平均值的差值,再将这个差值进行平方,最后把所有数据值的差值平方加起来求平均。

方差越大,说明这组数据的波动越大,数据点相对平均值的分散程度越高;方差越小,说明数据相对更加集中在平均值附近。

二、标准差

标准差是方差的算术平方根。

即标准差

print(df2.std())

quantile函数-分位数

  • 分位数(Quantile),亦称分位点,常用的有中位数(即二分位数)、四分位数、百分位数等;那什么是分位数呢?我们以中位数为例:通过把一堆数字按大小排序后找出正中间的一个数字作为中位数,如果这一堆数字有偶数个,则中位数不唯一,通常取最中间的两个数值的平均数作为中位数,即二分位数。

  • quantile函数默认返回二分位数;可以通过传入参数来控制返回的四分位数,或其他分位数

print(df2.quantile())
print(df2['看房人数'].quantile())

print(df2.quantile([0.25, 0.5, 0.75]))
print('==============================')
print(df2['看房人数'].quantile([0.25, 0.5, 0.75]))

相关文章:

Pandas常用计算函数

目录 排序函数 nlargest函数 nsmallest函数 sort_values函数 df.sort_values Series.sort_values 聚合函数 corr函数-相关性 min函数-最小值 max函数-最大值 mean函数-平均值 sum函数-求和 count函数-统计非空数据 std函数-标准偏差 quantile函数-分位数 排序函…...

C++ | Leetcode C++题解之第473题火柴拼正方形

题目&#xff1a; 题解&#xff1a; class Solution { public:bool makesquare(vector<int>& matchsticks) {int totalLen accumulate(matchsticks.begin(), matchsticks.end(), 0);if (totalLen % 4 ! 0) {return false;}int len totalLen / 4, n matchsticks.s…...

深度解析RLS(Recursive Least Squares)算法

目录 一、引言二、RLS算法的基本思想三、RLS算法的数学推导四、RLS算法的特点五、RLS算法的应用场景六、RLS算法的局限性七、总结 一、引言 在自适应滤波领域&#xff0c;LMS&#xff08;Least Mean Squares&#xff09;算法因其计算简单、实现方便而广受欢迎。然而&#xff0…...

Centos 7.9NFS搭建

原创作者&#xff1a;运维工程师 谢晋 Centos 7.9NFS搭建 NFS服务端安装客户机访问共享配置 NFS服务端安装 SSH连接系统登录到服务端安装nfs服务 # yum -y install nfs-utils2. 安装完成后&#xff0c;查看需要共享的目录&#xff0c;这边共享的是/home目录&#xff0c;如…...

Python库numpy之三

Python库numpy之三 # NumPy数组创建函数二维数组创建函数numpy.eye应用例子numpy.diag应用例子numpy.vander应用例子 # NumPy数组创建函数 二维数组创建函数 numpy.eye 词法&#xff1a;numpy.eye(N, MNone, k0, dtype<class ‘float’>, order‘C’, *, deviceNone, …...

postgresql 安装

一、下载 PostgreSQL: File Browser 下载地址 PostgreSQL: File Browser 上传到服务器,并解压 二、安装依赖 yum install -y perl-ExtUtils-Embed readline-devel zlib-devel pam-devel libxml2-devel libxslt-devel openldap-devel 创建postgresql 和目录 useradd …...

基于机器学习的天气数据分析与预测系统

天气预报是日常生活中非常重要的信息来源&#xff0c;能够帮助人们合理安排日程、预防自然灾害。随着数据科学和机器学习的快速发展&#xff0c;传统的天气预报方法逐渐向基于数据驱动的机器学习方法转变。本文将探讨如何构建一个基于机器学习的天气数据分析与预测系统&#xf…...

Java项目-基于Springboot的在线外卖系统项目(源码+说明).zip

作者&#xff1a;计算机学长阿伟 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、ElementUI等&#xff0c;“文末源码”。 开发运行环境 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBoot、Vue、Mybaits Plus、ELementUI工具&#xff1a;IDEA/…...

ANSYS Workbench纤维混凝土3D

在ANSYS Workbench建立三维纤维混凝土模型可采用CAD随机几何3D插件建模后导入&#xff0c;模型包含球体粗骨料、圆柱体长纤维、水泥砂浆基体等不同组分。 在CAD随机几何3D插件内设置模型参数后运行&#xff0c;即可在AutoCAD内建立三维纤维混凝土模型&#xff0c;插件支持任意…...

【Vue】Vue3.0(十)toRefs()和toRef()的区别及使用示例

上篇文章&#xff1a;Vue】Vue&#xff08;九&#xff09;OptionsAPI与CompositionAPI的区别 &#x1f3e1;作者主页&#xff1a;点击&#xff01; &#x1f916;Vue专栏&#xff1a;点击&#xff01; ⏰️创作时间&#xff1a;2024年10月15日11点13分 文章目录 toRefs()和toRe…...

中科星图(GVE)——使用随机森林方法进行土地分类

目录 简介 函数 gve.Classifier.smileRandomForest(numberOfTrees,variablesPerSplit,minLeafPopulation,bagFraction,maxNodes,seed) 代码 结果 简介 使用随机森林方法进行土地分类的步骤如下&#xff1a; 数据准备&#xff1a;收集所需的土地分类数据&#xff0c;并对数…...

【蓝队技能】【C2流量分析】MSFCSSliver

蓝队技能 MSF&CS&Sliver 蓝队技能总结前言一、MSF1.1 流量分析1.2 特征提取 二、CS1.1 流量分析1.2 特征提取 二、Sliver1. 特征分析 总结 前言 不同C2工具的流量特征都有细微差别&#xff0c;学会分析方法后就可以进行分析 一、MSF 1.1 流量分析 MSF流量特征过于明显…...

不推荐使用Scilab作为MATLAB的开源替代

安装了Scilab2024.1.0&#xff0c;随便试了几分钟就发现有严重影响使用的Bug(也可能是就是这样设计的&#xff0c;有一个所谓的“暂停模式”)&#xff0c;复现步骤&#xff1a;主界面上点击“Scilab示例”按钮&#xff0c;打开“演示”窗口&#xff0c;点击左侧列表中的“多项式…...

C++智能指针及其应用

C11之后出现了 shared_ptr 和 unique_ptr&#xff0c;这两个类都是基于RAII技术进行设计的 RAII 利用对象生命周期来控制程序资源&#xff08;如内存&#xff0c;文件句柄&#xff0c;网络连接&#xff0c;互斥量等资源&#xff09;的技术&#xff0c;具体地说&#xff0c;就是…...

06 算法基础:算法的定义、表现形式(自然语言、伪代码、流程图)、五个特性(有穷性、确定性、可行性、输入、输出)、好算法的设计目标

目录 1 算法的定义 2 算法的三种表现形式 2.1 自然语言 2.2 伪代码 2.3 流程图 3 算法的五个特性 3.1 有穷性 3.2 确定性 3.3 可行性 3.4 输入 3.5 输出 4 好算法的设计目标 4.1 正确性 4.2 可读性 4.3 健壮性 4.4 通用性 4.5 高效率与低存储量 1 算法的定义 …...

【红外传感器】STM32C8T6标准库使用红外对管

好好学习&#xff0c;天天向上 前言一、了解红外二、标准库的代码1.infrared.c2.infrared.h3.main.c4 现象 总结 前言 红外线&#xff1a;频率介于微波与可见光之间的电磁波。 参考如下 【STM32】标准库与HAL库对照学习教程外设篇–红外避障传感器 光电红外传感器详解&#…...

STM32L010F4 最小系统设计

画一个 STM32L010F4 的测试板子...... by 矜辰所致前言 最近需要用到一个新的 MCU&#xff1a; STM32L010F4 &#xff0c;上次测试的 VL53L0X 需要移植到这个芯片上&#xff0c;网上一搜 STM32L010F4&#xff0c;都是介绍资料&#xff0c;没有最小系统&#xff0c;使用说明等。…...

AI 工具大赏:探索智能时代的得力助手

在当今这个科技飞速发展的时代&#xff0c;人工智能&#xff08;AI&#xff09;技术已经深入到我们生活的方方面面。从日常办公到创意设计&#xff0c;从学术研究到娱乐休闲&#xff0c;AI 工具正以其强大的功能和便捷的使用体验&#xff0c;成为人们不可或缺的得力助手。那么&…...

安通物流借助CRM重塑企业客户关系管理新格局

安通控股股份有限公司(以下简称"安通控股")是一家扎根集装箱多式联运物流产业的现代综合物流服务企业,致力于为客户提供绿色、经济、高效、安全的集装箱全程物流解决方案。 据Alphaliner排名统计,截至2023年10月,安通控股综合运力全球排名21位,位居国内内贸集装箱物…...

C++标准模板库--vector

vector 介绍 vector&#xff08;向量&#xff09;是一种序列容器&#xff0c;表示为可以改变大小的数组。vector中的元素使用连续的存储位置&#xff0c;这意味着也可以使用指向其元素的常规指针偏移量来访问任意元素&#xff0c;且与数组一样高效。但与数组不同的是&#xff…...

《Signal, Image and Video Processing》投稿避坑指南:从LaTeX排版到审稿全流程解析

1. 投稿前的准备工作 投稿到《Signal, Image and Video Processing》这类专业期刊&#xff0c;准备工作做得好能省去后期很多麻烦。首先得确认你的研究方向是否符合期刊范围&#xff0c;这个期刊主要接收信号处理、图像处理和视频处理相关的论文&#xff0c;主编的研究方向是深…...

芯片设计必看:AHB总线SRAM控制器中的DFT/BIST实现详解

芯片设计必看&#xff1a;AHB总线SRAM控制器中的DFT/BIST实现详解 在芯片设计领域&#xff0c;存储器测试一直是验证环节的重中之重。SRAM作为片上缓存的核心部件&#xff0c;其可靠性直接影响整个系统的稳定性。而AHB总线作为AMBA架构中最常用的高性能总线&#xff0c;如何在其…...

打破B站字幕提取壁垒:BiliBiliCCSubtitle如何重构视频文字信息获取范式

打破B站字幕提取壁垒&#xff1a;BiliBiliCCSubtitle如何重构视频文字信息获取范式 【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC字幕及转换的工具; 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle 在信息爆炸的视频时代&#xf…...

Axmol 2.11.0 LTS发布:聚焦稳定性与开发者体验的跨平台引擎升级

1. Axmol 2.11.0 LTS版本的核心价值 对于跨平台游戏开发者来说&#xff0c;选择一个稳定可靠的引擎版本往往比追求新功能更重要。Axmol 2.11.0作为长期支持&#xff08;LTS&#xff09;版本&#xff0c;正是瞄准了这个核心需求。我在实际项目中使用过多个版本的Axmol引擎&#…...

中央企业如何借助数智平台推动技术应用与创新

观点作者&#xff1a;科易网-国家科技成果转化&#xff08;厦门&#xff09;示范基地一、现状概述&#xff1a;成效与短板 中央企业在我国科技创新体系中占据核心地位&#xff0c;其技术成果转化效率直接关乎国家产业链韧性和产业升级进程。近年来&#xff0c;随着数字化浪潮席…...

VTJ.PRO 在线应用开发平台的项目模板(Web、H5、UniApp)

项目模板&#xff08;Web、H5、UniApp&#xff09; 本文档详细介绍了 VTJ.PRO 平台用于初始化新应用的启动项目模板。这些模板提供了必要的运行时环境、配置以及与 VTJ 引擎的集成&#xff0c;使低代码应用能够作为独立项目运行。 模板概述 该平台维护了三个不同的启动模板&a…...

Singularity镜像构建终极教程:从Docker到SIF的完整转换

Singularity镜像构建终极教程&#xff1a;从Docker到SIF的完整转换 【免费下载链接】singularity Singularity has been renamed to Apptainer as part of us moving the project to the Linux Foundation. This repo has been persisted as a snapshot right before the chang…...

python批量压缩解压文件

import os import zipfile from pathlib import Path# # 1. 批量解压所有 zip 文件 # def batch_unzip(zip_folder, save_folder):"""批量解压文件夹里所有 .zip 文件zip_folder: 存放压缩包的文件夹save_folder: 解压到哪里"""# 创建输出文件…...

Bitwarden Web Vault:终极密码管理平台完全指南

Bitwarden Web Vault&#xff1a;终极密码管理平台完全指南 【免费下载链接】web The website vault (vault.bitwarden.com). 项目地址: https://gitcode.com/gh_mirrors/web1/web Bitwarden Web Vault 是一款功能强大的开源密码管理平台&#xff0c;它以 Angular 应用为…...

Pixel 7 实战:从源码编译到刷入 Android 15 UserDebug 的避坑指南

1. 环境准备&#xff1a;避开依赖地狱的三大陷阱 第一次给Pixel 7编译Android 15 UserDebug版本时&#xff0c;我踩遍了所有能踩的坑。最让人崩溃的不是代码编译失败&#xff0c;而是环境配置这种本该简单的步骤。先说硬件要求&#xff1a;至少16GB内存200GB SSD&#xff0c;我…...