当前位置：首页 > news >正文

Python - Pandas - 数据分析(2)

news 2026/2/8 21:52:43

pandas数据分析

Pandas数据分析2

前言
- 常用的21种统计方法
- - describe()：
  - numeric_only：
  - 偏度skewness：
  - - 功能：
    - 含义：
    - 计算公式：
    - 演示：
  - 峰度值：
  - - 用途：
    - 数值：
    - 计算公式：
    - 演示：
  - cov协方差
  - - 计算公式：
    - 数值：
    - 操作对象：
    - 演示：
  - corr相关系数：
  - - 计算公式：
    - 数值：
    - 操作对象：
    - 演示：
- 常用的5种数据处理函数：
- - map：
  - - 功能：
    - 字典map：
    - 函数map：
  - apply：
  - - 功能：
    - apply匿名lambda：
    - apply内置函数
    - apply自己的函数：
  - groupy()
  - - 不必having：
  - groupby + apply：
  - - 自定义排序：
    - 获取每组最值：
  - agg：
  - - 功能：
    - 字典指定内置函数：
    - groupby + agg：
  - lambda匿名函数：
  - lambda匿名函数数组：
- 常用的两种文件操作：
- - 读写csv文件：
  - - 读csv：
    - 写csv：
  - 读写excel文件：
  - - 读excel：
    - 写excel：

前言

Vue框架：从项目学Vue
OJ算法系列：神机百炼 - 算法详解
Linux操作系统：风后奇门 - linux
C++11：通天箓 - C++11

一行检查是否下载过Pandas：
pip list
一行下载：
pip install pandas

常用的21种统计方法

函数	功能
count	统计非空值个数
max	最大值
min	最小值
sum	求和
prod	乘积
cumsum	累和
cumprod	累乘
cummax	累积最大值
cummin	累积最小值
mean	平均值
std	标准差
var	方差
median	算数中位数
abs	绝对值
unique	唯一值列表
nunique	唯一值个数
value_counts	唯一值及其频数
skew	三阶偏度
kurt	四阶峰度
corr	相关系数矩阵
cov	协方差矩阵

describe()：

describe将显示所有数值型特征的count()，mean()，std()，max&min()等

import pandas as pd
dataframe = pd.DataFrame({'a' : [1, 2, 3, 4, 5],'b' : [1.1, 1.2, 1.3, 1.4, 1.5],'c' : ['a', 'b', 'c', 'd', 'e']
})
dataframe.describe()

describe()

numeric_only：

以上很多运算都只支持对int和float运算，其他类型需要对+等运算符重载
若此类运算未对运算符或运算函数重载，则可能自动忽略，也可能报错终止
大多情况上述统计学函数都搭配slice切片使用

# 均值
print(DataFrame.mean())# 标准差
print(DataFrame.std())# 累和
print(DataFrame.cumsum())# 累乘
print(DataFrame.iloc[:, 0:2].cumprod())

cumsum

偏度skewness：

功能：

用于描述数据的不对称性

含义：

skewness == 0：正态分布
skewness > 0：正偏差数值较大，数据右侧有很多极端值，整体分布右偏/正偏
skewness < 0：负偏差数值较大，数据左侧有很多极端值，整体分布左偏/负偏

计算公式：

$(\sqrt{D(x)})^3]$

演示：

import numpy as np
dataframe = pd.DataFrame({'id' : np.arange(10),#等比数列：起点、终点、个数，幂'value' : np.logspace(1, 10, 10, base = 2),#等差数列：起点、终点、个数'weight' : np.linspace(1, 10, 10)           
})
print(dataframe)
#skew()>0，value右侧异常值比较多
print(dataframe.skew())

skew

画图看看：

#挑选数值型特征
num_feats = dataframe.dtypes[dataframe.dtypes != 'object'].index
import matplotlib.pyplot as plt
plt.figure(figsize = (8, 8))#8inch * 8inch
fig, ax = plt.subplots(2, 2) 
for row in range(2):for col in range(2):if row*2+col > 2 :continuedata = dataframe[num_feats[row*2+col]]ax[row][col].plot(data.index, data.values)ax[row][col].set_title(f'{num_feats[row*2+col]}')
# 自动保持子图之间的正确间距。
fig.tight_layout()
plt.show()

skew

峰度值：

用途：

描述某个变量所有取值分布形态陡缓程度的统计量，即数据分布的尖锐程度

数值：

kurtosis == 0：陡缓程度和正态分布相同
kurtosis > 0：比正态分布高峰陡峭，尖顶峰
kurtosis < 0：比正态分布高峰平和，平顶峰

计算公式：

$(\sqrt{D(x)})^4] - 3$

演示：

继续使用上组数据演示：

print(dataframe.kurt())

kurt

cov协方差

计算公式：

$co v (X, Y) = E [(X - E [X]) * (Y - E [Y])],$

E[X]代表变量X的期望。
从直观上来看,协方差表示的是两个变量总体误差的期望。
如果其中一个大于自身的期望值时另外一个也大于自身的期望值,两个变量之间的协方差就
是正值；
如果其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果X与Y是统计独立的,那么二者之间的协方差就是0

数值：

corr()返回相关系数，介于[-1, 1]
|-1| 和 |1| 表示线性相关
正负号表示正负相关

操作对象：

对于含有n个特征值的DataFrame，两两之间计算协方差，构成n*n的矩阵
协方差矩阵中对角线上是方差，非对角线是协方差

演示：

继续使用以上数据：

dataframe.cov()

cov

corr相关系数：

计算公式：

基于cov协方差
$\sqrt{[D(X)]} \sqrt{[D(Y)}]$

数值：

corr()计算介于[-1, 1]的相关系数
|-1| 和 |1| 表示线性相关
正负号表示正负相关

操作对象：

对于含有n个特征值的DataFrame，两两之间计算相关系数，构成n*n的矩阵
相关系数矩阵中对角线上永远是1

演示：

继续使用上述数据：

dataframe.corr()

corr

常用的5种数据处理函数：

map：

示意图：

功能：

依据给定的函数 / 字典，将DataFrame / Series中一列内每个值转化为其他数值

字典map：

为DataFrame / Series .map()方法，传递一个字典

#转型字典
gendermap = {'F' : 0, 'M' : 1}#数据
dataframe = pd.DataFrame({"name":['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli', 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony'],"gender":['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],"age":np.random.randint(15,50,10),"salary":np.random.randint(5,50,10),})#map方法
dataframe['gender'] = dataframe['gender'].map(gendermap)
print(dataframe)

dictionary_map

函数map：

为DataFrame / Series 的.map()传递进入一个函数指针

dataframe = pd.DataFrame({"name":['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli', 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony'],"gender":['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],"age":np.random.randint(15,50,10),"salary":np.random.randint(5,50,10),})
print(dataframe)
print('*'*40)#转型函数
def gender_map(x) :gender = 0 if x == 'F' else 1return genderdataframe['gender'] = dataframe['gender'].map(gender_map)print(dataframe)

function_map

apply：

功能：

遍历整个Series 和 DataFrame，对每个元素运行指定的函数，可以是自定义函数，也可以是上述的21种内置函数等等

apply匿名lambda：

df=pd.DataFrame({"name":['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli', 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony'],"gender":['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],"age":np.random.randint(15,50,10),"salary":np.random.randint(5,50,10),})print(df)
print('*'*40)
print(df[['age', 'salary']].apply(lambda x: x*2))

apply内置函数

确定可以执行内置函数的是哪些列

#传入的函数也可以是pandas和python内置函数
print(df[['age', 'salary']].apply(max))
print('*'*30)
print(df[['age', 'salary']].apply(np.mean))

apply内置函数

apply自己的函数：

#按值遍历调用
def apply_func(row):a = row['name']b = row['gender']c = row['age']return f'name:{a},gender:{b}, age:{c}'#原地修改，增加一列all
df["all"] = df.apply(lambda row:apply_func(row), axis = 1)
#axis = 1，每次row为dataframe内的一行
print(df)

apply个人函数

groupy()

功能同于Mysql中的groupby()，by参数可以传递入多个特征值
传递入多个特征值时，分组是多个特征的排列组合，见下面的dfc.groupby(by=[‘gender’,‘age’])

不必having：

groupby()之后的操作都是针对每一组内部

import numpy as np
dfc=pd.DataFrame({"name":['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli', 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony'],"gender":['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],"age":np.random.randint(25,28,10),"salary":np.random.randint(5,50,10),})#划分成组后求对应组的和结果
print(dfc.groupby(by='gender').sum())
print("*"*25)
# groupby查传入的可以时多个属性
print(dfc.groupby(by=['gender','age']).sum())

groupby()

groupby + apply：

apply()传入参数：
1. lambda
2. 内置func()
3. 个人所写函数
apply对象：
经过groupby()之后的多个小组，也就是子DataFrame

自定义排序：

对于每个子DataFrame执行sort_values()即可

df=pd.DataFrame({"name":['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli', 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony'],"gender":['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],"age":np.random.randint(25,28,10),"salary":np.random.randint(5,50,10),})
print(df)
print('*'*40)#此处的x也是一个dataframe
def group_staff_salary(x):df1 = x.sort_values(by = 'salary',ascending=True)
#ascending = True为从大到小的顺序，默认倒序return df1df.groupby('gender',as_index=True).apply(group_staff_salary)

groupby + apply = order

获取每组最值：

限制每个子DataFrame返回对象即可

#只看每组最高工资：
df=pd.DataFrame({"name":['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli', 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony'],"gender":['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],"age":np.random.randint(25,28,10),"salary":np.random.randint(5,50,10),})
print(df)
print("*"*40)#此处的x也是一个dataframe
def group_staff_salary(x):df1 = x.sort_values(by = 'salary',ascending=True)return df1.iloc[-1, :]df.groupby('gender',as_index=True).apply(group_staff_salary)

查询到男女两方最高工资者信息：

agg：

功能：

同时为一组数据指定多个执行函数

字典指定内置函数：

字典的key是DataFrame的特征，字典的value是要对特征值执行的函数
要对字典执行的函数很多时，可以传递数组

# 1:字典：key为列，val为操作函数
df=pd.DataFrame({"name":['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli', 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony'],"gender":['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],"age":np.random.randint(25,28,10),"salary":np.random.randint(5,50,10),})df.agg({'age':['max'], 'salary':['mean', 'std']})

value作为行Index，key作为列Index

groupby + agg：

agg内许多函数的操作对象是groupby之后的子DataFrame的所有列：

df.groupby('gender').agg(['max', 'min', 'median'])

group作行Index，agg内函数作列index：

lambda匿名函数：

agg内参数也可以是lambda表达式

df.groupby(['gender']).agg(lambda x: x.mean()-x.min())

groupby的特征值作为行Index，非by的特征值作为列Index

lambda匿名函数数组：

agg()内参数也可以是lambda表达式数组

df.groupby(['gender']).agg([lambda x: x.max()-x.min(), lambda x: x.mean()-x.min()])

行Index为by的特征，列Index为lambda函数名

常用的两种文件操作：

读写csv文件：

读csv：

pd.read_csv('./test.csv')

写csv：

df.to_csv('./test.csv',index=False)
#不写行名

读写excel文件：

读excel：

pd.read_excel('./test.xlsx')

写excel：

df.to_excel('./test.xlsx',index=True)
#写行名

Python - Pandas - 数据分析(2)

Pandas数据分析2前言常用的21种统计方法describe()：numeric_only：偏度skewness：功能：含义：计算公式：演示：峰度值：用途：数值：计算公式：演示&#x…...

编程日记 2023/4/15 23:20:58

我的十年编程路 2019年篇

随着2018年，三星天津研究院的裁撤，我选择了到广州的三星研究院工作，与最心爱的她开始一起生活。这一年的开始，我注册了博客园。和2014年类似，在刚注册不久，我写了一篇题为《全新开始，全心出发…...

编程日记 2023/4/15 23:20:53

（蓝桥真题）剪格子（搜索+剪枝）

样例1输入： 3 3 10 1 52 20 30 1 1 2 3 样例1输出： 3 样例2输入： 4 3 1 1 1 1 1 30 80 2 1 1 1 100 样例2输出： 10 分析：这道题目我们直接从(1,1)点开始进行dfs搜索即可，但是需要注意一点的是我们搜…...

编程日记 2023/4/15 23:20:47

Kalman Filter in SLAM (3) ——Extended Kalman Filter (EKF, 扩展卡尔曼滤波)

文章目录1. 线性系统的 Kalman Filter 回顾2. Extended Kalman Filter 之 DR_CAN讲解笔记2.1. 非线性系统2.2. 非线性系统线性化2.2.1. 状态方程f(xk)f(x_k)f(xk)在上一次的最优估计状态x^k−1\hat{x}_{k-1}x^k−1处线性化2.2.2. 观测方程h(xk)h(x_k)h(xk)在这一次的预测…...

编程日记 2023/4/15 23:20:40

关于vertical-align的几问

vertical-align属性可以给我讲解一下吗？ 当使用table-cell布局或inline元素时，可以使用CSS的vertical-align属性控制元素的垂直对齐方式。该属性可应用于元素本身以及其父元素（例如，td、th、tr和table）。以下是vertic…...

编程日记 2023/4/13 19:22:33

【拜占庭将军问题】这一计谋，可以让诸葛丞相兴复汉室

我们都知道，诸葛亮第一次北伐是最可能成功的，魏国没有防备，还策反了陇西，陇西有大量的马匹可以装备蜀国骑兵，可惜街亭一丢，那边就守不住了当时我不在，只能作诗一首~ 如果穿越过去，…...

编程日记 2023/4/15 23:20:37

【Linux】 -- make/Makefile

目录 Linux项目自动化构建工具 – make/Makefile 背景依赖关系和依赖方法多文件编译项目清理 make原理 Linux项目自动化构建工具 – make/Makefile 背景一个工程的源文件不计其数按照其类型、功能、模块分别放在若干个目录当中 Makefile定义了一系列的规则来指定&…...

编程日记 2023/4/15 23:20:31

Forter 对支付服务商应对欺诈的四个建议和Gartner的两个关键结论

Gartner新版2023年度《线上欺诈检测市场指南》发布恰逢其时－企业正面临来自专业黑产和欺诈者与日俱增的压力。而在2023年，许多商户将调整反欺诈策略，对拒付率和转化率进行更严格的监测，以最大限度减少损失并增加营收。以下是Gartn…...

编程日记 2023/4/15 23:20:29

ANR系列（二）——ANR监听方案之IdleHandler

前言关于IdleHandler，比较多同学错误地认为，这个Handler的作用是主线程空闲状态时才执行它，那么用它做一些耗时操作也没所谓。可是IdleHandler在主线程的MessageQueue中，执行queueIdle()默认当然也是执行在主线程中的&#xff0…...

编程日记 2023/4/15 23:20:23

数学小课堂：数学和自然科学的关系（数学方法，让自然科学变成科学体系。）

文章目录引言I 数学方法，让自然科学变成科学体系。1.1 天文学1.2 博物学1.3 化学1.4 医药学1.5 物理学II 自然科学的升华过程III 数学方法的意义引言 19世纪初，英国人把采用实验的方法，系统地构造和组织知识，解释和预测自然的学问称为科学。科学研究的是自然现象和自然…...

编程日记 2023/4/15 23:20:17

思路比较容易想到，因为口罩全部只有15批，因此直接暴力dfs搜索即可 //dfs #include<bits/stdc.h> using namespace std; int ans 9999; int num[] {9090400, 8499400, 5926800, 8547000, 4958200, 4422600, 5751200, 4175600, 6309600, 5865200, …...

编程日记 2023/4/15 23:20:12

第五章：C语言数据结构与算法之双向带头循环链表

系列文章目录文章目录系列文章目录前言一、哨兵位的头节点二、双向链表的结点三、接口函数的实现1、创建结点2、初始化3、尾插与尾删4、头插与头删5、打印6、查找7、随机插入与随机删除8、判空、长度与销毁四、顺序表和链表的对比1. 不同点2. 优缺点五、缓存命中1、缓存2、缓存…...

编程日记 2023/3/9 19:54:26

一文带你了解，前端模块化那些事儿

文章目录前端模块化省流：chatGPT 总结一、参考资料二、发展历史1.无模块化引出的问题:横向拓展2.IIFE3.Commonjs(cjs)4.AMD引出的问题：5.CMD6.UMD7.ESM往期精彩文章前端模块化省流：chatGPT 总结该文章主要讲述了前端模块化的发展历史和各个…...

编程日记 2023/3/9 19:53:23

（六十五）大白话设计索引的时候，我们一般要考虑哪些因素呢？（中）

今天我们继续来说一下，在设计索引的时候要考虑哪些因素。之前已经说了，你设计的索引最好是让你的各个where、order by和group by后面跟的字段都是联合索引的最左侧开始的部分字段，这样他们都能用上索引。但是在设计索引的时候还得考虑其他的…...

编程日记 2023/3/9 19:52:20

Spring事务管理

文章目录1 事务1.1 需求1.2 原因分析1.3 错误解决1.4 yml配置文件中开启事务管理日志1 事务 1.1 需求当部门解散了不仅需要把部门信息删除了，还需要把该部门下的员工数据也删除了。可当在删除员工数据出现异常时，就不会执行删除员工操作，出…...

编程日记 2023/3/9 19:51:17

数字化工厂装配线生产管理看板系统

电力企业业务复杂，组织结构复杂，不同的业务数据，管理要求也不尽相同。生产管理看板系统针对制造企业的生产应用而开发，能够帮助企业建立一个规范准确即时的生产数据库。企业现状：1、计划不清晰：生产计划不能…...

编程日记 2023/4/12 0:52:30

vxe-grid 全局自定义filter过滤器，支持字典过滤

一、vxe-table的全局筛选器filters的实现官网例子：https://vxetable.cn/#/table/renderer/filter 进入之后：我们可以参照例子自行实现，也可以下载它的源码，进行调整下载好后并解压，用vscode将解压后的文件打开。全局…...

编程日记 2023/3/9 19:49:09

ECharts 环形图组件封装

一、ECharts引入1.安装echarts包npm install echarts --save2.引入echarts这里就演示全局引入了，挂载到vue全局，后面使用时，直接使用 $echartsimport * as echarts from echarts Vue.prototype.$echarts echarts二、写echarts组件这里演示环…...

编程日记 2023/3/9 19:48:05

c++ 怎么调用python 提供的函数接口

在 C 中调用 Python 函数有多种方法，以下是其中的两种常见方法：使用 Python/C APIPython 提供了 C/C API，可以通过该 API 在 C 中调用 Python 函数。使用这种方法，需要先将 Python 解释器嵌入到 C 代码中，然后可以通过…...

编程日记 2023/3/9 19:47:02

【动态规划】背包问题（01背包，完全背包）

Halo，这里是Ppeua。平时主要更新C语言，C，数据结构算法......感兴趣就关注我吧！你定不会失望。 🌈个人主页：主页链接 🌈算法专栏：专栏链接我会一直往里填充内容哒！ &…...

编程日记 2023/3/9 19:45:59

XML Group端口详解

在XML数据映射过程中，经常需要对数据进行分组聚合操作。例如，当处理包含多个物料明细的XML文件时，可能需要将相同物料号的明细归为一组，或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码，增加了开…...

编程新知 2026/2/8 4:37:34

【Python】 -- 趣味代码 - 小恐龙游戏

文章目录文章目录 00 小恐龙游戏程序设计框架代码结构和功能游戏流程总结01 小恐龙游戏程序设计02 百度网盘地址00 小恐龙游戏程序设计框架这段代码是一个基于 Pygame 的简易跑酷游戏的完整实现，玩家控制一个角色（龙）躲避障碍物（仙人掌和乌鸦）。以下是代码的详细介绍：…...

编程新知 2026/2/8 20:43:07

ubuntu搭建nfs服务centos挂载访问

在Ubuntu上设置NFS服务器在Ubuntu上，你可以使用apt包管理器来安装NFS服务器。打开终端并运行： sudo apt update sudo apt install nfs-kernel-server创建共享目录创建一个目录用于共享，例如/shared： sudo mkdir /shared sud…...

编程新知 2026/2/6 23:18:59

可靠性+灵活性：电力载波技术在楼宇自控中的核心价值

可靠性灵活性：电力载波技术在楼宇自控中的核心价值在智能楼宇的自动化控制中，电力载波技术（PLC）凭借其独特的优势，正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据，无需额外布…...

编程新知 2025/9/27 2:43:26

DBAPI如何优雅的获取单条数据

API如何优雅的获取单条数据案例一对于查询类API，查询的是单条数据，比如根据主键ID查询用户信息，sql如下： select id, name, age from user where id #{id}API默认返回的数据格式是多条的，如下： {&qu…...

编程新知 2026/2/2 22:06:13

零基础设计模式——行为型模式 - 责任链模式

第四部分：行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习！行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。核心思想：使多个对象都有机会处…...

编程新知 2026/1/31 9:33:18

【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分

一、项目背景回顾前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。本弹重点聚焦于服务端的模块划分与架构设计，提升代码结构的可维护性与扩展性。二、服务端模块设计目标高内聚低耦合：各模块职责清晰，便于独立开发…...

编程新知 2025/10/13 4:15:41

AspectJ 在 Android 中的完整使用指南

一、环境配置（Gradle 7.0 适配） 1. 项目级 build.gradle // 注意：沪江插件已停更，推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

编程新知 2025/7/7 22:33:57

ip子接口配置及删除

配置永久生效的子接口，2个IP 都可以登录你这一台服务器。重启不失效。永久的 [应用] vi /etc/sysconfig/network-scripts/ifcfg-eth0修改文件内内容 TYPE"Ethernet" BOOTPROTO"none" NAME"eth0" DEVICE"eth0" ONBOOT&q…...

编程新知 2025/10/26 5:04:25

wpf在image控件上快速显示内存图像

wpf在image控件上快速显示内存图像https://www.cnblogs.com/haodafeng/p/10431387.html 如果你在寻找能够快速在image控件刷新大图像（比如分辨率3000*3000的图像）的办法，尤其是想把内存中的裸数据（只有图像的数据，不包…...

编程新知 2026/1/31 9:25:11

Pandas数据分析2

前言

常用的21种统计方法

describe()：

numeric_only：

偏度skewness：

功能：

含义：

计算公式：

演示：

峰度值：

用途：

数值：

计算公式：

演示：

cov协方差

计算公式：

数值：

操作对象：

演示：

corr相关系数：

计算公式：

数值：

操作对象：

演示：

常用的5种数据处理函数：

map：

功能：

字典map：

函数map：

apply：

功能：

apply匿名lambda：

apply内置函数

apply自己的函数：

groupy()

不必having：

groupby + apply：

自定义排序：

获取每组最值：

agg：

功能：

字典指定内置函数：

groupby + agg：

lambda匿名函数：

lambda匿名函数数组：

常用的两种文件操作：

读写csv文件：

读csv：

写csv：

读写excel文件：

读excel：

写excel：

相关文章：