当前位置: 首页 > news >正文

Python实战:Pandas数据合并与重塑

本文将深入探讨Pandas库在数据合并与重塑方面的强大功能。我们将涵盖多种数据合并方法,如merge、join、concat等,以及数据重塑的技巧,如pivot_table、merge_asof等。

一、引言

Pandas是一个强大的Python数据分析库,它提供了丰富的数据结构和数据分析工具,使得数据处理变得简单易行。在数据分析和挖掘过程中,数据合并与重塑是常见的操作。Pandas提供了多种方法来实现这些操作,使得我们能够高效地处理数据。

二、数据合并

数据合并是将多个DataFrame对象合并成一个DataFrame对象的过程。在Pandas中,有多种方法可以实现数据合并,如merge、join、concat等。
1. concat
concat函数用于沿着指定轴将多个DataFrame对象合并成一个DataFrame对象。它支持不同的轴(axis),如0轴(行)和1轴(列)。

import pandas as pd
# 创建两个DataFrame对象
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3'],'C': ['C0', 'C1', 'C2', 'C3'],'D': ['D0', 'D1', 'D2', 'D3']},index=[0, 1, 2, 3])
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],'B': ['B4', 'B5', 'B6', 'B7'],'C': ['C4', 'C5', 'C6', 'C7'],'D': ['D4', 'D5', 'D6', 'D7']},index=[4, 5, 6, 7])
# 沿着0轴(行)合并
result_row = pd.concat([df1, df2])
# 沿着1轴(列)合并
result_col = pd.concat([df1, df2], axis=1)

2. merge
merge函数用于根据指定的键(key)将两个或多个DataFrame对象合并成一个DataFrame对象。它支持不同的连接方式,如内连接(inner)、外连接(left、right、outer)等。

# 创建两个DataFrame对象
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],'C': ['C0', 'C1', 'C2', 'C3'],'D': ['D0', 'D1', 'D2', 'D3']})
# 内连接
result_inner = pd.merge(df1, df2, on='key', how='inner')
# 左连接
result_left = pd.merge(df1, df2, on='key', how='left')
# 右连接
result_right = pd.merge(df1, df2, on='key', how='right')
# 外连接
result_outer = pd.merge(df1, df2, on='key', how='outer')

3. join
join函数用于根据索引将两个或多个DataFrame对象合并成一个DataFrame对象。它支持不同的连接方式,如内连接(inner)、外连接(left、right、outer)等。

# 创建两个DataFrame对象
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3'],'C': ['C0', 'C1', 'C2', 'C3']},index=[0, 1, 2, 3])
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],'B': ['B4', 'B5', 'B6', 'B7'],'D': ['D4', 'D5', 'D6', 'D7']},index=[4, 5, 6, 7])
# 内连接
result_inner = df1.join(df2, how='inner')
# 左连接
result_left = df1.join(df2, how='left')
# 右连接
result_right = df1.join(df2, how='right')
# 外连接
result_outer = df1.join(df2, how='outer')

三、数据重塑

数据重塑是将DataFrame对象转换成其他形式的过程,如转置、重塑、分组等。在Pandas中,可以使用多种方法来实现数据重塑,如pivot_table、merge_asof等。
1. pivot_table
pivot_table函数用于将DataFrame对象转换成 pivot 表。它可以根据指定的行键、列键和值键来重塑数据。

# 创建一个DataFrame对象
df = pd.DataFrame({'key1': ['A', 'A', 'B', 'B'],'key2': ['one', 'two', 'one', 'two'],'value': [10, 20, 30, 40]})
# 重塑数据
result = pd.pivot_table(df, values='value', index=['key1', 'key2'], columns='value')

2. merge_asof
merge_asof函数用于根据指定的键(key)和度量(measure)将两个DataFrame对象合并成一个DataFrame对象。它支持不同的连接方式,如内连接(inner)、左连接(left)等。

# 创建两个DataFrame对象
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],'C': ['C0', 'C1', 'C2', 'C3'],'D': ['D0', 'D1', 'D2', 'D3']})
# 内连接
result = pd.merge_asof(df1, df2, on='key', by='A', direction='nearest')

四、总结

本文详细介绍了Pandas在数据合并与重塑方面的功能。我们首先探讨了数据合并的方法,如concat、merge和join,以及它们的不同连接方式和应用场景。然后,我们介绍了数据重塑的方法,如pivot_table和merge_asof,以及它们在数据转换和分组方面的应用。

相关文章:

Python实战:Pandas数据合并与重塑

本文将深入探讨Pandas库在数据合并与重塑方面的强大功能。我们将涵盖多种数据合并方法,如merge、join、concat等,以及数据重塑的技巧,如pivot_table、merge_asof等。 一、引言 Pandas是一个强大的Python数据分析库,它提供了丰富…...

如何理解 Linux 命令行参数与环境变量7

一、命令行参数 1.1参数介绍 在写C语言程序时,main函数是否可以带参数呢?------ 是可以的 int argc: 命令行参数的个数char *argv[ ]: 字符指针数组(指向各个命令行参数的字符指针所构成的数组) 我们写一段代码来打印一下看这…...

奥特曼回应GPT5

欢迎再次与大家会面!在积累了大量的信息和趋势后,今天我们将深入了解 Sora、OpenAI 董事会、以及近期与其有关的所有声讨。我们将直接跳入与 OpenAI 首席执行官 Sam Altman 的深度访谈,探讨从 AGI 到 GPT-5 的未来,以及 Sam 对人工…...

QT----给程序添加上任务栏托盘图标和退出

让我们的程序拥有任务栏托盘图标,实现程序后台运行,退出等功能 1、关闭程序保持后台 重写关闭事件,忽略点击窗口关闭 void MainWindow::closeEvent(QCloseEvent *event) {// 隐藏窗口,而不是真正关闭setVisible(false);// 忽略关闭事件&am…...

arm地址对齐的总结

static void axi_azx_writeb(u8 value, u8 __iomem *addr) { u32 data; u32 offset; offset (u64)addr & 0x03; // 编译器不允许地址做& 操作时要强转为数据 addr (u8 __iomem *)((u64)addr & 0xFFFFFFFFFFFFFFFC); // __iomem是个64位的地址 u8表示从这个地址…...

就业班 2401--3.13 走进网络

走进网络 长风破浪会有时,直挂云帆济沧海。 1.认识计算机 1.计算机网络是由计算机和通讯构成的,网络研究的是“通信”。 ------1946 世界上第一台计算机 2.终端:只有输入和输出功能,没有计算和处理功能。 3.数据:一串…...

SWIFT介绍和学习(简单入门级别)

SWIFT介绍和学习 SWIFT功能介绍SWIFT快速使用LLM及LLM最佳实践(LLM系列文章)部署指南 vllm非官方介绍资料 项目地址:https://github.com/modelscope/swift 任何有疑惑的地方,参考项目首页readme寻求答案 SWIFT功能介绍 SWIFT&…...

智慧城市:提升城市治理能力的关键

目录 一、智慧城市的概念及特点 二、智慧城市在提升城市治理能力中的应用实践 1、智慧交通:提高交通治理效率 2、智慧政务:提升政府服务水平 3、智慧环保:加强环境监测与治理 4、智慧安防:提高城市安全水平 三、智慧城市在…...

golang 对接第三方接口 RSA 做签(加密) 验签(解密)

一、过程 1.调用第三方接口前,一般需要按规则将参数按key1value1&key2value2 阿斯克码排序,sign参数不参与加密 2.将排序并连接好的参数字符串通过我方的私钥证书(.pem)进行加密得到加密串,当然加密得到的是 []byte 字节流&…...

Spring Data访问Elasticsearch----Elasticsearch存储库Repositories

Spring Data访问Elasticsearch----Elasticsearch存储库Repositories 一、自动创建具有相应映射的索引二、存储库方法的注解2.1 Highlight2.2 SourceFilters 三、基于注解的配置四、Spring命名空间Namespace 本文包括Elasticsearch存储库实现的细节。 例1:示例Book实…...

初探 Cocos Creator: 碰撞与物理系统

前言 不知道你刚开始玩碰撞时,会不会遇到始终无法触发碰撞事件?玩物理系统时,自由落体的刚体会穿过 “地面” 刚体等情况?没错我全都遇到过,那么下面我就用红蓝色方块,简单实战一下 Cocos Creator 的碰撞与…...

Vue组件封装方案对比——v-if方式与内置component方式

近期在准备搭建一个通用组件库,而公司现有的各个系统也已有自己的组件库只是没抽离出来,但是目前有两套不同的组件封装方案,所以对于方案的选择比较困惑,于是对两种方式进行了对比,结合网上找到的一些开源组件库进行分…...

python与excel第四节 批量新增、删除工作表

在多个工作簿中批量新增工作表 假设,一个文件夹下面有多个excel文件,需要再每个excel文件中增加一个sheet。 例子: import osimport xlwings as xw file_path D:\\TEST\\python与excelfile_list os.listdir(file_path) sheet_name 产品…...

计算机网络——计算机网络体系结构

计算机网络——计算机网络体系结构 计算机网络体系结构的由来正确认识分层协议与层次划分著名的几个体系结构OSI体系结构TCP/IP体系结构5层体系结构 我们今天来了解一下计算机网络体系结构: 计算机网络体系结构的由来 俗话说,“没有规矩,不…...

近期常用linux命令总结

linux mv [options] source dest : 移动文件 cp [options] source : 复制文件 ps -a: 列出所有进程 ps -ef | grep 进程关键字: 查找指定进程 (-e 显示所有进程 -f 全格式) docker docker images 显示所有镜像 docker pull [IMAGE_NAME] : 拉取某个镜像&#xf…...

变配电站配电监控解决方案--变电站综合自动化系统

变电站综合自动化系统 Acrel-1000变电站综合自动化监控系统是我司根据电力系统自动化及无人值守的要求,总结国内外的研究和生产的先进经验专门研制出的新一代电力监控系统。本系统具有保护、遥测、遥信、遥脉、遥调、遥控功能,可实现无人或少人值守功能…...

【ollama】linux、window系统更改模型存放位置,全网首发2024!

首先是window系统 so easy 直接进入系统环境变量添加就行 其次是linux系统 全靠自己试出来的,去Ollama官网找半天文档不知道在哪,而且linux也没有说:【 https://github.com/ollama/ollama/blob/main/docs/README.md https://github.com/o…...

Spring 被打暴了! vs Javalin vs Solon

测试仅供参考。不同的环境、场景,效果会不同。 测试记录: 项目SpringBoot2SpringBoot3JavalinSolon运行时java 17java 17java 17java 17测试前状态/内存101.1Mb112.9Mb66.1Mb45.6Mb测试后状态/内存996.3Mb326.9Mb457.3Mb369.2Mb测试后状态/并发2万2.6万…...

IDEA中快速配置Git

Git介绍: Git下载 idea中配置Git...

vscode用SSH远程开发c语言

vscode配置远程 这里我使用虚拟机进行展示,首先需要你的虚拟机安装好ssh 没安装好就执行下面的命令安装并开启服务 sudo apt-get install ssh sudo service ssh start ps -e | grep sshvscode安装 remote-ssh扩展 点击左下角的远程连接,我这里已经连接…...

NNCF量化避坑指南:OpenVINO模型精度不掉速的5个关键配置

NNCF量化避坑指南:OpenVINO模型精度不掉速的5个关键配置 在工业级AI部署中,模型量化是提升推理效率的必经之路,但精度损失往往成为工程师的噩梦。上周团队在部署YOLOv8时,就因量化参数配置不当导致mAP下降12%,不得不连…...

android 14.0 framework下service下引用 opt目录下相关类编译不过的功能实现

1.前言 在14.0的系统rom定制化开发中,在某些产品中,对于在service下引用framewroks/opt下面的类 比如GsmSMSDispatcher类等,会出现找不到文件类的问题,接下来分析下相关问题的原因,然后 解决这个问题 2.framework下service下引用 opt目录下相关类编译不过的功能实现的核…...

如何快速搭建KCN-GenshinServer:原神一键GUI服务端完整指南

如何快速搭建KCN-GenshinServer:原神一键GUI服务端完整指南 【免费下载链接】KCN-GenshinServer 基于GC制作的原神一键GUI多功能服务端。 项目地址: https://gitcode.com/gh_mirrors/kc/KCN-GenshinServer KCN-GenshinServer是一款基于GC框架开发的原神一键G…...

深度实战指南:如何利用ExDark数据集构建完整的低光照视觉AI解决方案

深度实战指南:如何利用ExDark数据集构建完整的低光照视觉AI解决方案 【免费下载链接】Exclusively-Dark-Image-Dataset Exclusively Dark (ExDARK) dataset which to the best of our knowledge, is the largest collection of low-light images taken in very low-…...

Matlab高手进阶:用textscan函数解析日志文件,提取关键信息的完整流程

Matlab日志解析实战:textscan函数高效提取关键信息的全流程指南 当服务器日志像雪片般涌来时,工程师们常常面临一个共同困境——如何从海量非结构化文本中快速提取有价值的信息?Matlab的textscan函数正是解决这类问题的瑞士军刀。不同于简单的…...

告别枯燥文档!用VSCode+PlatformIO快速搭建LVGL模拟器,5分钟跑通第一个Demo

现代嵌入式GUI开发:5分钟用VSCodePlatformIO构建LVGL模拟环境 在嵌入式系统开发中,图形用户界面(GUI)的实现往往令人望而生畏。传统开发方式需要面对交叉编译、硬件调试、显示驱动适配等一系列复杂问题,而LVGL(Light and Versatile Graphics …...

AD9833信号发生器DIY:从原理图绘制到PCB打样,打造你的桌面级测试工具

AD9833信号发生器DIY:从原理图绘制到PCB打样,打造你的桌面级测试工具 在电子实验室里,一台可靠的信号发生器是不可或缺的基础设备。无论是调试射频电路、测试滤波器响应,还是验证传感器性能,都需要精确可控的信号源。商…...

FitGirl游戏启动器:3分钟掌握游戏下载与管理的终极指南

FitGirl游戏启动器:3分钟掌握游戏下载与管理的终极指南 【免费下载链接】Fitgirl-Repack-Launcher An Electron launcher designed specifically for FitGirl Repacks, utilizing pure vanilla JavaScript, HTML, and CSS for optimal performance and customizatio…...

别再只测电流了!用INA226模块同时搞定电压、电流、功率的完整配置流程(附STM32代码)

INA226三合一精密测量实战:电压、电流、功率同步采集的工程指南 在嵌入式系统设计中,精确的功率监测往往是项目成败的关键。无论是新能源领域的太阳能充电控制器,还是工业场景中的电机驱动系统,亦或是消费电子产品的电池管理系统…...

3分钟掌握深蓝词库转换:让你的输入习惯跨越所有设备

3分钟掌握深蓝词库转换:让你的输入习惯跨越所有设备 【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序 项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 你是否曾为在不同设备上输入效率大幅下降而烦恼&…...