当前位置: 首页 > news >正文

27 pandas 数据透视

文章目录

  • pivot_table 函数
    • 1、index需要聚合的列名,默认情况下聚合所有数据值的列
    • 2、values在结果透视的行上进行分组的列名或其它分组键【就是透视表里显示的列】
    • 3、columns在结果透视表的列上进行分组的列名或其它分组键
    • 4、Aggfunc聚合函数或函数列表(默认情况下是mean)可以是groupby里面的任意有效函数
    • 5、fill_value 在结果表中替换缺失值
    • 6、dropna 如果为True,将不含所有条目均为Na的列(默认为False)
    • 7、margins 添加行/列小计和总计 (默认为False)
  • 交叉表 crosstab

pivot_table 函数

在这里插入图片描述

1、index需要聚合的列名,默认情况下聚合所有数据值的列

import pandas as pd
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'])
print(data2)

在这里插入图片描述

2、values在结果透视的行上进行分组的列名或其它分组键【就是透视表里显示的列】

import pandas as pd
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'],values=['数量','金额'])
print(data2)

在这里插入图片描述

3、columns在结果透视表的列上进行分组的列名或其它分组键

import pandas as pd
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'],values=['数量','金额'],columns='所属区域')
print(data2)

在这里插入图片描述

4、Aggfunc聚合函数或函数列表(默认情况下是mean)可以是groupby里面的任意有效函数

import pandas as pd
import numpy as np
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'],values=['数量','金额'],columns='所属区域',aggfunc=[sum,np.mean])
print(data2)

在这里插入图片描述

5、fill_value 在结果表中替换缺失值

在这里插入图片描述

6、dropna 如果为True,将不含所有条目均为Na的列(默认为False)

在这里插入图片描述

7、margins 添加行/列小计和总计 (默认为False)

在这里插入图片描述

交叉表 crosstab

在这里插入图片描述

在这里插入图片描述

相关文章:

27 pandas 数据透视

文章目录pivot_table 函数1、index需要聚合的列名,默认情况下聚合所有数据值的列2、values在结果透视的行上进行分组的列名或其它分组键【就是透视表里显示的列】3、columns在结果透视表的列上进行分组的列名或其它分组键4、Aggfunc聚合函数或函数列表(默…...

1.2 学习环境准备

文章目录1.MariaDB简介2.MariaDB服务端和客户端安装1.MariaDB简介 因为MariaDB作为MySQL的延申,其包含MySQL所有的有点,并且其包含了更丰富的特性。比如微秒的支持、线程池、子查询优化、组提交、进度报告等; 所以我们接下来将已MariaDB作为…...

Http1.0协议常识

组织:中国互动出版网(http://www.china-pub.com/)RFC文档中文翻译计划(http://www.china-pub.com/compters/emook/aboutemook.htm)E-mail:ouyangchina-pub.com译者:黄晓东(黄晓东 xd…...

“终于懂了” 系列:组件化框架 ARouter 完全解析(三)AGP/Transform/ASM—动态代码注入

ARouter系列文章: “终于懂了” 系列:组件化框架 ARouter 完全解析(一)原理全解 “终于懂了” 系列:组件化框架 ARouter 完全解析(二)APT—帮助类生成 “终于懂了” 系列:组件化框架…...

传闻腾讯引进Quest 2?我觉得可行性很低

根据36kr最新消息称,腾讯XR团队解散后,确定不碰XR硬件领域,但并未完全放弃XR规划,将转变思路和玩法,业内消息称腾讯计划引进Meta旗下Quest 2 VR一体机。消息称,该计划在2022年11月份XR部门负责人沈黎走后便…...

【数据集】CMIP6气候模式数据下载

1 CMIP6简介 目前,国际耦合模式比较计划(Coupled Model Intercomparison Project, CMIP) 已经发展到第六阶段(CMIP6)。CMIP6模式采用了较以往更加合理的参数化方案,综合考虑了大气中温室气体排放、气溶胶浓度及社会经济、科学技术发展及政府规划等多方面的综合影响,将提…...

华为OD机试 - 最长的元音字符串 | 机试题算法思路 【2023】

最近更新的博客 华为OD机试 - 简易压缩算法(Python) | 机试题算法思路 【2023】 华为OD机试题 - 获取最大软件版本号(JavaScript) 华为OD机试 - 猜字谜(Python) | 机试题+算法思路 【2023】 华为OD机试 - 删除指定目录(Python) | 机试题算法思路 【2023】 华为OD机试 …...

浅谈c++引用

浅谈c 在这里开设 <<浅谈C>> 系列专题,针对C重点内容展开探讨与观察底层,同时也是一个面试专栏,所选知识大多为面试常见问题.前期较为基础,难度会逐渐上升哦~ 本专栏采用经典的哲学三段论编写:是什么|为什么|怎么做 力图精简,高效. 第一章: 浅谈C函数重载 传送门…...

2023什么是分销商城?怎么搭建分销商城

当实体机构都接连探索线上营销模式的时候&#xff0c;分销也随着社交电商的兴起应运而生。 大家好&#xff0c;我是你们熟悉而又陌生的好朋友梦龙&#xff0c;一个创业期的年轻人 它借助裂变效率高的属性&#xff0c;建立更多用户触点&#xff0c;更好的提升企业运营的势能&am…...

408数据结构考点总结

文章目录第一章 绪论考点 1&#xff1a;时间复杂度与空间复杂度时间复杂度空间复杂度第二章 线性表考点 2&#xff1a;顺序表考点 3&#xff1a;单链表第三章 栈和队列考点 4&#xff1a;栈和队列的基本性质考点5&#xff1a;循环队列考点6&#xff1a;双端队列输出受限的双端队…...

虹科分享 | 网络流量监控 | 你的数据能告诉你什么:解读网络可见性的4种数据类型

要了解网络性能问题的原因&#xff0c;可见性是关键。而这四种数据类型&#xff08;流、数据包、SNMP和API&#xff09;都在增强网络可见性方面发挥着重要作用。 流 流是通过网络发送的数据的摘要。流类型不同&#xff0c;可以包括NetFlow, sFlow, jFlow和IPFIX。不同的流类型…...

SpringBoot日志框架使用详解

几种常见的日志级别由低到高分为&#xff1a;TRACE < DEBUG < INFO < WARN < ERROR < FATAL 。如何理解这个日志级别呢&#xff1f;很简单&#xff0c;如果项目中的日志级别设置为INFO &#xff0c;那么比它更低级别的日志信息 就看不到了&#xff0c;即是TRACE…...

剑指offer-消失的数字、数组中出现的次数

消失的数字 解法一&#xff1a;求和相减 假设nums为[0,1,2,4],消失的数字为3&#xff0c;完整的数组应该是[0,1,2,3,4]&#xff0c;则sum101247,sum20123410&#xff0c;我们很容易发现 sum2-sum1 01234 - 0124 3&#xff0c;即为消失的数字。因此&#xff0c;我们可以采用先…...

axios请求配置baseURL选项

在src同级目录创建 &#xff08;1&#xff09;.env.delelopment : 开发模式时调用 &#xff08;2&#xff09;.env.production &#xff1a;生产模式时调用 &#xff08;3&#xff09;.env.testing : 测试模式时调用 # 页面标题 VITE_APP_TITLE 若依管理系统# 生产环境配…...

风储VSG-基于虚拟同步发电机的风储并网系统MATLAB仿真

MATLAB2021b版本仿真模型&#xff1a;风力发电机模块、储能控制模块、功率计算模块、VSG控制模块、电压电流双环控制模块。永磁同步风机输出功率、储能系统输出功率以及逆变器输出功率曲线。直流母线电压波动曲线。逆变器输出电压、电流曲线。完整模型见博主资源&#xff01;&a…...

vim常用命令

vim常用三种模式 命令模式&#xff08;Command mode&#xff09; 插入模式&#xff08;Insert mode&#xff09; 末行模式&#xff08;Last line mode&#xff09; &#xff08;一&#xff09;进入命令模式 vi 或者 vim&#xff08;二&#xff09;命令模式 -> 插入模式 &…...

华为OD机试 - 最差产品奖 | 机试题算法思路 【2023】

最近更新的博客 华为OD机试 - 简易压缩算法(Python) | 机试题算法思路 【2023】 华为OD机试题 - 获取最大软件版本号(JavaScript) 华为OD机试 - 猜字谜(Python) | 机试题+算法思路 【2023】 华为OD机试 - 删除指定目录(Python) | 机试题算法思路 【2023】 华为OD机试 …...

HR:你会Python数据分析吗?

之前看到一个段子&#xff1a; 以前去面试&#xff0c;HR会问你“精通office吗&#xff1f;” 现在去面试&#xff0c;HR会问你“会Python数据分析吗&#xff1f;” 图片来源&#xff1a;网络 大数据时代&#xff0c;无论是数据分析师、研发&#xff0c;到运营、市场、产品经…...

算法18:LeetCode_链表相关算法题

链表无小事&#xff0c;只要是涉及到链表的算法题&#xff0c;边界值的设定尤为重要&#xff0c;而且及其容易出错误。这就要求我们平时多加练习。但是&#xff0c;我们在面试和笔试的过程中往往会碰到链表相关的题目&#xff0c;所以我们在笔试的时候一般都会借助系统提供的工…...

SpringBoot集成Tomcat服务

文章目录一、Tomcat集成1、依赖层级2、自动化配置二、Tomcat架构三、Tomcat配置1、基础配置2、属性配置类3、配置加载分析四、周期管理方法1、控制类2、核心方法使用的成本越低&#xff0c;内部封装越复杂&#xff1b; 一、Tomcat集成 1、依赖层级 在SpringBoot框架的web依赖…...

第19节 Node.js Express 框架

Express 是一个为Node.js设计的web开发框架&#xff0c;它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用&#xff0c;和丰富的HTTP工具。 使用Express可以快速地搭建一个完整功能的网站。 Expre…...

vscode里如何用git

打开vs终端执行如下&#xff1a; 1 初始化 Git 仓库&#xff08;如果尚未初始化&#xff09; git init 2 添加文件到 Git 仓库 git add . 3 使用 git commit 命令来提交你的更改。确保在提交时加上一个有用的消息。 git commit -m "备注信息" 4 …...

Cursor实现用excel数据填充word模版的方法

cursor主页&#xff1a;https://www.cursor.com/ 任务目标&#xff1a;把excel格式的数据里的单元格&#xff0c;按照某一个固定模版填充到word中 文章目录 注意事项逐步生成程序1. 确定格式2. 调试程序 注意事项 直接给一个excel文件和最终呈现的word文件的示例&#xff0c;…...

渲染学进阶内容——模型

最近在写模组的时候发现渲染器里面离不开模型的定义,在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容,其实不管是方块还是方块实体,都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器,用于动态创…...

基于数字孪生的水厂可视化平台建设:架构与实践

分享大纲&#xff1a; 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年&#xff0c;数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段&#xff0c;基于数字孪生的水厂可视化平台的…...

MySQL 8.0 OCP 英文题库解析(十三)

Oracle 为庆祝 MySQL 30 周年&#xff0c;截止到 2025.07.31 之前。所有人均可以免费考取原价245美元的MySQL OCP 认证。 从今天开始&#xff0c;将英文题库免费公布出来&#xff0c;并进行解析&#xff0c;帮助大家在一个月之内轻松通过OCP认证。 本期公布试题111~120 试题1…...

JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作

一、上下文切换 即使单核CPU也可以进行多线程执行代码&#xff0c;CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短&#xff0c;所以CPU会不断地切换线程执行&#xff0c;从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...

OpenLayers 分屏对比(地图联动)

注&#xff1a;当前使用的是 ol 5.3.0 版本&#xff0c;天地图使用的key请到天地图官网申请&#xff0c;并替换为自己的key 地图分屏对比在WebGIS开发中是很常见的功能&#xff0c;和卷帘图层不一样的是&#xff0c;分屏对比是在各个地图中添加相同或者不同的图层进行对比查看。…...

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库&#xff0c;专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性&#xff0c;并提供了一个通用的框架&…...

R语言速释制剂QBD解决方案之三

本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...