当前位置：首页 > news >正文

038—pandas 重采样线性插补

news 2026/2/10 16:40:16

前言

在数据处理时，由于采集数据量有限，或者采集数据粒度过小，经常需要对数据重采样。在本例中，我们将实现一个类型超分辨率的操作。

思路：

首先将原始数据长度扩展为 3 倍，可以使用 loc[] 方法对索引扩展来生成，同时去掉尾部多余的数据。
再将每行数据扩展出的数据挖去（设置为空），这个操作我们在案例使用 explode() 后不复制其他列中有过讲解。
最后使用 DataFrame 的 interpolate() 插补方法会默认按线性逻辑进行填充。

使用步骤

读入数据

代码如下（示例）：

import pandas as pd
import numpy as npdf = pd.DataFrame({'A': [10, 20, 50, 40, 80,],'B': [2, 8, 10, 6, 4, ],})df
# 这个数据共有 5 行，现在我们需要扩展它，在前相邻两个数据之间由一个扩展为 3 个。如 0 和 1 之间再增加两个数据，最终数据为 13 行。
# 新增加的数据行，按整体按线性插补的算法补充。

在这里插入图片描述

# 将索引重复三次：
df.index.repeat(3)

在这里插入图片描述

# 将得到的索引传入 loc[] 得到扩展数据：
df.loc[df.index.repeat(3)]

在这里插入图片描述

# 去掉尾部多余的数据：
(df.loc[df.index.repeat(3)].iloc[:-3+1] # 删除最后三个（可为变量），再保留1个，方便以后封装
)

在这里插入图片描述

# 再接我们之前案例的方法将扩展出来的数据设置为空：
def func(d: pd.DataFrame):d.iloc[1:, :] = Nonereturn d(df.loc[df.index.repeat(3)].iloc[:-3+1].groupby(level=0).apply(func)
)

在这里插入图片描述

# 最后再用 interpolate() 插补数据，整体代码如下：
def func(d: pd.DataFrame):d.iloc[1:, :] = Nonereturn d # 将第一行及其之后的行设置为None(df.loc[df.index.repeat(3)]  # 将df的每个索引值重复3次.iloc[:-3+1] # 取除了最后3行的所有行.groupby(level=0) # 按照索引值进行分组.apply(func) # 对每个分组应用函数func.interpolate() # 对缺失值进行插补
)

在这里插入图片描述

# 其他方法：
# 我们还可以尝试用分组方法合并进去空 DataFrame，然后再做插补。
none_df = pd.DataFrame([[None]*len(df.columns)], # 将空DataFrame与原DataFrame合并columns=df.columns,  dtype=float,)
none_df

在这里插入图片描述

(df.groupby(level=0, group_keys=False)  # 按照索引值进行分组 .apply(lambda x: pd.concat([x, *[none_df]*2])) # 将空DataFrame与原DataFrame合并.interpolate() # 对缺失值进行插补.iloc[:-2]  # 取除了最后2行的所有行 
)

在这里插入图片描述

总结

以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

038—pandas 重采样线性插补

前言在数据处理时，由于采集数据量有限，或者采集数据粒度过小，经常需要对数据重采样。在本例中，我们将实现一个类型超分辨率的操作。思路： 首先将原始数据长度扩展为 3 倍，可以使用 loc[] 方法对索引扩…...

编程日记 2024/3/26 21:17:01

智慧工地源码数字孪生可视化大屏工地管理平台系统源码多端展示（PC端、手机端、平板端）

智慧工地源码数字孪生可视化大屏工地管理平台系统源码多端展示（PC端、手机端、平板端） 智慧工地系统多端展示（PC端、手机端、平板端）;数字孪生可视化大屏，一张图掌握项目整体情况;使用轻量化模型，部署三…...

编程日记 2024/3/26 21:16:00

深度学习Top10算法之深度神经网络DNN

深度神经网络（Deep Neural Networks，DNN）是人工神经网络（Artificial Neural Networks，ANN）的一种扩展。它们通过模仿人脑的工作原理来处理数据和创建模式，广泛应用于图像识别、语音识别、自然语…...

编程日记 2024/3/26 21:11:55

【智能算法】海马优化算法（SHO）原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2022年，Zhao等人受到海马自然社会行为启发，提出了海马优化算法（Sea-horse Optimizer, SHO）。 2.算法原理 2.1算法思想 SHO模拟了海马群在自然界中的…...

编程日记 2024/3/26 21:10:54

AI大模型学习的伦理与社会影响

AI大模型学习随着人工智能技术的快速发展，AI大模型学习成为当前热门研究领域之一。AI大模型学习是指基于大规模数据集和深度学习模型进行训练，以实现更高的准确性和复杂性。这些大模型已经在几乎所有领域都取得了显著的成就，包括自然语言处…...

编程日记 2024/3/26 21:08:52

记录些LangChain相关的知识

RAG的输出准确率 RAG的输出准确率向量信息保留率 * 语义搜索准确率 * LLM准确率RAG的输出准确率由三个因素共同决定：向量信息保留率、语义搜索准确率以及LLM准确率。这三个因素是依次作用的，因此准确率实际上是它们的乘积。这意味着，任何一…...

编程日记 2024/3/26 21:07:50

C语言例4-7：格式字符f的使用例子

%f，实型，小数部分为6位代码如下： //格式字符f的使用例子 #include<stdio.h> int main(void) {float f 123.456;double d1, d2;d11111111111111.111111111;d22222222222222.222222222;printf("%f,%12f,%12.2f,%-12.2f,%.2f\n&qu…...

编程日记 2024/3/26 21:06:48

[蓝桥杯 2019 省 A] 修改数组

题目链接 [蓝桥杯 2019 省 A] 修改数组题目描述给定一个长度为 N N N 的数组 A [ A 1 , A 2 , A 3 , . . . , A N ] A [A_1, A_2, A_3, ...,A_N] A[A1,A2,A3,...,AN]，数组中有可能有重复出现的整数。现在小明要按以下方法将其修改为没有重复整数的…...

编程日记 2024/3/26 21:05:47

Git基础(25):Cherry Pick合并指定commit id的提交

文章目录前言指定commit id合并使用TortoiseGit执行cherry-pick命令前言开发中，我们会存在多个分支开发的情况，比如dev，test, prod分支，dev分支在开发新功能，prod作为生产分支已发布。如果某个时候，我们…...

编程日记 2024/3/26 21:04:46

C语言结构体之位段

位段（节约内存），和王者段位联想记忆位段是为了节约内存的。刚好和结构体相反。那么什么是位段呢？我们现引入情景：我么如果要记录一个人是男是女，用数字0 1表示。我们发现只要一个bit内存就可以完成我们想…...

编程日记 2024/3/26 21:03:45

2016年认证杯SPSSPRO杯数学建模D题(第二阶段)NBA是否有必要设立四分线全过程文档及程序

2016年认证杯SPSSPRO杯数学建模 D题 NBA是否有必要设立四分线原题再现： NBA 联盟从 1946 年成立到今天，一路上经历过无数次规则上的变迁。有顺应民意、皆大欢喜的，比如 1973 年在技术统计中增加了抢断和盖帽数据；有应运而生、力…...

编程日记 2024/3/26 21:02:42

登录校验解决方案JWT

目录 🎗️1.JWT介绍 🎞️2.应用场景 🎟️3.结构组成 🎫4.JWT优点 🎠5.封装成通用方法 🛝6.JWT自动刷新 1.JWT介绍官网：JWT官网 JSON Web Token (JWT) 是一个开放标准，它…...

编程日记 2024/3/26 20:57:36

Flutter开发进阶之瞧瞧BuildOwner

Flutter开发进阶之瞧瞧BuildOwner 上回说到关于Element Tree的构建还缺最后一块拼图，build的重要过程中会调用_element!.markNeedsBuild();，而markNeedsBuild会调用owner!.scheduleBuildFor(this);。在Flutter框架中，BuildOwner负责管理构建…...

编程日记 2024/3/26 20:55:34

大量免费工具使用（提供api接口）

标题: 免费工具集使用 - 简化你的任务介绍： 在数字化时代，我们经常需要使用各种工具来完成各种任务。本文将介绍一个免费工具集，它提供了多种实用工具，帮助简化你的任务。这些工具可以在网站 https://tool.kertennet.com 上找到…...

编程日记 2024/3/26 20:50:30

网络探测工具Nmap介绍

1. Nmap简介 Nmap是一款用于网络发现和安全审计的网络安全工具。可用于列举网络主机清单、管理服务升级调度、监控主机、监控主机服务运行状况、检测目标主机是否在线和端口开放情况、侦测运行的服务类型及版本信息、侦测操作系统与设备类型等。 2. 命令大纲 3. 命令详细介绍…...

编程日记 2024/3/26 20:49:29

20240319-2-机器学习基础面试题

⽼板给了你⼀个关于癌症检测的数据集，你构建了⼆分类器然后计算了准确率为 98%， 你是否对这个模型很满意？为什么？如果还不算理想，接下来该怎么做？ 首先模型主要是找出患有癌症的患者，模型关注的…...

编程日记 2024/3/26 20:48:27

0202矩阵的运算-矩阵及其运算-线性代数

文章目录一、矩阵的加法二、数与矩阵相乘三、矩阵与矩阵相乘四、矩阵的转置五、方阵的行列式结语一、矩阵的加法定义2 设有两个 m n m\times n mn橘子 A ( a i j ) 和 B ( b i j ) A(a_{ij})和B(b_{ij}) A(aij)和B(bij),那么矩阵A与B的和记为AB,规定为 A B ( a 11…...

编程日记 2024/3/26 20:47:26

python中的dict

类的__dict__返回的是：类的静态函数、类函数、普通函数、全局变量以及一些内置的属性都是放在类的__dict__里的， 而实例化对象的：__dict__中存储了一些类中__init__的一些属性值。 import的py文件 __dict__返回的是：__init__的…...

编程日记 2024/3/26 20:45:23

数学分析复习：无穷乘积

文章目录无穷乘积定义：无穷乘积的收敛性命题：无穷乘积的Cauchy收敛准则正项级数和无穷乘积的联系本篇文章适合个人复习翻阅，不建议新手入门使用无穷乘积设复数列 { a n } n ≥ 1 \{a_n\}_{n\geq 1} {an}n≥1，设对任意 …...

编程日记 2024/3/26 20:44:21

import React, { useState } from react;// 定义一个简单的函数式组件 function Counter() {// 使用 useState hook 来创建一个状态变量 count，并提供修改该状态的函数 setCountconst [count, setCount] useState(0);// 在点击按钮时增加计数器的值const increment…...

编程日记 2024/3/26 20:41:18

网络编程（Modbus进阶）

思维导图 Modbus RTU（先学一点理论） 概念 Modbus RTU 是工业自动化领域最广泛应用的串行通信协议，由 Modicon 公司（现施耐德电气）于 1979 年推出。它以高效率、强健性、易实现的特点成为工业控制系统的通信标准。包…...

编程新知 2026/2/9 2:42:51

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...

编程新知 2026/2/8 4:37:37

51c自动驾驶~合集58

我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留，CCA-Attention为LLM长文本建模带来突破性进展琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制（CCA-Attention），…...

编程新知 2026/2/5 4:25:15

AI Agent与Agentic AI：原理、应用、挑战与未来展望

文章目录一、引言二、AI Agent与Agentic AI的兴起2.1 技术契机与生态成熟2.2 Agent的定义与特征2.3 Agent的发展历程三、AI Agent的核心技术栈解密3.1 感知模块代码示例：使用Python和OpenCV进行图像识别 3.2 认知与决策模块代码示例：使用OpenAI GPT-3进…...

编程新知 2026/1/23 7:04:53

全球首个30米分辨率湿地数据集(2000—2022)

数据简介今天我们分享的数据是全球30米分辨率湿地数据集，包含8种湿地亚类，该数据以0.5X0.5的瓦片存储，我们整理了所有属于中国的瓦片名称与其对应省份，方便大家研究使用。该数据集作为全球首个30米分辨率、覆盖2000–2022年时间…...

编程新知 2026/1/31 17:15:25

家政维修平台实战20：权限设计

目录 1 获取工人信息2 搭建工人入口3 权限判断总结目前我们已经搭建好了基础的用户体系，主要是分成几个表，用户表我们是记录用户的基础信息，包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题，不同的角色&#xf…...

编程新知 2026/2/1 22:23:58

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

设备树移植和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下源码修改及编译修改arch/arm/boot/dts/st/Makefile，新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...

编程新知 2026/2/5 12:11:18

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

在现代战争中，电磁频谱已成为继陆、海、空、天之后的 “第五维战场”，雷达作为电磁频谱领域的关键装备，其干扰与抗干扰能力的较量，直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器，凭借数字射…...

编程新知 2026/2/1 7:18:47

排序算法总结（C++）

目录一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序三、总结一、稳定性排序算法的稳定性是指：同样大小的样本 **（同样大小的数据）**在排序之后不会改变原始的相对次序。稳定性对基础类型对象…...

编程新知 2026/2/10 5:05:24

【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变（硬件篇）

本项目是基于 STM32F103C8T6 微控制器的 SPWM（正弦脉宽调制）电源模块，能够生成可调频率和幅值的正弦波交流电源输出。该项目适用于逆变器、UPS电源、变频器等应用场景。供电电源输入电压采集上图为本设计的电源电路，图中 D1 为二极管，其目的是防止正负极电源反接， …...

编程新知 2026/1/25 3:29:22

038—pandas 重采样线性插补

前言

思路：

使用步骤

读入数据

总结

相关文章：

038—pandas 重采样线性插补

智慧工地源码数字孪生可视化大屏工地管理平台系统源码多端展示（PC端、手机端、平板端）

深度学习Top10算法之深度神经网络DNN

【智能算法】海马优化算法（SHO）原理及实现

AI大模型学习的伦理与社会影响

记录些LangChain相关的知识

C语言例4-7：格式字符f的使用例子

[蓝桥杯 2019 省 A] 修改数组

Git基础(25):Cherry Pick合并指定commit id的提交

C语言结构体之位段

2016年认证杯SPSSPRO杯数学建模D题(第二阶段)NBA是否有必要设立四分线全过程文档及程序

登录校验解决方案JWT

Flutter开发进阶之瞧瞧BuildOwner

大量免费工具使用（提供api接口）

网络探测工具Nmap介绍

20240319-2-机器学习基础面试题

0202矩阵的运算-矩阵及其运算-线性代数

python中的dict

数学分析复习：无穷乘积

02 React 组件使用

网络编程（Modbus进阶）

利用最小二乘法找圆心和半径

51c自动驾驶~合集58

AI Agent与Agentic AI：原理、应用、挑战与未来展望

全球首个30米分辨率湿地数据集(2000—2022)

家政维修平台实战20：权限设计

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

排序算法总结（C++）

【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变（硬件篇）