当前位置：首页 > article >正文

Pandas Series

article 2026/2/16 20:41:19

以下是关于 Pandas Series 的从入门到精通的系统指南，包含核心概念、操作技巧和实战示例：

1. 入门篇：基础操作

1.1 创建Series

import pandas as pd# 从列表创建
s1 = pd.Series([1, 3, 5, 7, 9])  # 默认数字索引
s2 = pd.Series([10, 20, 30], index=['a', 'b', 'c'])  # 自定义索引# 从字典创建（自动将键作为索引）
data_dict = {'a': 10, 'b': 20, 'c': 30}
s3 = pd.Series(data_dict)

1.2 查看基本属性

print(s2.values)   # 输出值数组：[10, 20, 30]
print(s2.index)    # 输出索引：Index(['a', 'b', 'c'], dtype='object')
print(s2.dtype)    # 数据类型：int64
print(s2.shape)    # 形状：(3,)
print(s2.size)     # 元素数量：3

1.3 索引与切片

# 按位置索引（类似列表）
print(s2[0])       # 输出：10# 按标签索引
print(s2['b'])     # 输出：20# 切片（包含结束位置）
print(s2[1:3])     # 输出：b=20, c=30
print(s2['a':'c']) # 标签切片包含'c'# 布尔索引
print(s2[s2 > 15]) # 输出值大于15的元素

1.4 修改索引和值

s2.index = ['x', 'y', 'z']  # 修改索引
s2['x'] = 100               # 修改单个值
s2.replace(20, 200, inplace=True)  # 替换值

2. 进阶篇：数据处理

2.1 处理缺失值

s4 = pd.Series([1, None, 3, np.nan, 5])# 检测缺失值
print(s4.isna())   # 返回布尔Series# 删除缺失值
s4_drop = s4.dropna()# 填充缺失值
s4_fill = s4.fillna(0)          # 填充0
s4_ffill = s4.fillna(method='ffill')  # 前向填充

2.2 向量化操作

# 直接数学运算
s5 = s2 * 2              # 每个元素乘以2
s6 = s2 + pd.Series([1, 2, 3], index=['x', 'y', 'z'])  # 按索引对齐运算# 使用NumPy函数
import numpy as np
s7 = np.sqrt(s2)         # 对每个元素开平方

2.3 统计计算

print(s2.mean())         # 平均值
print(s2.sum())          # 总和
print(s2.value_counts()) # 值频次统计（适用于离散值）
print(s2.describe())     # 快速统计摘要（均值、标准差、分位数等）

2.4 应用自定义函数

# 使用apply
s8 = s2.apply(lambda x: x**2 + 1)# 使用map（元素级转换）
s9 = s2.map({10: 'low', 20: 'mid', 30: 'high'})  # 映射替换

3. 精通篇：高级技巧

3.1 时间序列处理

# 创建时间序列
dates = pd.date_range('2023-01-01', periods=5)
s_time = pd.Series([10, 20, 15, 30, 25], index=dates)# 按时间重采样
s_resampled = s_time.resample('W').mean()  # 按周平均

3.2 分类数据优化

# 转换为分类类型（减少内存）
s_cat = pd.Series(['apple', 'banana', 'apple', 'orange'], dtype='category')

3.3 多层索引（MultiIndex）

arrays = [['A', 'A', 'B', 'B'], [1, 2, 1, 2]]
multi_index = pd.MultiIndex.from_arrays(arrays, names=('group', 'subgroup'))
s_multi = pd.Series([10, 20, 30, 40], index=multi_index)# 按层级访问
print(s_multi.loc['A', 1])  # 输出：10

3.4 与DataFrame交互

# 从DataFrame中提取列（本质是Series）
df = pd.DataFrame({'A': [1, 2, 3], 'B': ['x', 'y', 'z']})
s_from_df = df['A']# 将Series转换为DataFrame
df_from_s = s2.to_frame(name='values')

4. 实战技巧

4.1 高效过滤

# 多条件筛选
s_filtered = s2[(s2 > 15) & (s2.index != 'z')]

4.2 性能优化

# 避免循环，使用向量化操作
s_squared = s2 ** 2  # 比apply快10倍以上# 使用eval表达式（适用于大型数据）
s_result = pd.eval('s2 * 2 + 5')

4.3 合并Series

s10 = pd.Series([100, 200], index=['x', 'y'])
combined = pd.concat([s2, s10], axis=0)  # 纵向合并

5. 常见问题

5.1 索引自动对齐

s11 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s12 = pd.Series([4, 5, 6], index=['b', 'c', 'd'])
s_sum = s11 + s12  # 结果：a=NaN, b=6, c=8, d=NaN

5.2 处理重复索引

s_dup = pd.Series([10, 20, 30], index=['a', 'a', 'b'])
s_unique = s_dup[~s_dup.index.duplicated()]  # 保留第一个重复索引

Pandas Series

以下是关于 Pandas Series 的从入门到精通的系统指南，包含核心概念、操作技巧和实战示例： 1. 入门篇：基础操作 1.1 创建Series import pandas as pd# 从列表创建 s1 pd.Series([1, 3, 5, 7, 9]) # 默认数字索引 s2 pd.Series([10, 20, 3…...

编程日记 2026/2/13 12:05:10

Kafka 多线程开发消费者实例

目前，计算机的硬件条件已经大大改善，即使是在普通的笔记本电脑上，多核都已经是标配了，更不用说专业的服务器了。如果跑在强劲服务器机器上的应用程序依然是单线程架构，那实在是有点暴殄天物了。不过，Kafka …...

编程日记 2026/2/16 14:29:47

Linux线程池实现

1.线程池实现全部代码：whb-helloworld/113 1.唤醒线程一个是唤醒全部线程，一个是唤醒一个线程。 void WakeUpAllThread(){LockGuard lockguard(_mutex);if (_sleepernum)_cond.Broadcast();LOG(LogLevel::INFO) << "唤醒所有的休眠线程&q…...

编程日记 2026/2/15 8:50:32

Linux《进程概念（上）》

在之前的Linux学习当中我们已经了解了基本的Linux指令以及基础的开发工具的使用，那么接下来我们就要开始Linux当中一个非常重要的部分的学习——进程，在此进程是我们之后Linux学习的基础，并且通过进程的学习会让我们了解更多的操作系统的相关…...

编程日记 2026/2/16 5:01:22

【算法】并查集基础讲解

一、定义一种树型的数据结构，用于处理一些不相交集合的合并及查询问题。思想是用一个数组表示了整片森林（parent），树的根节点唯一标识了一个集合，只要找到了某个元素的的树根，就能确定它在哪个集合里。 …...

编程日记 2026/2/16 18:09:04

C++ STL常用算法之常用集合算法

常用集合算法学习目标: 掌握常用的集合算法算法简介: set_intersection // 求两个容器的交集 set_union // 求两个容器的并集 set_difference // 求两个容器的差集 set_intersection 功能描述: 求两个容器的交集函数原型: set_intersection(iterator beg1, iterat…...

编程日记 2026/2/16 13:52:36

Qt warning LNK4042: 对象被多次指定；已忽略多余的指定

一、常规原因： pro或pri 文件中源文件被多次包含解决：删除变量 SOURCES 和 HEADERS 中重复条目二、误用对于某些pri库可以使用如下代码简写包含 INCLUDEPATH $$PWDHEADERS $$PWD/*.hSOURCES $$PWD/*.cpp但是假如该目录下只有头文件，没…...

编程日记 2026/2/9 21:57:21

ACM模式常用方法总结（Java篇）

文章目录一、ACM输入输出模式二、重要语法2.1、导包2.2、读取数据2.3、判断是否有下一个数据2.4、输出2.5、关闭scanner2.6、易踩坑点一、ACM输入输出模式在力扣上编写代码时使用的是核心代码模式，如果在面试中遇到ACM模式就会比较迷茫？ACM模式要求你…...

编程日记 2026/2/16 0:04:38

日程公布| 第八届地球空间大数据与云计算前沿大会与集中学习（3号通知）

日程公布| 第八届地球空间大数据与云计算前沿大会与集中学习（3号通知） 日程公布| 第八届地球空间大数据与云计算前沿大会与集中学习（3号通知）...

编程日记 2026/2/16 2:08:04

leetcode 28 Find the Index of the First Occurrence in a String

直接用kmp算法 class Solution { public:int strStr(string haystack, string needle) {return kmp(haystack,needle);}int kmp(std::string &text,std::string &pattern){int n text.size();int m pattern.size();if(m 0)return 0;std::vector<int> next;ne…...

编程日记 2026/2/16 7:01:23

MATLAB中rmfield函数用法

目录语法说明示例删除单个字段删除多个字段 rmfield函数的功能是删除结构体中的字段。语法 s rmfield(s,field) 说明 s rmfield(s,field) 从结构体数组 s 中删除指定的一个或多个字段。使用字符向量元胞数组或字符串数组指定多个字段。s 的维度保持不变。示例…...

编程日记 2026/2/14 10:56:05

Linux C语言调用第三方库，第三方库如何编译安装

在 Linux 环境下使用 C 语言调用第三方库时，通常需要先对第三方库进行编译和安装。以下为你详细介绍一般的编译安装步骤，并给出不同类型第三方库（如使用 Makefile、CMake 构建系统）的具体示例。一般步骤 1. 获取第三方库源码 …...

编程日记 2026/2/16 11:33:04

leetcode -编辑距离

为了求解将 word1 转换成 word2 所需的最少操作数，可以使用动态规划。以下是详细的解决方案： ### 方法思路 1. **定义状态** dp[i][j] 表示将 word1 的前 i 个字符转换成 word2 的前 j 个字符所需的最少操作数。 2. **状态转移方程** - 如果 word1[…...

编程日记 2026/2/15 22:35:40

【Ollama】大模型运行框架

文章目录安装与运行导入LLMHugginface模型-转换为-GGUF模型在指定gpu上运行model存储路径设置 ollama接口官网 github中文介绍安装与运行安装教程安装 wget https://ollama.com/download/ollama-linux-amd64.tgz tar -xzvf ollama-linux-amd64.tgz添加ollama的环境变量…...

编程日记 2026/2/13 22:08:46

字节开源版Manus来袭

字节开源版Manus来袭项目地址：https://github.com/langmanus/langmanus/blob/main/README_zh.md 在人工智能领域，Manus的出现无疑是一颗重磅炸弹，它凭借强大的通用Agent能力，迅速吸引了全球开发者和AI爱好者的目光。然而&#…...

编程日记 2026/2/15 22:57:54

论文阅读笔记——PointVLA: Injecting the 3D World into Vision-Language-Action Models

PointVLA 论文现有的 VLA 基于 2D 视觉-语言数据表现良好但缺乏 3D 几何先验导致空间推理缺陷。传统方案：1）3D->2D 投影，造成几何信息损失；2）3D 数据集少。PointVLA 保留原有 VLA，提取点云特征&#xf…...

编程日记 2026/2/15 8:51:12

selenium实现自动登录项目（5）

1、163邮箱自动登录功能遇到的问题： 1、登录页面，在定位表单时候，采用id，xpath，css selector都无法定位成功，因为id后面有个随机生成的数字（//*[id"x-URS-iframe1741925838640.6785&quo…...

编程日记 2026/2/2 20:25:04

在win11 环境下新安装 WSL ubuntu + 换国内镜像源 + ssh + 桌面环境 + Pyhton 环境 + vim 设置插件安装

在win11 环境下新安装 WSL ubuntu ssh gnome 桌面环境 Pyhton 环境 vim 设置插件安装简单介绍详细流程换国内镜像源安装 ssh 桌面环境python 环境vim 设置插件安装简单介绍内容有点长，这里就先简单描述内容了。主要是快速在 Win11 搭建一个 wsl 的 linux 环…...

编程日记 2026/2/15 9:02:14

基于springboot课程学习与互动平台(源码+lw+部署文档+讲解)，源码可白嫖!

摘要随着我国经济的高速发展与人们生活水平的日益提高，人们对生活质量的追求也多种多样。尤其在人们生活节奏不断加快的当下，人们更趋向于足不出户解决生活上的问题，线上管理系统展现了其蓬勃生命力和广阔的前景。与此同时，在此…...

编程日记 2026/2/15 8:50:59

通俗易懂的大模型原理

十分钟揭秘DeepSeek原理，通俗易懂的大语言模型科普！_哔哩哔哩_bilibili 最基础原理，x是输入，y是输出。上百万和上百亿的参数将一句话转化为数字向量一句话就是向量矩阵输入矩阵和参数矩阵进行计算得出输出矩阵，因为…...

编程日记 2026/2/16 1:54:14

Vue 3 模板引用（Template Refs）详解与实战示例

Vue 3 模板引用（Template Refs）详解与实战示例引言在 Vue 开发中，通常推荐使用响应式数据 (ref 和 reactive) 进行数据绑定，而不是直接操作 DOM。但是，在某些情况下，我们确实需要访问某个组件或 DOM 元…...

编程日记 2026/1/24 20:12:27

【Deep Reinforcement Learning Hands-On Third Edition】【序】

书名：深度强化学习实践第三版副标题：一个实用且容易跟得上的强化学习指南，从（Q-learning和DQNs）到（PPO和RLHF） 作者：Maxim Lapan 1.书中目录模块一：强化学习初探章…...

编程日记 2025/4/26 10:43:13

Hadoop/Spark 生态

Hadoop/Spark 生态是大数据处理的核心技术体系，专为解决海量数据的存储、计算和分析问题而设计。以下从底层原理到核心组件详细讲解，帮助你快速建立知识框架！ 一、为什么需要 Hadoop/Spark？ 传统单机瓶颈： 数据量超…...

编程日记 2026/2/12 22:02:23

.global

.global关键字用来让一个符号对链接器可见，可以供其他链接对象模块使用。 global是告诉编译器，其后是全局可见的名字【变量或函数名】。 .global start 让start符号成为可见的标示符，这样链接器就知道跳转到程序中的什么地方并开始执行。li…...

编程日记 2025/6/17 19:47:12

八股总结（Java）实时更新！

八股总结（java） ArrayList和LinkedList有什么区别 ArrayList底层是动态数组，LinkedList底层是双向链表；前者利于随机访问，后者利于头尾插入；前者内存连续分配，后者通过指针连接多块不连续的内存…...

编程日记 2026/2/15 11:39:43

@emotion/css + react+动态主题切换

1.下载插件 npm install --save emotion/css 2.创建ThemeContext.tsx // src/ThemeContext.tsx import React, { createContext, useContext, useState } from "react";// 定义主题类型 export type Theme "light" | "dark";// 定义主题上下…...

编程日记 2026/2/14 14:07:32

Python Cookbook-4.16 用字典分派方法和函数

任务需要根据某个控制变量的值执行不同的代码片段——在其他的语言中你可能会使用case 语句。解决方案归功于面向对象编程的优雅的分派概念，case语句的使用大多(但不是所有)都可以被替换成其他分派形式。在Python中，字典及函数是一等(first-class)…...

编程日记 2026/2/14 6:32:21

亚马逊玩具品类技术驱动型选品策略：从趋势洞察到合规基建

一、全球玩具电商技术演进趋势 （技术化重构原市场背景） 数据可视化分析：通过亚马逊SP-API抓取2023年玩具品类GMV分布热力图监管技术升级： 美国CPSC启用AI质检系统（缺陷识别准确率92.7%） 欧盟EPR合规接口…...

编程日记 2026/2/15 17:09:00

【jQuery】插件

目录一、 jQuery插件 1. 瀑布流插件： jQuery 之家 http://www.htmleaf.com/ 2. 图片懒加载： jQuery 插件库 http://www.jq22.com/ 3. 全屏滚动总结不易~ 本章节对我有很大收获，希望对你也是~~~ 一、 jQuery插件 jQuery 功能…...

编程日记 2026/2/15 19:27:10