当前位置: 首页 > news >正文

pandas常用操作

`pandas`是Python中用于数据操作和分析的强大库。以下是一些常用的操作:

### 1. 读取数据
- **从CSV文件读取**:
  ```python
  import pandas as pd
  df = pd.read_csv('path/to/file.csv')
  ```
- **从Excel文件读取**:
  ```python
  df = pd.read_excel('path/to/file.xlsx', sheet_name='Sheet1')
  ```

### 2. 数据查看
- **显示前几行**:
  ```python
  df.head()  # 默认显示前5行
  ```
- **显示后几行**:
  ```python
  df.tail()
  ```
- **查看数据信息**:
  ```python
  df.info()
  ```
- **基本统计信息**:
  ```python
  df.describe()
  ```

### 3. 数据选择
- **选择列**:
  ```python
  df['column_name']
  df.column_name
  ```
- **选择多列**:
  ```python
  df[['column1', 'column2']]
  ```
- **基于条件选择行**:
  ```python
  df[df['column'] > 0]
  ```
- **选择行和列**:
  ```python
  df.loc[row_indexer, column_indexer]  # 标签索引
  df.iloc[row_indexer, column_indexer]  # 位置索引
  ```

### 4. 数据处理
- **删除列**:
  ```python
  df.drop('column_name', axis=1, inplace=True)
  ```
- **删除行**:
  ```python
  df.drop(0, axis=0, inplace=True)  # 删除第一行
  ```
- **填补缺失值**:
  ```python
  df.fillna(value, inplace=True)
  ```
- **重命名列**:
  ```python
  df.rename(columns={'old_name': 'new_name'}, inplace=True)
  ```
- **更改列类型**:
  ```python
  df['column_name'] = df['column_name'].astype('int')
  ```

### 5. 数据聚合与分组
- **分组操作**:
  ```python
  grouped = df.groupby('column_name')
  grouped.mean()  # 按组计算平均值
  ```
- **应用函数**:
  ```python
  df['column_name'].apply(lambda x: function(x))
  ```

### 6. 数据合并
- **合并数据框**:
  ```python
  pd.concat([df1, df2])  # 按行合并
  pd.merge(df1, df2, on='key_column')  # 按列合并
  ```

### 7. 数据清洗
- **处理重复行**:
  ```python
  df.drop_duplicates(inplace=True)
  ```
- **处理缺失数据**:
  ```python
  df.dropna()  # 删除有缺失值的行
  ```

### 8. 数据保存
- **保存为CSV文件**:
  ```python
  df.to_csv('output.csv', index=False)
  ```
- **保存为Excel文件**:
  ```python
  df.to_excel('output.xlsx', index=False)
  ```

这些只是`pandas`库中最常用的一些操作。`pandas`的功能非常丰富,涵盖了数据处理的方方面面,具体使用时可以参考其官方文档或社区资源来解决更复杂或特定的问题。

相关文章:

pandas常用操作

pandas是Python中用于数据操作和分析的强大库。以下是一些常用的操作: ### 1. 读取数据 - **从CSV文件读取**: python import pandas as pd df pd.read_csv(path/to/file.csv) - **从Excel文件读取**: python df pd.read_exc…...

linux使用

文章目录 前言操作系统的作用组成二、安装linux系统安装VMware Workstation安装ubuntu图形化,命令行finalshell快照目录理解命令执行命令格式常用命令lscdmkdir 前言 本文讲解认识与使用linux操作系统 操作系统的作用 操作系统是用户和计算机的桥梁。比如我们输入…...

基于豆瓣2025电影数据可视化分析系统的设计与实现

✔️本项目旨在通过对豆瓣电影数据进行综合分析与可视化展示,构建一个基于Python的大数据可视化系统。通过数据爬取收集、清洗、分析豆瓣电影数据,我们提供了一个全面的电影信息平台,为用户提供深入了解电影产业趋势、影片评价与演员表现的工…...

基于Python的深度学习音乐推荐系统(有配套论文)

音乐推荐系统 提供实时音乐推荐功能,根据用户行为和偏好动态调整推荐内容 Python、Django、深度学习、卷积神经网络 、算法 数据库:MySQL 系统包含角色:管理员、用户 管理员功能:用户管理、系统设置、音乐管理、音乐推荐管理、系…...

远程计算机无conda情况下配置python虚拟环境

1. 按照正常流程,根据远程计算机的IP地址/用户名/密码,通过pycharm进行部署 部署流程为: pycharm主菜单--> 工具-->部署 -->配置 **注意,pycharm的远程部署必须是专业版 2. 配置远程python解释器 上图是配置SSH解释器的截图&…...

强化学习-价值学习算法

Sarsa 理论解释 Sarsa是基于时序差分算法的,它的公式非常简单且易理解,不像策略梯度算法那样需要复杂的推导过程。 Sarsa的核心函数是 Q ( s , a ) Q(s, a) Q(s,a),它的含义是在状态 s s s下执行 a a a,在后续轨迹中获取的期望…...

Golang深度学习

前言 在2009年,Google公司发布了一种新的编程语言,名为Go(或称为Golang),旨在提高编程效率、简化并发编程,并提供强大的标准库支持。Go语言的设计者们希望通过Go语言能够解决软件开发中的一些长期存在的问…...

基于推荐算法的在线课程推荐系统设计与实现

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…...

es和kibana安装

es安装 安装 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.17.1-linux-x86_64.tar.gz 参考: https://www.cnblogs.com/shamo89/p/18504053 https://blog.csdn.net/u012899618/article/details/130383429 解压 tar -zxvf elastic…...

本地部署Anything LLM+Ollama+DeepSeek R1打造AI智能知识库教程

文章目录 前言1. 本地部署OllamaDeepSeek2. 本地安装Anything LLM3. 配置与使用演示4. 远程调用大模型5. 安装内网穿透6. 配置固定公网地址 前言 本文主要介绍如何在Windows电脑上本地部署Ollama并接入DeepSeek R1大模型,然后使用强大的开源AI工具Anything LLM结合…...

zyNo.25

SSRF漏洞 在了解ssrf漏洞前先了解curl命令的使用 1.curl命令的使用 基本格式&#xff1a;curl<参数值>请求地址 get请求&#xff1a;curl http://127.0.0.1 post请求&#xff1a;curl -X POST -d "a1&b2" http://127.0.0.1/(其中&#xff0c;使用-X参…...

Spring框架基本使用(Maven详解)

前言&#xff1a; 当我们创建项目的时候&#xff0c;第一步少不了搭建环境的相关准备工作。 那么如果想让我们的项目做起来方便快捷&#xff0c;应该引入更多的管理工具&#xff0c;帮我们管理。 Maven的出现帮我们大大解决了管理的难题&#xff01;&#xff01; Maven&#xf…...

关于前后端分离跨域问题——使用DeepSeek分析查错

我前端使用ant design vue pro框架&#xff0c;后端使用kratos框架开发。因为之前也解决过跨域问题&#xff0c;正常是在后端的http请求中加入中间件&#xff0c;设置跨域需要通过的字段即可&#xff0c;代码如下所示&#xff1a; func NewHTTPServer(c *conf.Server, s *conf…...

三层渗透测试-DMZ区域 二三层设备区域

DMZ区域渗透 信息收集 首先先进行信息收集&#xff0c;这里我们可以选择多种的信息收集方式&#xff0c;例如nmap如此之类的&#xff0c;我的建议是&#xff0c;可以通过自己现有的手里小工具&#xff0c;例如无影&#xff0c;密探这种工具&#xff0c;进行一个信息收集。以免…...

领航Linux UDP:构建高效网络新纪元

欢迎来到 破晓的历程的 博客 ⛺️不负时光&#xff0c;不负己✈️ 文章目录 引言Udp和Tcp的异同相同点不同点总结 1.1、socket1.2、bind1.3、recvfrom1.4、sendto2.1、代码2.1、说明3.1、代码3.2、说明 引言 在前几篇博客中&#xff0c;我们学习了Linux网络编程中的一些概念。…...

基于MATLAB的均匀面阵MUSIC算法DOA估计仿真

基于MATLAB的均匀面阵MUSIC算法DOA估计仿真 文章目录 前言一、二维MUSIC算法原理二、二维MUSIC算法MATLAB仿真三、MATLAB源代码总结 前言 \;\;\;\;\; 在波达角估计算法中&#xff0c;MUSIC 算法与ESPRIT算法属于特征结构子空间算法&#xff0c;是波达角估计算法中的基石。在前面…...

HTML/CSS中后代选择器

1.作用:选中指定元素中,符合要求的后代元素. 2.语法:选择器1 选择器2 选择器3 ...... 选择器n(使用空格隔开) 3.举例: /* 选中ul中的所有li */ul li{color: red;}/* 选中类名为subject元素中的所有li */.subject li{color: blue;}/* 选中类名为subject元素中的所有类名为f…...

深入解析「卡顿帧堆栈」 | UWA GPM 2.0 技术细节与常见问题

在游戏开发过程中&#xff0c;卡顿问题一直是影响玩家体验的关键因素。UWA GPM 2.0全新推出的「卡顿帧堆栈」功能&#xff0c;专为研发团队提供精准、高效的卡顿分析方案&#xff0c;能够直观呈现游戏运行时的堆栈信息&#xff0c;助力团队迅速找到性能瓶颈。该功能一经上线&am…...

推荐几款较好的开源成熟框架

一. 若依&#xff1a; 1. 官方网站&#xff1a;https://doc.ruoyi.vip/ruoyi/ 2. 若依SpringBootVueElement 的后台管理系统&#xff1a;https://gitee.com/y_project/RuoYi-Vue 3. 若依SpringBootVueElement 的后台管理系统&#xff1a;https://gitee.com/y_project/RuoYi-Cl…...

Mysql全文索引

引言 在MySQL 5.7.6之前&#xff0c;全文索引只支持英文全文索引&#xff0c;不支持中文全文索引&#xff0c;需要利用分词器把中文段落预处理拆分成单词&#xff0c;然后存入数据库。 从MySQL 5.7.6开始&#xff0c;MySQL内置了ngram全文解析器&#xff0c;用来支持中文、日文…...

数据库性能杀手:90%程序员都踩过的SQL坑

数据库性能杀手:90%程序员都踩过的SQL坑 当业务系统因一条低效SQL陷入卡顿,当百万级数据查询耗时从秒级飙升至分钟级,数据库性能瓶颈往往成为企业数字化转型的"阿喀琉斯之踵"。本文将通过真实案例拆解,结合EXPLAIN深度解析、索引策略优化、查询重构技巧三大核心模…...

终极Windows界面美化指南:用ExplorerPatcher打造个性化工作环境

终极Windows界面美化指南&#xff1a;用ExplorerPatcher打造个性化工作环境 【免费下载链接】ExplorerPatcher This project aims to enhance the working environment on Windows 项目地址: https://gitcode.com/GitHub_Trending/ex/ExplorerPatcher 厌倦了Windows 11千…...

全国分地区分规模新注册企业统计数据

01、数据简介本数据利用爱企查的高级检索&#xff0c;分规模、地区、年份&#xff0c;对各地区的新注册企业数目进行统计。数据名称&#xff1a;全国分规模新注册企业统计数据数据年份&#xff1a;2000年-2020年02、相关数据注册资金分为10万以内、10-50万、50-100万、100-200万…...

数据科学家成长路线图:从零到一构建核心技能与项目实战

1. 项目概述&#xff1a;一份数据科学家的成长蓝图最近在GitHub上看到一个挺有意思的项目&#xff0c;叫“Data-Science-Roadmap”&#xff0c;作者是Moataz Elmesmary。这本质上是一份开源的学习路线图&#xff0c;旨在为想进入数据科学领域的人&#xff0c;或者已经在这个领域…...

涡旋压缩机设计(说明书+CAD图纸+UG三维模型+开题报告+实习报告+答辩PPT+外文翻译+文献综述)

涡旋压缩机作为高效节能的流体机械&#xff0c;其设计过程需融合热力学、流体力学与机械制造等多学科知识。设计说明书通过系统梳理涡旋型线方程、动静盘啮合原理及密封结构优化方案&#xff0c;为整机性能提升提供理论支撑&#xff1b;CAD图纸则以二维工程图形式精准呈现各部件…...

AI时代程序员真的会被替代吗_一份冷静的岗位分析报告

AI 时代&#xff0c;程序员真的会被替代吗&#xff1f;——一份冷静的岗位分析报告 本文不贩卖焦虑&#xff0c;也不粉饰太平。用真实的数据、具体的岗位走势、可验证的逻辑&#xff0c;分析 AI 对程序员行业的影响——什么岗位在消失、什么岗位在增长、以及作为个体应该怎么应…...

基于VirtualLab Fusion的光学检测与精密成像(光学检测、精密成像、显微镜系统)课程

基于VirtualLab Fusion的光学检测与精密成像&#xff08;光学检测、精密成像、显微镜系统&#xff09;课程时长&#xff1a;2天/城市授课地点&#xff1a;上海本课程聚焦于利用VirtualLab Fusion先进的光之数字模型平台&#xff0c;解决光学检测与精密成像系统的核心设计挑战。…...

300+ RPG Maker MV/MZ插件完全指南:免费打造专业级游戏的终极解决方案

300 RPG Maker MV/MZ插件完全指南&#xff1a;免费打造专业级游戏的终极解决方案 【免费下载链接】RPGMakerMV RPGツクールMV、MZで動作するプラグインです。 项目地址: https://gitcode.com/gh_mirrors/rp/RPGMakerMV 在RPG Maker游戏开发中&#xff0c;你是否常常感到…...

从源码交付到低代码集成:解析 GB28181/RTSP 视频中台的二次开发架构,如何节省 95% 开发成本?

从源码交付到低代码集成&#xff1a;解析 GB28181/RTSP 视频中台的二次开发架构&#xff0c;如何节省 95% 开发成本&#xff1f; 引言&#xff1a;安防开发者的“围城” 作为一名深耕安防领域十年的架构师&#xff0c;我见过太多集成商在项目落地的最后一步“踩坑”&#xff…...

FloPy:Python地下水流建模的终极指南

FloPy&#xff1a;Python地下水流建模的终极指南 【免费下载链接】flopy A Python package to create, run, and post-process MODFLOW-based models. 项目地址: https://gitcode.com/gh_mirrors/fl/flopy FloPy 是一个强大的 Python 包&#xff0c;专门用于创建、运行和…...