Python中的缺失值
Python中的缺失值
- 1、情景描述
- 2、Python中的缺失值
1、情景描述
在使用Pandas中的文件读取API读取Excel、CSV或TXT等文件时,我们可能需要对读取到的数据进行简单清洗。例如,将其中的表示空值的字符串替换为真正意义上的缺失值
来看一个例子:
data = pd.read_table(path,sep)
data.replace(['Null', 'None', 'NaN'], np.NaN, inplace=True)
上述代码中的Null、None、NaN都是文件中表示空值的字符串,我们使用replace()方法将它们替换为缺失值
实际上,Pandas读取API会自动将一些Python认识的表示空值的字符串解析为缺失值np.NaN,也许上述的replace()方法多余了
那么,到底哪些字符串可以表示Python中的缺失值呢?
2、Python中的缺失值
Python中的缺失值包括但不限于有如下:
import numpy as np
import pandas as pdprint(np.NaN) # NaN
print(type(np.NaN)) # <class 'float'>
print(pd.isnull(np.NaN)) # True
print(pd.isna(np.NaN)) # Trueprint(np.nan) # NaN
print(type(np.nan)) # <class 'float'>
print(pd.isnull(np.nan)) # True
print(pd.isna(np.nan)) # Trueprint(pd.NA) # <NA>
print(type(pd.NA)) # <class 'pandas._libs.missing.NAType'>
print(pd.isnull(pd.NA)) # True
print(pd.isna(pd.NA)) # True# 时间格式的缺失值
print(pd.NaT) # NaT
print(type(pd.NaT)) # <class 'pandas._libs.tslibs.nattype.NaTType'>
print(pd.isnull(pd.NaT)) # True
print(pd.isna(pd.NaT)) # Trueprint(None) # None
print(type(None)) # <class 'NoneType'>
print(pd.isnull(None)) # True
print(pd.isna(None)) # True# 空字符串不是缺失值
print('') #
print(type('')) # <class 'str'>
print(pd.isnull('')) # False
print(pd.isna('')) # False
经验证,Pandas能自动识别的Python缺失值字符串有:None、NA、nan、NaN、null、NULL、N/A、<NA>、''等,不能自动识别的缺失值字符串有:na、Na、none、Null等
因此,情景描述中的None和NaN字符串无需使用replace()进行替换,而Null需要使用replace()替换,全大写和全小写的NULL和null也无需进行替换
感兴趣的同学快去试试吧
相关文章:
Python中的缺失值
Python中的缺失值 1、情景描述2、Python中的缺失值 1、情景描述 在使用Pandas中的文件读取API读取Excel、CSV或TXT等文件时,我们可能需要对读取到的数据进行简单清洗。例如,将其中的表示空值的字符串替换为真正意义上的缺失值 来看一个例子:…...
JVM 字节码
JVM概述 问题引出 你是否也遇到过这些问题? 运行着的线上系统突然卡死,系统无法访问,甚至直接OOM!想解决线上JVM GC问题,但却无从下手。新项目上线,对各种JVM参数设置一脸茫然,直接默认吧&…...
ComfiUI API调用随记
来进行知识接力了: 首先了解下ComfiUI的APIstable diffusion comfyui的api使用教程-CSDN博客 对于ComfiUI,接口比较简单。查询接口比较容易看明白。 对于发起prompt的请求,如果需要图片的,则需预先上传图片给ComfiUI,…...
Dockerfile讲解
Dockerfile 1. 构建过程解析2. Dockerfile常用保留字指令3. 案例3.1. 自定义镜像mycentosjava83.2. 虚悬镜像 4. Docker微服务实战 dockerfile是用来构建docker镜像的文本文件,是由一条条构建镜像所需的指令和参数构成的脚本。 dockerfile定义了进程需要的一切东西&…...
Ansible及其优势是什么?
Ansible是一款极其简单的开源的自动化运维工具,基于Python开发,集合了众多运维工具(puppet, cfengine, chef, func, fabric)的优点。实现了批量系统配置,批量程序部署,批量运行命令等功能。同时Ansible是基于模块工作,…...
使用群晖Docker搭建HomeAssistant并实现异地公网访问家中智能设备
最近,我发现了一个超级强大的人工智能学习网站。它以通俗易懂的方式呈现复杂的概念,而且内容风趣幽默。我觉得它对大家可能会有所帮助,所以我在此分享。点击这里跳转到网站。 使用群晖Docker搭建HomeAssistant并实现异地公网访问 文章目录 使…...
重塑生成式AI时代数据战略,亚马逊云科技re:Invent大会Swami主题演讲
re:lnvent 2023 Swami Sivasubramanian主题演讲,数据、AI和人类共进共生,重塑生成式AI时代的数据战略。 赋能人才加持生成式AI必备能 生成式AI创新中心:解决生成式AI工程化挑战。 Amazon Bedrock平台PartyRock:生成式AI应用程序实…...
【恋上数据结构】哈夫曼树学习笔记
哈夫曼树 哈夫曼编码(Huffman Coding) 哈夫曼编码,又称为霍夫曼编码,它是现代压缩算法的基础 假设要把字符串 [ABBBCCCCCCCCDDDDDDEE] 转成二进制编码进行传输。 可以转成 ASCII 编码 (6569,10000011000101) &…...
前端下拉框select标签的插件——select2.js
本文采用的是select2 版本:Select2 4.0.6-rc.1。 可以兼容IE8及以上。亲测过。 官网:Getting Started | Select2 - The jQuery replacement for select boxes 一、认识select2.js 1、使用插件,首先要引入别人的插件了,你可以选…...
【MySQL的基本命令{DML 和 DDL}】
MySQL的基本命令 {DML 和 DDL} MySQL的基本命令展示所有数据库展示某个数据库中所有的表切换到某个数据库查看当前在哪个数据库查询一张表的全部数据新建一个数据库新建一张表插入一条数据删除一个表删除一个库描述表的信息展示表的创建sql代码展示库的创建sql代码导出数据 &am…...
unity3d模型中缺失animation
在 模型的Rig-Animationtype 设置成Legacy https://tieba.baidu.com/p/2293580178...
搭建自己的wiki知识库【转】
有前端基础,会Markdown、会HTML和CSS,选择 Hexo 有Vue基础可以选择 vuePress 或者 vitePress 会Go可以选择 Hugo 会Rust可以选择 Zola 会Ruby可以选择 Jekyll 会PHP可以考虑使用 WordPress 其他开源项目:docsify、GitBook 详见:如…...
【笔记】常用的Linux命令之解压缩:tar、zip、rar 命令
1、tar 常用压缩和解压缩 # 压缩文件 file1 和目录 dir2 到 test.tar.gz tar -zcvf test.tar.gz file1 dir2 # 解压 test.tar.gz(将 c 换成 x 即可) tar -zxvf test.tar.gz 额外知识:查看压缩文件内容 # 列出压缩文件的内容 tar -ztvf test…...
谈谈MYSQL索引
基本介绍 索引是帮助MySQL高效获取数据的数据结构,主要是用来提高数据检索的效率,降低数据库的IO成本,同时通过索引列对数据进行排序,降低数据排序的成本,也能降低了CPU的消耗。 通俗来说, 索引就相当于一本书的目录,…...
线程中出现异常的处理
目录 前言 正文 1.线程出现异常的默认行为 2.使用 setUncaughtExceptionHandler() 方法进行异常处理 3.使用 setDefaultUncaughtExceptionHandler() 方法进行异常处理 4.线程组内处理异常 5.线程异常处理的优先性 总结 前言 在紧密交织的多线程环境中,异…...
点击元素以外的事件监听
在项目中,我们经常会遇到需要监听目标元素以外的区域被点击或鼠标移入移出等需求。 例如下面我们有一个表格里面嵌套表单的组件 我希望点击n行的时候,n行的元素变成表单元素进行输入或者选择, 当我点击其他其他区域n行又会恢复成数据展示…...
猫头虎分享ubuntu20.04下VSCode无法输入中文解决方法
🌷🍁 博主猫头虎 带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 &a…...
tcpdump使用心得
参考原文 https://danielmiessler.com/p/tcpdump/ 几个用例 tcpdump -i eth0 显示eth0网卡当前所有的抓包情况eth0是网卡名,可以通过ifconfig获得,也可以通过 tcpdump -D 显示当前可以监听的网卡 -i 参数表示接口,后跟要监听的网卡 tcpdu…...
QJsonObject 是 Qt 框架中用于表示 JSON 对象的类
QJsonObject 是 Qt 框架中用于表示 JSON 对象的类。 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,常用于在不同平台和语言之间传输和存储数据。QJsonObject 类提供了一种方便的方式来创建、解析和操作 JSON 对象。 以下是…...
kafka3.6.0部署
部署zk https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/zookeeper-3.9.1/apache-zookeeper-3.9.1.tar.gz tar -xf apache-zookeeper-3.9.1.tar.gz -C /apps cd /apps/ && ln -s apache-zookeeper-3.9.1 zookeeper 修改配置bash grep -vE ^$|^# conf/zo…...
Nix系统修复终极指南:快速解决包管理问题与数据恢复
Nix系统修复终极指南:快速解决包管理问题与数据恢复 【免费下载链接】nix Nix, the purely functional package manager 项目地址: https://gitcode.com/gh_mirrors/ni/nix Nix作为一款纯粹函数式的包管理器,以其独特的依赖管理和环境隔离机制受到…...
终极指南:SmartRefreshLayout如何优化游戏APP排行榜的流畅刷新体验
终极指南:SmartRefreshLayout如何优化游戏APP排行榜的流畅刷新体验 【免费下载链接】SmartRefreshLayout 🔥下拉刷新、上拉加载、二级刷新、淘宝二楼、RefreshLayout、OverScroll,Android智能下拉刷新框架,支持越界回弹、越界拖动…...
Big Vision完全指南:从零掌握Google顶级视觉模型训练框架
Big Vision完全指南:从零掌握Google顶级视觉模型训练框架 【免费下载链接】big_vision Official codebase used to develop Vision Transformer, SigLIP, MLP-Mixer, LiT and more. 项目地址: https://gitcode.com/gh_mirrors/bi/big_vision Big Vision是Goo…...
总担心家人生病?心理学教你摆脱 “灾难化思维”
父母晚回半小时,孩子轻微咳嗽,伴侣说头晕…… 你是不是瞬间脑补出无数可怕画面,越想越慌,直到拨通电话才安心?这不是矫情,是灾难化思维在作祟。一、为什么总担心家人生病?3个深层根源对失去的恐…...
深度解析:AI-Render如何让Blender用户零门槛体验Stable Diffusion创作
深度解析:AI-Render如何让Blender用户零门槛体验Stable Diffusion创作 【免费下载链接】AI-Render Stable Diffusion in Blender 项目地址: https://gitcode.com/gh_mirrors/ai/AI-Render 你是否曾为3D渲染的复杂流程感到头疼?或者想尝试AI绘画却…...
使用Proteus仿真结合RWKV7-1.5B-G1A:模拟智能硬件对话系统
使用Proteus仿真结合RWKV7-1.5B-G1A:模拟智能硬件对话系统 1. 项目概述 在物联网和智能硬件快速发展的今天,如何让硬件设备具备更自然的交互能力成为一个有趣的研究方向。本文将展示一个跨学科创意项目:在Proteus仿真环境中搭建包含MCU和外…...
快速部署PyTorch 2.5:预装CUDA环境实战教程
快速部署PyTorch 2.5:预装CUDA环境实战教程 本文是一篇基础教程类文章,旨在帮助开发者快速上手使用预装了PyTorch 2.5和CUDA环境的深度学习镜像。无论你是刚接触深度学习的新手,还是需要快速搭建开发环境的老手,这篇教程都能让你…...
手机助手新选择:DeepSeek-R1-Distill-Qwen-1.5B边缘计算实测分享
手机助手新选择:DeepSeek-R1-Distill-Qwen-1.5B边缘计算实测分享 1. 引言:边缘计算的新选择 在移动设备上运行大语言模型一直是技术挑战,传统方案要么性能不足,要么资源消耗过大。DeepSeek推出的R1-Distill-Qwen-1.5B模型改变了…...
Qwen3-TTS-VoiceDesign参数详解:Temperature与Top P加点调优指南
Qwen3-TTS-VoiceDesign参数详解:Temperature与Top P加点调优指南 你是不是也遇到过这样的问题:用AI生成语音时,明明输入了“开心的语气”,出来的声音却平淡得像在念说明书?或者想要“悲伤一点”,结果听起来…...
SeqGPT-560M部署教程:Linux服务器环境配置+GPU驱动适配完整指南
SeqGPT-560M部署教程:Linux服务器环境配置GPU驱动适配完整指南 1. 项目概述 SeqGPT-560M是一个专门为企业级信息抽取需求设计的高性能AI系统。与常见的聊天模型不同,这个系统专注于从非结构化文本中精准提取关键信息,比如人名、公司名称、时…...
