【Pandas】pandas DataFrame to_numpy
Pandas2.2 DataFrame
Conversion
| 方法 | 描述 |
|---|---|
| DataFrame.astype(dtype[, copy, errors]) | 用于将 DataFrame 中的数据转换为指定的数据类型 |
| DataFrame.convert_dtypes([infer_objects, …]) | 用于将 DataFrame 中的数据类型转换为更合适的类型 |
| DataFrame.infer_objects([copy]) | 用于尝试将 DataFrame 中的 object 类型的列转换为更具体的类型(如 int64、float64 或 boolean) |
| DataFrame.copy([deep]) | 用于创建 DataFrame 的副本 |
| DataFrame.bool() | 用于将 DataFrame 转换为布尔值 |
| DataFrame.to_numpy([dtype, copy, na_value]) | 用于将 DataFrame 转换为 NumPy 数组 |
pandas.DataFrame.to_numpy
pandas.DataFrame.to_numpy 是一个方法,用于将 DataFrame 转换为 NumPy 数组。这个方法非常有用,特别是在需要将 DataFrame 中的数据传递给其他库(如 NumPy、SciPy 或 scikit-learn)进行进一步处理时。
方法签名
DataFrame.to_numpy(dtype=None, copy=True, na_value=None)
参数说明
dtype: 字符串或数据类型,默认为None,表示返回的 NumPy 数组的数据类型。如果为None,则使用 DataFrame 中数据的默认类型。copy: 布尔值,默认为True,表示是否返回 DataFrame 数据的副本。如果设置为False,则返回的数据数组与 DataFrame 共享内存。na_value: 标量值,默认为None,表示如何表示 DataFrame 中的缺失值(NaN)。如果为None,则使用 NumPy 的默认行为(即np.nan)。
返回值
- 返回一个 NumPy 数组,包含 DataFrame 中的数据。
示例
假设有一个 DataFrame 如下:
import pandas as pd
import numpy as npdata = {'A': [1, 2, 3],'B': [1.1, 2.2, 3.3],'C': ['x', 'y', 'z']
}df = pd.DataFrame(data)
print("原始 DataFrame:")
print(df)
print("\n数据类型:")
print(df.dtypes)
输出:
原始 DataFrame:A B C
0 1 1.1 x
1 2 2.2 y
2 3 3.3 z数据类型:
A int64
B float64
C object
dtype: object
示例1:将 DataFrame 转换为 NumPy 数组(默认参数)
array_default = df.to_numpy()
print("转换后的 NumPy 数组 (默认参数):")
print(array_default)
print("\n数据类型:")
print(array_default.dtype)
结果:
转换后的 NumPy 数组 (默认参数):
[[1 1.1 'x'][2 2.2 'y'][3 3.3 'z']]数据类型:
object
示例2:不复制数据
array_no_copy = df.to_numpy(copy=False)
print("转换后的 NumPy 数组 (不复制数据):")
print(array_no_copy)
print("\n数据类型:")
print(array_no_copy.dtype)
结果:
转换后的 NumPy 数组 (不复制数据):
[[1 1.1 'x'][2 2.2 'y'][3 3.3 'z']]数据类型:
object
示例3:指定缺失值表示为 -1
df_with_na = pd.DataFrame({'A': [1, 2, np.nan],'B': [1.1, np.nan, 3.3],'C': ['x', 'y', np.nan]
})array_with_na = df_with_na.to_numpy(na_value=-1)
print("转换后的 NumPy 数组 (指定缺失值为 -1):")
print(array_with_na)
print("\n数据类型:")
print(array_with_na.dtype)
结果:
转换后的 NumPy 数组 (指定缺失值为 -1):
[[ 1. 1.1 -1. ][ 2. -1. 1. ][ -1. 3.3 -1. ]]数据类型:
float64
通过这些示例,可以看到 pandas.DataFrame.to_numpy 方法如何将 DataFrame 转换为 NumPy 数组,并且如何使用不同的参数来控制转换的行为。
注意事项
to_numpy方法可以将 DataFrame 转换为 NumPy 数组。- 可以通过
dtype参数指定返回的 NumPy 数组的数据类型。 - 设置
copy=True返回 DataFrame 数据的副本,而不会共享内存。 - 设置
copy=False返回的数据数组与 DataFrame 共享内存。 - 可以通过
na_value参数指定如何表示 DataFrame 中的缺失值(NaN)。
示例代码及验证
为了验证 pandas.DataFrame.to_numpy 方法的效果,可以运行上述示例代码并查看输出结果。
import pandas as pd
import numpy as np# 创建一个示例 DataFrame
data = {'A': [1, 2, 3],'B': [1.1, 2.2, 3.3],'C': ['x', 'y', 'z']
}df = pd.DataFrame(data)
print("原始 DataFrame:")
print(df)
print("\n数据类型:")
print(df.dtypes)# 将 DataFrame 转换为 NumPy 数组(默认参数)
array_default = df.to_numpy()
print("\n转换后的 NumPy 数组 (默认参数):")
print(array_default)
print("\n数据类型:")
print(array_default.dtype)# 不复制数据
array_no_copy = df.to_numpy(copy=False)
print("\n转换后的 NumPy 数组 (不复制数据):")
print(array_no_copy)
print("\n数据类型:")
print(array_no_copy.dtype)# 创建一个包含缺失值的 DataFrame
df_with_na = pd.DataFrame({'A': [1, 2, np.nan],'B': [1.1, np.nan, 3.3],'C': ['x', 'y', np.nan]
})# 指定缺失值表示为 -1
array_with_na = df_with_na.to_numpy(na_value=-1)
print("\n转换后的 NumPy 数组 (指定缺失值为 -1):")
print(array_with_na)
print("\n数据类型:")
print(array_with_na.dtype)
运行结果
运行上述代码后,你会看到以下输出:
原始 DataFrame:A B C
0 1 1.1 x
1 2 2.2 y
2 3 3.3 z数据类型:
A int64
B float64
C object
dtype: object转换后的 NumPy 数组 (默认参数):
[[1 1.1 'x'][2 2.2 'y'][3 3.3 'z']]数据类型:
object转换后的 NumPy 数组 (不复制数据):
[[1 1.1 'x'][2 2.2 'y'][3 3.3 'z']]数据类型:
object转换后的 NumPy 数组 (指定缺失值为 -1):
[[ 1. 1.1 -1. ][ 2. -1. 1. ][ -1. 3.3 -1. ]]数据类型:
float64
通过这些示例,可以看到 pandas.DataFrame.to_numpy 方法如何将 DataFrame 转换为 NumPy 数组,并且如何使用不同的参数来控制转换的行为。
相关文章:
【Pandas】pandas DataFrame to_numpy
Pandas2.2 DataFrame Conversion 方法描述DataFrame.astype(dtype[, copy, errors])用于将 DataFrame 中的数据转换为指定的数据类型DataFrame.convert_dtypes([infer_objects, …])用于将 DataFrame 中的数据类型转换为更合适的类型DataFrame.infer_objects([copy])用于尝试…...
Vue环境搭建:vue+idea
目录 第一章、Vue环境搭建:安装node2.1)node的下载2.2)配置node的环境变量2.3)常见的npm命令 第二章、使用idea创建vue工程2.1)在IDEA中设置国内镜像2.2)在IDEA中进行脚手架安装2.3)在IDEA中创建…...
ECMAScript 7~10 新特性
ECMAScript 7 新特性 ECMAScript 6 新特性(一) ECMAScript 6 新特性(二) ECMAScript 7~10 新特性(本文) 1. 数组方法 Array.prototype.includes() 用来检测数组中是否包含指定元素,返回布尔值&…...
银河麒麟v10(arm架构)部署Embedding模型bge-m3【简单版本】
硬件 服务器配置:鲲鹏2 * 920(32c) 4 * Atlas300I duo卡 参考文章 https://www.hiascend.com/developer/ascendhub/detail/07a016975cc341f3a5ae131f2b52399d 鲲鹏昇腾Atlas300Iduo部署Embedding模型和Rerank模型并连接Dify(自…...
Manifold-IJ 2022.1.21 版本解析:IntelliJ IDEA 的 Java 增强插件指南
Manifold-IJ-2022.1.21 可能是 IntelliJ IDEA 的一个插件或相关版本,特别是与 Manifold 这个增强 Java 开发体验的框架相关的组件。 很多时候没有网络环境,而又需要这个插件。 Manifold-IJ 2022.1.21下载:https://pan.quark.cn/s/ad907344c…...
轻量级碎片化笔记memos本地NAS部署与跨平台跨网络同步笔记实战
文章目录 前言1. 使用Docker部署memos2. 注册账号与简单操作演示3. 安装cpolar内网穿透4. 创建公网地址5. 创建固定公网地址 推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。 点击跳转到网站 前言…...
【C++算法】54.链表_合并 K 个升序链表
文章目录 题目链接:题目描述:解法C 算法代码: 题目链接: 23. 合并 K 个升序链表 题目描述: 解法 解法一:暴力解法 每个链表的平均长度为n,有k个链表,时间复杂度O(nk^2) 合并两个有序…...
EG8200Mini-104边缘计算网关!聚焦IEC104协议的工业数据转换与远程运维平台
在工业自动化和信息化融合不断深化的背景下,现场设备的数据采集与协议转换能力对系统集成效率与运维成本产生着直接影响。EG8200Mini-104边缘计算网关正是基于此需求场景设计,具备IEC104主从站双向支持能力,并配套远程运维与多网络接入方案&a…...
python多线程+异步编程让你的程序运行更快
多线程简介 多线程是Python中实现并发编程的重要方式之一,它允许程序在同一时间内执行多个任务。在某些环境中使用多线程可以加快我们代码的执行速度,例如我们通过爬虫获得了一个图片的url数组,但是如果我们一个一个存储很明显会非常缓慢&…...
各种场景的ARP攻击描述笔记(超详细)
1、ARP报文限速 上一章我们说过ARP报文也是需要上送CPU进行处理的协议报文,如果设备对收到的大量ARP报文全部进行处理,可能导致CPU负荷过重而无法处理其他业务。因此,在处理之前需要对ARP报文进行限速,以保护CPU资源。 1.根据源MAC地址或源IP地址进行ARP限速 当设备检测到某一…...
Java 实现 List<String> 与 String 互转
在 Java 开发过程中,有时需要将 List<String> 转为 String 存储,后续使用时再还原回去。此时就需要 Java 实现 List<String> 与 String 互转。以下是一种互转方式。 采用如下工具包实现。 <dependency><groupId>org.apache.com…...
庙算兵推:使用Streamlit框架构建了一个智能作战推演系统。
这段代码是一个完整的军事模拟应用,使用Streamlit框架构建了一个智能作战推演系统。该系统包括了三维地图显示、作战单位管理、应急事件处理等功能。用户可以通过界面控制推演的开始和暂停,调整时间加速倍率,并查看实时的战斗情况和系统状态。…...
daz3d ERC Freeze to Morph Target 和 另存为 Morph Asset(s)
. ERC 冻结至变形目标 (ERC Freeze to Morph Target) 核心目标:将骨架的调整与自定义造型的滑块关联起来。 详细解释: 当你创建一个自定义造型(Morph)并调整了骨架(Rigging)以适应这个新造型后ÿ…...
HDCP(四)
HDCP驱动开发实战深度解析 以下从协议栈架构、核心模块实现、安全设计到硬件集成,结合HDCP 2.x规范与主流硬件平台(如ARM、FPGA)特性,系统拆解驱动开发关键环节: 1. 协议栈架构与模块划分 驱动分层设计 硬件抽象层&…...
Docker MySQL的主从同步 数据备份 数据同步 配置文件
创建主库 docker run \--namemysql_1 \-e MYSQL_ROOT_PASSWORD123456 \-p 3306:3306 \-v mysql_main_data:/var/lib/mysql \--restart unless-stopped \-d \mysql:8.0进入容器内部 docker exec -it mysql_1 bash查找配置文件 find / -name my.cnf复制出主机 docker cp mysql…...
MATLAB在哪些特定领域比Python更有优势?
文章目录 前言科学研究与工程计算数值计算信号处理控制系统设计 教育领域易于学习和上手教学资源丰富 快速原型开发集成开发环境便捷 前言 MATLAB 在以下特定领域比 Python 更具优势: 科学研究与工程计算 数值计算 高效矩阵运算:MATLAB 以矩阵为基本数…...
linux安装mysql常出现的问题
wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm rpm -ivh mysql-community-release-el7-5.noarch.rpm yum update yum install mysql-server 权限设置: chown -R mysql:mysql /var/lib/mysql/ 初始化 MySQL: mysqld --initiali…...
C++手撕单链表及逆序打印
在学习数据结构的过程中,链表是一个非常重要的基础数据结构。今天,我们将通过C手动实现一个单链表,并添加一个逆序打印的功能,帮助大家更好地理解链表的实现和操作。 一、链表简介 链表是一种线性数据结构,其中每个元…...
996引擎-疑难杂症:Ctrl + F9 编辑好的UI进入游戏查看却是歪的
Ctrl F9 编辑好UI后,进入游戏查看却是歪的。 检查Ctrl F10 是否有做过编辑。可以找到对应界面执行【清空】...
JQuery初步学习
文章目录 一、前言二、概述2.1 介绍2.2 安装 三、语法3.1 文档就绪3.2 选择器 四、事件4.1 概述4.2 事件绑定/解绑4.3 一次性事件4.4 事件委托4.5 自定义事件 五、效果5.1 隐藏/显示5.2 淡入淡出5.3 滑动5.4 动画 六、链七、HTML7.1 内容/属性7.2 元素操作7.3 类属性7.4 样式属…...
repo仓库文件清理
1. repo 仓库内文件清理 # 清理所有Git仓库中的项目 repo forall -c git clean -dfx # 重置所有Git 仓库中的项目 repo forall -c git reset --hard 解释: repo forall -c git clean -dfx: repo forall 是一个用于在所有项目中执行命令的工具。-c 后…...
使用Docker部署Java项目的完整指南
前言 Docker是一个轻量级的容器化平台,可将应用及其依赖打包成标准化单元,实现快速部署和环境隔离。本文以Spring Boot项目为例,演示如何通过Dockerfile部署Java应用。 准备工作 本地环境 安装Docker Desktop(官网下载࿰…...
基于 Spring Boot 瑞吉外卖系统开发(三)
基于 Spring Boot 瑞吉外卖系统开发(三) 分类列表 静态页面 实现功能所需要的接口 定义Mapper接口 Mapper public interface CategoryMapper extends BaseMapper<Category> {}定义Service接口 public interface CategoryService extends ISe…...
TCP,UDP协议和域名地址
1.TCP(传输控制协议)是面向连接,UDP(用户数据报协议)是无连接的 2.应用层:FTP,HTTP,SMTP,TELNET,DNS,TFTP 传输层;TCP,UDP 网际层:IP,ICMP,ARP,RARP 3.TCP21:20端口数据传输;21端…...
winserver2022备份
安装备份,然后等待安装完成即可 然后可以在这里看到安装好的win server2022备份 一直下一步然后到这里 不要用本地文件夹备份 备份到远程服务器,远程服务器路径 然后确定备份即可 如何恢复呢? 点击右侧的恢复就可以了 打开任务计划程序 这…...
GAT-GRAPH ATTENTION NETWORKS(论文笔记)
CCF等级:A 发布时间:2018年 代码位置 25年4月21日交 目录 一、简介 二、原理 1.注意力系数 2.归一化 3.特征组合与非线性变换 4.多头注意力 4.1特征拼接操作 4.2平均池化操作 三、实验性能 四、结论和未来工作 一、简介 图注意力网络&…...
SpringBoot和微服务学习记录Day1
分布式架构 为了解决大量的用户请求,需要多台服务器,为处理某些请求将一些服务器划分为一个集群,通过一种技术来处理集群的请求 典型应用: nginx:Tomcat集群 Redis:哨兵模式 MySQL:mycat 微…...
PDFBox/Itext5渲染生成pdf文档
目录 PDFBox最终效果实现代码 Itext5最终效果实现代码 PDFBox 使用PDFBox可以渲染生成pdf文档,并且自定义程度高,只是比较麻烦,pdf的内容位置都需要手动设置x(横向)和y(纵向)绝对位置ÿ…...
前端获取不到后端新加的字段 解决方案
前端获取不到后端新加的字段 解决方案 sql 返回的是 FileInfo 对象 private String lastUpdateTimeStr;// 自定义 setLastUpdateTime 方法,确保在设置 lastUpdateTime 时自动格式化为字符串public void setLastUpdateTime(LocalDateTime lastUpdateTime) {this.las…...
【Java学习】AI时代下如何学习Java语言开发
学习 Java 语言开发时,合理借助 AI 工具可以提升效率、深化理解,以下是具体的学习策略和方法: 一、利用 AI 辅助基础学习 1. 智能文档解读与语法解析 工具:ChatGPT、Bing Chat、Google Bard用法: 直接提问基础语法问…...
