当前位置: 首页 > article >正文

Pandas 图表的威力:后端

原文towardsdatascience.com/the-power-of-pandas-plots-backends-6a08d52071d2?sourcecollection_archive---------9-----------------------#2024-08-30从 Pandas 中轻松创建交互式图形https://medium.com/petoulemonde?sourcepost_page---byline--6a08d52071d2--------------------------------https://towardsdatascience.com/?sourcepost_page---byline--6a08d52071d2-------------------------------- Pierre-Etienne Toulemonde·发布于Towards Data Science ·5 分钟阅读·2024 年 8 月 30 日–https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/d5b796700b79a971847f9d847e9373d9.png图片由Lukas Blazek提供来源于Unsplash索引上下文后端2.1. Matplotlib2.2. Plotly2.3. Hvplot讨论离开之前的一句话1.上下文Python 有许多可视化包其中三个最著名的是Matplotlib以及 seaborn、Plotly 和 Hvplot。这三种包各有其优点但都需要付出学习成本甚至有时相当可观。本文的灵感来源于我发现的《Pandas 方法思维导图》该导图由Daily Dose of Data science newsletter提供这是我强烈推荐的一个通讯。当时我正好在探索 Hvplot 可视化包。我认为像 Hvplot 这样轻松切换不同可视化后端的想法非常棒这里有一个示例展示如何从 Hvplot 切换到 Plotly。看到我们也可以用 pandas 实现这一点我觉得这个想法太有趣不能不分享出来。Pandas 是 Python 数据科学的核心我们都知道如何使用它。但集成到 Pandas 中的 Matplotlib 已经显得有些老旧并且在易用性和展示效果上被其他包超越。Pandas 可视化后端的强大之处在于它让你能够利用最新的可视化包进行数据探索和结果呈现而无需花时间学习这些包尽管这些包非常强大2. 后端Pandas 是基于两个包构建的Numpy 和 Matplotlib。这也解释了为什么我们使用 Matplotlib 脚本来生成图表因此生成的图表是 Matplotlib 图表。自从 Pandas 创建以来它不断发展并提供了用户修改 Pandas 使用的可视化后端的可能性。我在研究过程中找到的 6 个可用的后端是Plotnineggplot2PlotlyAltairHoloviewsHvplotPandas_bokehMatplotlib默认后端有几种方法可以更改后端2 个全局方法pd.set_option(plotting.backend,name of backend)# ORpd.options.plotting.backendname of backend1 个本地方法df.plot(backendname of backend,x...)注意更改后端需要 Pandas 0.25有时还需要一些特定的依赖项例如下面的 Hvplot。这里有 2 个示例使用 Plotlyimportpandasaspd# Basic packagespd.options.plotting.backendplotlydfpd.DataFrame(dict(a[1,3,2],b[3,2,1]))figdf.plot()fig.show()使用 Hvplotimportnumpyasnpimportpandasaspd# Basic packagesimporthvplotimporthvplot.pandas# ! Specific dependency to installpd.options.plotting.backendhvplot# Backend modificationdatanp.random.normal(size[50,2])dfpd.DataFrame(data,columns[x,y])df.plot(kindscatter,xx,yy)# Plotting2.1. MatplotlibMatplotlib 是 Pandas 的默认可视化后端。换句话说如果不指定后端将使用 Matplotlib。它是一个高效的包可以快速可视化数据以进行探索或提取结果但它已经老化并且在易用性和渲染能力上被其他包赶超。Matplotlib 的优势在于由于 Pandas 从创建之初就基于 Matplotlib因此 Matplotlib 与 Pandas 的集成非常完美所有 Matplotlib 函数都可以在 Pandas 中使用。提醒一下这里是集成到 Pandas 中的 11 个 Matplotlib 显示方法“area” 用于区域图“bar” 用于垂直条形图“barh” 用于水平条形图“box” 用于箱形图“hexbin” 用于 hexbin 图“hist” 用于直方图“kde” 用于核密度估计图“density” 是 “kde” 的别名“line” 用于折线图“pie” 用于饼图“scatter” 用于散点图。2.2. PlotlyPlotly 是由 Plotly 公司开发的可视化包。该公司开发了框架 Plotly.js用于在 Python 中进行交互式数据可视化。Plotly 公司还提供了 Python 仪表板包 Dash。要在 Pandas 中使用 Plotly只需导入Plotly express并更改后端importpandasaspdimportplotly.expressaspx# Import packagesdfpd.read_csv(iris.csv)# Modifying locally Pandas backenddf.plot.scatter(backendplotly,xsepal.length,ysepal.width)Pandas 返回一个与 Plotly 相同类型的对象df.plot.scatter(backendplotly,xsepal.length,ysepal.width)# → class plotly.graph_objs._figure.Figurepx.scatter(xdf[sepal.length],ydf[sepal.width])# → class plotly.graph_objs._figure.Figure其优势在于你可以将 Pandas 中创建的图形直接集成到 Plotly 宇宙中尤其是 Dash一个限制是Plotly 与 Pandas 的集成尚不完美详细信息请参见 Plotly 网站Plotly 网站详情。2.3. HvplotHvplot 是一个基于 bokeh 的交互式可视化包。这是一个令人兴奋的包我是前些时候发现的至今仍令我着迷既因为 Hvplot 集成了类似于 Pandas 的后端概念也因为 Holoviz 套件 以及相关包如 Panel 用于创建动态客户端网站。即使没有 Pandas 后端的概念Hvplot 也不需要过多的学习就能开始使用只需将 Pandas 的.plot()替换为.hvplot()importpandasaspdimporthvplot dfpd.read_csv(iris.csv)# Plot with Pandasdf.plot.scatter(backendhvplot,xsepal.length,ysepal.width)# Same plot with hvplotdf.hvplot.scatter(backendhvplot,xsepal.length,ysepal.width)使用 Hvplot 后端的方式与使用 Plotly 后端相同只需要导入 Hvplot 包的依赖项importnumpyasnpimportpandasaspd# Basic packagesimporthvplotimporthvplot.pandas# Specific dependency to installpd.options.plotting.backendhvplot# Backend modificationdatanp.random.normal(size[50,2])dfpd.DataFrame(data,columns[x,y])df.plot(kindscatter,xx,yy)# Plotting与 Plotly 类似通过 hvplot 后端从 Pandas 生成的图表是 Hvplot 类型的df.plot.scatter(backendhvplot,xsepal.length,ysepal.width)# → class holoviews.element.chart.Curvedf.hvplot.scatter(backendhvplot,xsepal.length,ysepal.width)# → class holoviews.element.chart.CurveHvplot 是强大的 Holoviz 套件的一部分套件中还有许多其他相关工具可以推动数据分析的深度例如 Panel、geoviews、datashader 等等。这种一致性使得我们可以从 pandas 创建图表同时仍然能够利用 Holoviz 套件的优势。3. 结论Pandas 后端是一个非常高效的解决方案可以发现并利用最新的 Python 可视化包而无需投入太多时间只需 18 个字符包括空格就可以将一个标准的 matplotlib 图表本地转化为交互式的 Plotly 图表从而享受这种可视化类型的所有好处。然而这种解决方案也有一定的局限性它不适用于那些需要大量定制化的高级可视化目标比如数据新闻中的高级可视化因为 Pandas 中的包集成尚不完善。此外这个解决方案仅涵盖了基于 Pandas 构建的可视化包排除了像 D3.js 这样的其他可视化解决方案。Hvplot 目前是我最喜欢的可视化包它一开始非常容易上手能与所有主要的数据处理包如 Polars、Dask、Xray 等兼容并且是一个持续应用的部分可以让你从图表扩展到动态的全客户端网站。4. 离开前的一句话在我的研究过程中我没有找到预期的那么多文档。我认为这个概念很棒所以我本以为会有很多相关文章。如果你觉得这个解决方案真的有用或者只是一个看起来很酷但没有实际用途的东西欢迎在评论中告诉我。感谢阅读

相关文章:

Pandas 图表的威力:后端

原文:towardsdatascience.com/the-power-of-pandas-plots-backends-6a08d52071d2?sourcecollection_archive---------9-----------------------#2024-08-30 从 Pandas 中轻松创建交互式图形 https://medium.com/petoulemonde?sourcepost_page---byline--6a08d520…...

【紧急预警】NotebookLM 2.3版本将关闭本地PDF语义隔离模式——社会科学研究者必须在48小时内完成知识库迁移

更多请点击: https://kaifayun.com 第一章:NotebookLM 2.3版本语义隔离模式终止的技术动因与社会科学研究范式冲击 语义隔离模式终止的核心技术动因 NotebookLM 2.3 版本正式移除了“语义隔离(Semantic Isolation)”模式&#x…...

德勤预计机器人投资将在2026年增长的地方

尽管德勤预测到2026年全球⼯业机器⼈基数可能达到550万个,但也承认“⾃2021年以来,年度新机器⼈销量停滞在50万台以上。”为了满⾜以⼈⼝统计为驱动的需求,技术⽣态系统必须解决与数据质量、集成和安全性相关的瓶颈,公司强调“⽬前…...

【免费下载】 STM32标准库-SPI-DMA收发数据-读写Flash(W25Q256JV)-仿printf和scanf输入输出

STM32标准库-SPI-DMA收发数据-读写Flash(W25Q256JV)-仿printf和scanf输入输出 【下载地址】STM32标准库-SPI-DMA收发数据-读写FlashW25Q256JV-仿printf和scanf输入输出 本项目基于STM32F429IGT6单片机,利用Keil MDK V5.32开发环境,展示了如何通过SPI接口…...

STC8单片机按键事件处理代码实现

STC8单片机按键事件处理代码实现 【下载地址】STC8单片机按键事件处理代码实现 本仓库提供了一个用于STC8单片机的按键事件处理代码实现,支持按键的单击、双击和长按事件。该代码设计简洁,易于理解和移植,可以方便地应用于其他单片机平台。 …...

【免费下载】 AD7124中文手册(非常完整)

AD7124中文手册(非常完整) 【下载地址】AD7124中文手册非常完整 AD7124-8是一款高性能模拟前端,设计用于在各种苛刻环境中实现精确的数据采集。这款芯片的特点在于其内置的高精度24位Σ-Δ模数转换器(ADC),能够灵活配置以支持8个差…...

2026年小程序多少钱:8款高口碑产品排行榜解锁最优选择

导读:2026年,小程序开发已成为企业数字化运营的核心工具,其成本结构受功能复杂度、平台选择及服务商专业度等多因素影响。市场调研显示,基础展示型小程序报价集中在5000-15000元,而定制化多功能方案可达5万元以上。行业…...

【免费下载】 慧荣SM2258XT开卡工具集合

慧荣SM2258XT开卡工具集合 【下载地址】慧荣SM2258XT开卡工具集合 本仓库提供了一套专门针对慧荣SM2258XT主控的固态硬盘、移动硬盘及SSDM.2硬盘的开卡工具集合。该工具集合旨在解决因主控问题导致的设备无法识别、不识别或容量显示错误等问题。通过使用本工具包,您…...

ARM指令集架构与安全指令解析:APAS、ASR与AUT

1. ARM指令集架构概述在处理器设计领域,指令集架构(Instruction Set Architecture, ISA)定义了处理器与软件之间的契约。作为RISC(精简指令集计算机)架构的代表,ARM指令集以其高效能和低功耗特性&#xff0…...

Talkyard管理员入门:10个必备设置打造完美的社区环境

Talkyard管理员入门:10个必备设置打造完美的社区环境 【免费下载链接】talkyard A community discussion platform: Brings together the main features from StackOverflow, Slack, Discourse, Reddit, and Disqus blog comments. 项目地址: https://gitcode.com…...

电子项目布线指南:从导线、电缆到连接器的核心选型与避坑

1. 项目概述:为什么“线”比“电路”本身更重要?干了十几年电子项目,从学生时代的第一个闪烁LED,到后来复杂的机器人系统和工业控制器,我踩过最多的坑,往往不是芯片选型或代码逻辑,而是那些看起…...

自定义下载器开发:如何为Fetch扩展OkHttp和其他下载引擎

自定义下载器开发:如何为Fetch扩展OkHttp和其他下载引擎 【免费下载链接】Fetch The best file downloader library for Android 项目地址: https://gitcode.com/gh_mirrors/fetch/Fetch Fetch作为Android平台上最优秀的文件下载库,其强大的扩展性…...

MLX90614红外测温传感器:从原理到Arduino实战应用指南

1. 项目概述:从接触式到非接触式的测温革新在嵌入式开发和物联网项目中,温度测量是一个永恒的主题。从传统的热敏电阻、DS18B20,到热电偶,我们习惯了将探头紧贴甚至刺入被测物体来获取读数。但你是否遇到过这样的困境:…...

数字信号处理算法在实时系统中的应用【附代码】

✨ 长期致力于实时高速相干光通信、低复杂度数字信号处理模块、并行化研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)无乘法器的恒模算法并行化设计&…...

LPC18xx/LPC43xx USB0接口低速设备识别问题解决方案

1. 问题现象与背景分析在嵌入式开发领域,NXP LPC1800和LPC4300系列微控制器因其强大的USB主机功能而被广泛应用。但在实际项目中,工程师们发现一个奇怪现象:当某些特定型号的DELL键盘(USB低速设备)连接到LPC18xx/LPC43…...

高维光谱数据分析研究与光谱型纳米流式检测系统数据采集处理软件的开发与化学生物学应用【附代码】

✨ 长期致力于光谱型纳米流式检测技术、光谱解耦算法、降维算法、免疫分型、细菌自发荧光研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)基于泊松回归…...

【免费下载】 UVM标准库源代码及用户指南资源

UVM标准库源代码及用户指南资源 简介 本仓库提供了统一验证方法论(Universal Verification Methodology, UVM)的多个关键版本的源代码压缩包。UVM是一种用于电子设计验证的高级验证方法学,由Accellera Systems Initiative开发并标准化&#x…...

终极Windows APK安装器:3分钟学会在电脑上安装Android应用

终极Windows APK安装器:3分钟学会在电脑上安装Android应用 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否想在Windows电脑上直接运行Android应用&am…...

【免费下载】 最靠谱的Cadence Allegro PCB SI 板级仿真教程

最靠谱的Cadence Allegro PCB SI 板级仿真教程 【下载地址】最靠谱的CadenceAllegroPCBSI板级仿真教程 最靠谱的Cadence Allegro PCB SI 板级仿真教程欢迎来到“最靠谱的Cadence Allegro PCB SI 板级仿真教程”资源页面 项目地址: https://gitcode.com/open-source-toolkit/e…...

技术演进:从PDH到SDH的WAN接口变迁与POS/CPOS应用解析

1. 从铜缆到光纤:PDH与SDH的技术演进之路 记得我第一次接触E1接口是在2008年,当时在一家电信机房看到一排闪着绿色指示灯的设备,老师傅告诉我这就是承载着电话业务的"2M线"。那时候我还不知道,这个看似简单的接口背后&a…...

LabVIEW 32位版如何调用Halcon 17.12的.NET库?一个图像处理小白的踩坑实录

LabVIEW 32位版调用Halcon 17.12 .NET库的实战指南 在工业视觉和自动化测试领域,LabVIEW与Halcon的结合堪称黄金搭档。LabVIEW以其直观的图形化编程界面著称,而Halcon则凭借强大的图像处理算法库在机器视觉领域占据重要地位。然而,当32位Lab…...

告别虚拟机卡顿:在VMware 17上为RHEL 9.2分配CPU和内存的黄金法则

告别虚拟机卡顿:在VMware 17上为RHEL 9.2分配CPU和内存的黄金法则 当你在VMware Workstation 17上运行RHEL 9.2时,是否经常遇到编译速度慢、桌面响应延迟甚至整个系统卡死的情况?这很可能是因为你没有根据宿主机的实际硬件情况科学分配虚拟资…...

【免费下载】 车牌识别字符库

车牌识别字符库 【下载地址】车牌识别字符库 本仓库提供了一个车牌识别字符库,该字符库已经过预处理,将车牌上的字符进行了切割和分割,每个字符均为单独的图像文件。字符图像的大小统一为20x20像素,涵盖了车牌上常见的省份简写、数…...

远程控制软件哪个好 远程控制软件推荐用无界趣连2.0

不管是想用手机串流玩端游,还是朋友、家人遇到设备难题需要免费远程协助,一款好用的远程控制软件都能帮上大忙。想找到一款靠谱的远程控制软件并不容易,推荐无界趣连2.0,不管是游戏娱乐还是应急协助,都能轻松满足需求&…...

从一次Keycloak弱口令通报说起:微服务架构下的密码管理‘避坑’全指南(附Docker Compose配置)

微服务架构下的密码安全实践:从Keycloak弱口令到全局防护体系 1. 当安全工具成为攻击入口:一次真实事件复盘 去年某科技公司的运维团队收到了一份来自监管部门的网络安全通报——部署在公有云上的Keycloak服务遭到境外IP爆破攻击。攻击者仅用"admin…...

【亲测免费】 CISP-DSG 数据安全培训教材课件标准版

CISP-DSG 数据安全培训教材课件标准版 【下载地址】CISP-DSG数据安全培训教材课件标准版 本仓库提供的是“注册数据安全治理专业人员”(Certified Information Security Professional - Data Security Governance,简称 CISP-DSG)的培训教材课…...

Linux实战:部署MinIO对象存储服务与Systemd开机自启配置详解

1. MinIO简介与环境准备 MinIO是一款高性能的分布式对象存储服务,完全兼容Amazon S3 API。它特别适合在私有云环境中部署,提供文件存储、备份和归档等功能。我在多个生产环境中使用过MinIO,它的轻量级设计和简单配置让我印象深刻。 首先需要准…...

CircuitFusion:多模态AI在集成电路设计中的革命性应用

1. 集成电路设计的多模态革命:CircuitFusion技术解析在AI芯片设计领域,一个令人头疼的现实是:随着芯片复杂度呈指数级增长,传统设计流程已难以应对。以7nm工艺节点为例,单个芯片可能包含数十亿个晶体管,设计…...

别再手动发邮件了!用Power Automate为SharePoint列表搭建自动化审批流(保姆级教程)

别再手动发邮件了!用Power Automate为SharePoint列表搭建自动化审批流(保姆级教程) 在快节奏的现代办公环境中,手动处理审批流程已成为效率的隐形杀手。想象一下:员工提交的请假申请需要HR手动转发邮件,采购…...

Xarray数据处理的隐藏神器:rioxarray实战,用SHP文件精准裁剪NetCDF气象数据

Xarray数据处理的隐藏神器:rioxarray实战,用SHP文件精准裁剪NetCDF气象数据 在气象、海洋和遥感领域,NetCDF格式的网格数据几乎是科研和业务工作中的标配。当我们面对全球或大区域的高分辨率数据集时,往往只需要提取其中某个特定区…...