当前位置: 首页 > article >正文

Python数据可视化之从单变量到多变量的方法

Python凭借其强大的可视化库如Matplotlib、Seaborn成为进行EDA的首选工具。本文基于一份实用的“Python数据可视化速查表”系统介绍从单变量到多变量、从时间序列到文本数据的可视化方法并提供代码示例与扩展解读助你高效完成数据探索。1. 单变量分析了解单个变量分布单变量分析旨在理解数据集中单个变量的分布特征适用于数值型和分类型数据。常用图表与代码示例12345678910111213141516171819202122232425262728importpandas as pdimportseaborn as snsimportmatplotlib.pyplot as plt# 示例数据框dfpd.DataFrame({col: [1,2,2,3,3,3,4,4,5]})# 1. 直方图查看数值分布df.hist()plt.title(数值分布直方图)plt.show()# 2. 箱线图查看分布与离群点原文borglot应为boxplotsns.boxplot(datadf, ycol)# 展示数值列col的分布plt.title(箱线图展示分布与异常值)plt.show()# 3. 核密度估计图平滑的概率密度曲线sns.kdeplot(datadf[col])plt.title(核密度估计图)plt.show()# 4. 条形图适用于分类数据频次统计df[col].value_counts().plot(kindbar)plt.title(分类频次条形图)plt.xlabel(类别)plt.ylabel(频次)plt.show()适用场景直方图了解数值分布是否正态、偏斜箱线图快速发现异常值核密度图平滑展示分布趋势条形图展示类别频次2. 双变量分析探索两个变量间关系双变量分析用于探索两个变量之间的关联包括数值-数值、数值-类别等组合。12345678910111213141516171819202122232425262728293031# 示例数据dfpd.DataFrame({x: [1,2,3,4,5],y: [2,4,6,8,10],category: [A,B,A,B,A]})# 1. 散点图两个数值变量关系sns.scatterplot(datadf, xx, yy)plt.title(散点图x与y的关系)plt.show()# 2. 带回归线的散点图sns.regplot(datadf, xx, yy)plt.title(带线性回归的散点图)plt.show()# 3. 条形图类别与数值的对比sns.barplot(xcategory, yy, datadf)plt.title(不同类别的y值对比)plt.show()# 4. 小提琴图类别下的分布与密度sns.violinplot(datadf, xcategory, yy)plt.title(小提琴图类别y的分布)plt.show()# 5. 箱线图原文borglet应为boxplot比较类别间分布sns.boxplot(xcategory, yy, datadf)plt.title(箱线图类别间分布比较)plt.show()3. 多变量分析三维及以上关系探索当我们需要同时考察三个或更多变量时多变量可视化工具显得尤为重要。1234567891011121314151617181920212223242526272829303132# 示例数据dfpd.DataFrame({x: [1,2,3,4,5],y: [2,4,6,8,10],z: [5,4,3,2,1],type: [T1,T2,T1,T2,T1]})# 1. 散点图矩阵所有数值变量两两关系sns.pairplot(df)plt.suptitle(散点图矩阵, y1.02)plt.show()# 2. 相关热图变量间相关性强度sns.heatmap(df.corr(), annotTrue, cmapcoolwarm)plt.title(变量相关性热图)plt.show()# 3. 联合分布图散点图边缘分布sns.jointplot(datadf, xx, yy)plt.show()# 4. 三变量散点图颜色表示第三维plt.scatter(df[x], df[y], cdf[z], cmapviridis)plt.colorbar(labelz值)plt.title(三变量散点图颜色表示z)plt.show()# 5. 分类着色散点图sns.scatterplot(datadf, xx, yy, huetype)plt.title(按类别着色的散点图)plt.show()4. 时间序列分析趋势、周期与异常时间序列数据常见于金融、气象、日志等领域可视化有助于识别趋势、季节性和异常。1234567891011121314151617181920212223242526272829# 示例时间序列数据dfpd.DataFrame({date: pd.date_range(2023-01-01, periods100, freqD),value: np.random.randn(100).cumsum()50})# 1. 简单时间序列图df.plot(xdate, yvalue)plt.title(时间序列趋势图)plt.xlabel(日期)plt.ylabel(数值)plt.show()# 2. 移动平均图窗口为7天df.set_index(date)[value].rolling(window7).mean().plot()plt.title(7天移动平均图)plt.show()# 3. 时间序列分解需statsmodels库fromstatsmodels.tsa.seasonalimportseasonal_decomposeresultseasonal_decompose(df.set_index(date)[value], modeladditive, period30)result.plot()plt.suptitle(时间序列分解趋势季节残差, y1.02)plt.show()# 4. 带置信区间的折线图sns.lineplot(datadf, xdate, yvalue)plt.title(带置信区间的时间序列图)plt.show()5. 文本数据分析词频、主题与情感文本数据可视化常用于自然语言处理NLP帮助理解词频分布、主题结构等。123456789101112131415161718192021222324252627fromwordcloudimportWordCloudimportnltkfromnltk.probabilityimportFreqDist# 示例文本textdata science machine learning python visualization analysis exploration# 1. 词云图wordcloudWordCloud(width800, height400).generate(text)plt.imshow(wordcloud, interpolationbilinear)plt.axis(off)plt.title(词云图)plt.show()# 2. 词频分布图wordstext.split()fdistFreqDist(words)fdist.plot(30, cumulativeFalse)# 显示前30个词plt.title(词频分布图)plt.show()# 3. 词频条形图sns.barplot(xlist(fdist.keys())[:10], ylist(fdist.values())[:10])plt.title(前10高频词条形图)plt.xticks(rotation45)plt.tight_layout()plt.show()6. 图表自定义美化与标注好的可视化不仅需要正确表达信息还需要良好的可读性与美观性。12345678910# 示例图表自定义plt.figure(figsize(10,6))# 设置图像尺寸sns.scatterplot(datadf, xx, yy)plt.title(这是一个带自定义样式的散点图, fontsize16)plt.xlabel(X轴标签, fontsize12)plt.ylabel(Y轴标签, fontsize12)plt.xticks(rotation45)# X轴标签旋转45度plt.grid(True, linestyle--, alpha0.5)plt.tight_layout()# 自动调整子图间距plt.show()7. 图表保存与展示123456789# 保存图表到文件plt.savefig(scatter_plot.png, dpi300, bbox_inchestight)print(图表已保存为 scatter_plot.png)# 展示图表plt.show()# 关闭当前图像释放内存plt.close()探索性数据分析流程示意图以下Mermaid流程图展示了典型的EDA可视化流程通过本指南你可以系统掌握Python在探索性数据分析中的可视化工具与技巧。无论是单变量分布探查还是多变量关系挖掘或是时间序列与文本数据的可视化合理运用这些图表工具将极大提升你的数据分析效率与洞察力。建议结合实际项目多加练习形成自己的可视化工作流。

相关文章:

Python数据可视化之从单变量到多变量的方法

Python凭借其强大的可视化库(如Matplotlib、Seaborn)成为进行EDA的首选工具。本文基于一份实用的“Python数据可视化速查表”,系统介绍从单变量到多变量、从时间序列到文本数据的可视化方法,并提供代码示例与扩展解读,…...

Android应用语言独立设置:打破系统语言束缚的终极解决方案

Android应用语言独立设置:打破系统语言束缚的终极解决方案 【免费下载链接】Language-Selector Language Selector let users select individual app languages (Android 13) 项目地址: https://gitcode.com/gh_mirrors/la/Language-Selector 你是否曾在多语…...

“交织现实与虚拟:CCP-RIE在AR/VR工业动画中的创新展现“

在半导体制造领域,电容耦合等离子体反应离子刻蚀(CCP-RIE)作为一种关键的刻蚀技术,正继续推动微电子器件和纳米技术的发展。而随着AR/VR技术的进步,3D动画开始在工业应用中体现出强大的优势。本文将探讨CCP-RIE技术的细节及其与3D动画相结合在…...

华恒智信助力航空航天人才引进行业完成高学历人才薪酬结构优化

华恒智信助力航空航天人才引进行业完成高学历人才薪酬结构优化航空航天行业对高素质人才的需求持续攀升。行业数据显示,二十万以上薪资的岗位占比已超过30%,高端技术岗位需求增长率超过12%。然而人才供需的结构性缺口依然显著——核心航空专业人才在行业…...

深度学习基于YOLOv11+pyqt5的农作物识别检测系统 智慧农业CWC数据集 包含蓝草、藜、刺菜、玉米、莎草、棉花、茄属植物、番茄、天鹅绒、生菜、萝卜,11类农作物

智慧农业基于YOLOv11pyqt5的农作物识别检测系统内含CWC数据集 包含蓝草、藜、刺菜、玉米、莎草、棉花、茄属植物、番茄、天鹅绒、生菜、萝卜,11类农作物 也可自行替换模型,使用该界面做其他,实现检测目标自定义完整源码源文件已标注的数据集训…...

Stable-Diffusion-v1-5-archiveWebUI插件开发指南:Python扩展接口与SDK文档

Stable-Diffusion-v1-5-archive WebUI插件开发指南:Python扩展接口与SDK文档 1. 引言:为什么需要开发自己的WebUI插件? 如果你已经用了一段时间的Stable Diffusion v1.5 Archive,可能会发现一个痛点:每次生成图片都要…...

WPF SaveFileDialog高级功能实战:从基础配置到自定义扩展

1. SaveFileDialog基础配置与核心功能 刚接触WPF开发时,我发现SaveFileDialog这个控件就像个智能文件保存助手。它不仅能帮用户选择保存位置,还能处理各种文件操作细节。先来看看最基础的用法,这里我结合自己踩过的坑给大家分享几个实用技巧。…...

Proteus单片机仿真与Qwen3.5-9B-AWQ-4bit联合调试:智能硬件开发新范式

Proteus单片机仿真与Qwen3.5-9B-AWQ-4bit联合调试:智能硬件开发新范式 1. 嵌入式开发的新机遇 传统单片机开发过程中,工程师们常常面临一个困境:硬件调试周期长、问题定位困难、代码优化依赖经验。Proteus作为成熟的电路仿真平台&#xff0…...

Pygame 实战(单机版桌游模拟):(一). 游戏设计与规则解析

1. 为什么选择Pygame开发桌游模拟器 作为一个玩了十几年桌游的老玩家,我一直想把那些经典的桌面游戏搬到电脑上。去年开始接触Pygame后,发现这个框架简直就是为桌游模拟量身定制的。它轻量级、易上手,最重要的是完全免费开源。我用它做过狼人…...

如何快速完成重庆大学毕业论文格式排版?终极LaTeX模板使用指南

如何快速完成重庆大学毕业论文格式排版?终极LaTeX模板使用指南 【免费下载链接】CQUThesis :pencil: 重庆大学毕业论文LaTeX模板---LaTeX Thesis Template for Chongqing University 项目地址: https://gitcode.com/gh_mirrors/cq/CQUThesis 还在为毕业论文格…...

ROFL播放器:英雄联盟回放文件的终极管理工具

ROFL播放器:英雄联盟回放文件的终极管理工具 【免费下载链接】ROFL-Player (No longer supported) One stop shop utility for viewing League of Legends replays! 项目地址: https://gitcode.com/gh_mirrors/ro/ROFL-Player 还在为英雄联盟回放文件无法播放…...

DataGrip高效操作指南(动图演示版)

1. DataGrip入门:从安装到第一个连接 第一次打开DataGrip时可能会被满屏的英文界面吓到,但别担心,这玩意儿用起来比看起来简单多了。我当年从Navicat转过来的时候也适应了两天,现在回头看看简直像从自行车换到了跑车。安装包直接去…...

DCT-Net人像卡通化:SpringBoot后端集成指南

DCT-Net人像卡通化:SpringBoot后端集成指南 1. 引言 你有没有想过给自己的社交头像换个卡通风格?或者为应用用户提供一键生成卡通头像的功能?DCT-Net人像卡通化技术让这变得简单。这个模型能够将普通人像照片转换成各种风格的卡通形象&…...

Notepad--:Mac用户的跨平台文本编辑器终极指南

Notepad--:Mac用户的跨平台文本编辑器终极指南 【免费下载链接】notepad-- 一个支持windows/linux/mac的文本编辑器,目标是做中国人自己的编辑器,来自中国。 项目地址: https://gitcode.com/GitHub_Trending/no/notepad-- 还在为macOS…...

如何在3分钟内解决Windows系统ADB驱动安装难题?终极指南来了![特殊字符]

如何在3分钟内解决Windows系统ADB驱动安装难题?终极指南来了!🚀 【免费下载链接】Latest-adb-fastboot-installer-for-windows A Simple Android Driver installer tool for windows (Always installs the latest version) 项目地址: https…...

DotNetPy:现代.NET 与 Python 互操作 实战指南道

我为什么会发出这个疑问呢?是因为我研究Web开发中的一个问题时,HTTP请求体在 Filter(过滤器)处被读取了之后,在 Controller(控制层)就读不到值了,使用 RequestBody 的时候。 无论是字…...

Java对接腾讯云KMS:FISCO BCOS联盟链私钥托管的完整实战指南

一、引言 在FISCO BCOS联盟链的企业级应用中,私钥安全始终是生产环境绕不开的核心问题。FISCO BCOS作为国产开源联盟链平台,其Java SDK在为区块链应用开发者提供便捷API的同时,也带来了一个关键问题:私钥如何安全存储与使用? 用于交易签名的私钥由业务模块负责安全加载(…...

如何用memtest_vulkan专业检测显卡内存稳定性:新手必读指南

如何用memtest_vulkan专业检测显卡内存稳定性:新手必读指南 【免费下载链接】memtest_vulkan Vulkan compute tool for testing video memory stability 项目地址: https://gitcode.com/gh_mirrors/me/memtest_vulkan 显卡内存稳定性是影响图形性能和系统可靠…...

CompressO终极指南:如何免费压缩95%视频和图片存储空间

CompressO终极指南:如何免费压缩95%视频和图片存储空间 【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mirrors/co/compressO …...

LaTeX新手必看:5个Word用户最常踩的排版坑及LaTeX解决方案

LaTeX新手必看:5个Word用户最常踩的排版坑及LaTeX解决方案 当你第一次从Word切换到LaTeX时,可能会感到既兴奋又困惑。Word的所见即所得(WYSIWYG)界面让我们习惯了通过点击按钮来调整格式,而LaTeX则需要通过代码来控制排…...

fSpy终极指南:5分钟学会免费开源3D相机匹配神器

fSpy终极指南:5分钟学会免费开源3D相机匹配神器 【免费下载链接】fSpy A cross platform app for quick and easy still image camera matching 项目地址: https://gitcode.com/gh_mirrors/fs/fSpy 在3D建模、建筑可视化和影视特效领域,如何将2D照…...

别再只测功能了!手把手教你为数据防泄露系统设计一份实战测试用例(附WinPE、虚拟机等16个场景)

数据防泄露实战测试:从高危场景到防御验证的完整指南 当企业核心代码库在深夜被批量下载到某个境外IP时,安全团队往往要等到审计警报响起才发现问题。更令人不安的是,我们最近对50家科技公司的调研显示,83%的内部数据泄露都发生在…...

PDF Arranger:5分钟掌握开源PDF页面编排工具的核心技巧

PDF Arranger:5分钟掌握开源PDF页面编排工具的核心技巧 【免费下载链接】pdfarranger Small python-gtk application, which helps the user to merge or split PDF documents and rotate, crop and rearrange their pages using an interactive and intuitive grap…...

彻底告别Windows Defender烦恼:开源控制工具让你的电脑真正属于你

彻底告别Windows Defender烦恼:开源控制工具让你的电脑真正属于你 【免费下载链接】defender-control An open-source windows defender manager. Now you can disable windows defender permanently. 项目地址: https://gitcode.com/gh_mirrors/de/defender-con…...

基于深度学习的遥感图像识别 遥感识别数据集 YOLO11旋转图像目标检测 遥感图像旋转目标球场检测系统设计

文章目录YOLO11 遥感图像旋转目标球场检测系统设计摘要二、系统架构与关键技术YOLO11 遥感图像旋转目标球场检测系统设计 摘要 随着遥感技术的发展,利用高分辨率卫星或无人机获取的图像进行地物识别和分类变得越来越重要。特别地,对于体育设施如足球场…...

AI 上线前的验收清单,你可能一条都没做

点击上方 前端Q,关注公众号回复加群,加入前端Q技术交流群上一篇讲了 Eval——怎么判断你的 AI 是变好了还是变差了。但 Eval 告诉你的是"好不好",不是"能不能放出去"。 能放出去,是一个工程问题,不…...

常见问题划重点|Google Play Games Level Up 计划

Google Play Games Level Up 计划旨在发掘并奖励玩家体验出色的游戏,提供各种强大的工具和推广资源来助力您的游戏业务蓬勃发展。我们将为您推出有关 Level Up 计划的系列精彩内容,欢迎您关注 #Level Up 计划内容合集。Google Play 始终致力于挖掘那些能…...

终极网页转Markdown工具:MarkDownload高效内容提取全攻略

终极网页转Markdown工具:MarkDownload高效内容提取全攻略 【免费下载链接】markdownload A Firefox and Google Chrome extension to clip websites and download them into a readable markdown file. 项目地址: https://gitcode.com/gh_mirrors/ma/markdownload…...

从原理到代码:深入理解STM32的SDIO时钟分频与FatFS性能优化

从原理到代码:深入理解STM32的SDIO时钟分频与FatFS性能优化 在嵌入式开发中,SD卡存储方案因其高容量和便携性成为数据记录的首选。但许多开发者在使用STM32的SDIO接口时,常遇到读写速度不稳定、初始化失败等问题。这背后往往隐藏着对SDIO时钟…...

VLM位置编码的‘三驾马车’:深入解读Interleaved MRoPE背后的位置一致性、频率利用与文本先验保留

VLM位置编码的‘三驾马车’:深入解读Interleaved MRoPE背后的位置一致性、频率利用与文本先验保留 当视觉语言模型(VLM)试图理解一张包含"左上角有只猫,右下角有只狗"的图片时,它如何确保不会将猫和狗的位置…...