数据分析三剑客之Matplotlib
0.Matplotlib绘图和可视化
1.简介
我的前面两篇文章介绍了 Nimpy ,Pandas 。今天来介绍一下Matplotlib。
简单来说,Matplotlib 是 Python 的一个绘图库。它包含了大量的工具,你可以使用这些工具创建各种图形,包括简单的散点图,正弦曲线,甚至是三维图形。Python 科学计算社区经常使用它完成数据可视化的工作。
你可以在他们的网站上了解到更多 Matplotlib 背后的设计思想,但是我强烈建议你先浏览一下他们的图库,体会一下这个库的各种神奇功能。
2.画一个简单的图形
In [1]: import matplotlib.pyplot as pltIn [2]: import numpy as npIn [3]: x = np.linspace(0, 2 * np.pi, 50)In [6]: plt.plot(x, np.sin(x))
Out[6]: [<matplotlib.lines.Line2D at 0x1dcdc98a748>]In [7]: plt.show()
上面的代码将画出一个简单的正弦曲线。np.linspace(0, 2 * np.pi, 50)这段代码将会生成一个包含 50 个元素的数组,这 50 个元素均匀的分布在 [0, 2pi] 的区间上。
plot命令以一种简洁优雅的方式创建了图形。提醒一下,如果没有第一个参数 x,图形的 x 轴坐标将不再是 0 到 2pi,而应该是数组的索引范围。
最后一行代码 plt.show()将图形显示出来,如果没有这行代码图像就不会显示。
运行代码后应该会类似得到下面的图形:
3.在一张图上绘制两个数据集
大多数时候读者可能更想在一张图上绘制多个数据集。用 Matplotlib 也可以轻松实现这一点。
In [15]: x = np.linspace(0, 2 * np.pi, 50)In [16]: plt.plot(x, np.sin(x), x, np.sin(2*x))
Out[16]:
[<matplotlib.lines.Line2D at 0x1dcdb38a080>,<matplotlib.lines.Line2D at 0x1dcdb38a1d0>]In [17]: plt.show()
上面的代码同时绘制了表示函数 sin(x) 和 sin(2x) 的图形。这段代码和前面绘制一个数据集的代码几乎完全相同,只有一点例外,这段代码在调用plt.plot()的时候多传入了一个数据集,并用逗号与第一个数据集分隔开。
最后你会得到类似于下面包含两条曲线的图形:
4.自定义图形的外观
当在同一个图形上展示多个数据集时,通过改变线条的外观来区分不同的数据集变得非常必要。
In [18]: x = np.linspace(0, 2*np.pi, 50)In [19]: plt.plot(x, np.sin(x), 'r-o', x, np.cos(x), 'g--')
Out[19]:
[<matplotlib.lines.Line2D at 0x1dcdb695898>,<matplotlib.lines.Line2D at 0x1dcdb695a20>]In [20]: plt.show()
上述代码展示了两种不同的曲线样式:'r-o' 和 'g--'。字母 'r' 和 'g' 代表线条的颜色,后面的符号代表线和点标记的类型。例如 '-o' 代表包含实心点标记的实线,'--' 代表虚线。其他的参数需要读者自己去尝试,这也是学习 Matplotlib 最好的方式。
颜色: 蓝色 - 'b' 绿色 - 'g' 红色 - 'r' 青色 - 'c' 品红 - 'm' 黄色 - 'y' 黑色 - 'k'('b'代表蓝色,所以这里用黑色的最后一个字母) 白色 - 'w' 线: 直线 - '-' 虚线 - '--' 点线 - ':' 点划线 - '-.' 常用点标记 点 - '.' 像素 - ',' 圆 - 'o' 方形 - 's' 三角形 - '^'
更多点标记样式点击这里
最后你会得到类似下面的图形:
5.使用子图
使用子图可以在一个窗口绘制多张图。
In [21]: x = np.linspace(0, 2*np.pi, 50)In [22]: plt.subplot(2, 1, 1) # (行,列,活跃区)
Out[22]: <matplotlib.axes._subplots.AxesSubplot at 0x1dcdb6ba978>In [23]: plt.plot(x, np.sin(x), 'r')
Out[23]: [<matplotlib.lines.Line2D at 0x1dcdb7316d8>]In [24]: plt.subplot(2, 1, 2)
Out[24]: <matplotlib.axes._subplots.AxesSubplot at 0x1dcdb731ba8>In [25]: plt.plot(x, np.cos(x), 'g')
Out[25]: [<matplotlib.lines.Line2D at 0x1dcdb77bfd0>]In [26]: plt.show()
使用子图只需要一个额外的步骤,就可以像前面的例子一样绘制数据集。即在调用 plot() 函数之前需要先调用 subplot() 函数。该函数的第一个参数代表子图的总行数,第二个参数代表子图的总列数,第三个参数代表活跃区域。
活跃区域代表当前子图所在绘图区域,绘图区域是按从左至右,从上至下的顺序编号。例如在 4×4 的方格上,活跃区域 6 在方格上的坐标为 (2, 2)。
最终你会得到类似下面的图形:
散点图是一堆离散点的集合。用 Matplotlib 画散点图也同样非常简单。
In [27]: x = np.linspace(0, 2*np.pi, 50)In [28]: y = np.sin(x)In [29]: plt.scatter(x, y)
Out[29]: <matplotlib.collections.PathCollection at 0x1dcddb706a0>In [30]: plt.show()
正如上面代码所示,你只需要调用 scatter() 函数并传入两个分别代表 x 坐标和 y 坐标的数组。注意,我们通过 plot 命令并将线的样式设置为 'bo' 也可以实现同样的效果。
最后你会得到类似下面的无线图形:
7.彩色映射散点图
另一种你可能用到的图形是彩色映射散点图。这里我们会根据数据的大小给每个点赋予不同的颜色和大小,并在图中添加一个颜色栏。
In [31]: x = np.random.rand(1000)In [32]: y = np.random.rand(1000)In [33]: size = np.random.rand(1000) * 50In [34]: colour = np.random.rand(1000)In [35]: plt.scatter(x, y, size, colour)
Out[35]: <matplotlib.collections.PathCollection at 0x1dcdde984e0>In [36]: plt.colorbar()
Out[36]: <matplotlib.colorbar.Colorbar at 0x1dcddece0b8>In [37]: plt.show()
上面的代码大量的用到了 np.random.rand(1000),原因是我们绘图的数据都是随机产生的。
同前面一样我们用到了 scatter() 函数,但是这次我们传入了另外的两个参数,分别为所绘点的大小和颜色。通过这种方式使得图上点的大小和颜色根据数据的大小产生变化。
然后我们用 colorbar() 函数添加了一个颜色栏。
最后你会得到类似于下面的彩色散点图:
8.直方图
直方图是另一种常见的图形,也可以通过几行代码创建出来。
In [38]: x = np.random.randn(1000)In [39]: plt.hist(x, 50)
Out[39]:
(array([ 2., 0., 0., 1., 2., 2., 1., 0., 1., 1., 9., 6., 11.,16., 20., 18., 23., 26., 34., 25., 42., 31., 52., 40., 38., 56.,35., 49., 49., 41., 44., 46., 46., 31., 30., 32., 26., 24., 24.,16., 8., 5., 12., 4., 4., 5., 2., 7., 2., 1.]),array([-3.32384545, -3.20164134, -3.07943724, -2.95723314, -2.83502904,-2.71282494, -2.59062084, -2.46841674, -2.34621264, -2.22400854,-2.10180443, -1.97960033, -1.85739623, -1.73519213, -1.61298803,-1.49078393, -1.36857983, -1.24637573, -1.12417163, -1.00196752,-0.87976342, -0.75755932, -0.63535522, -0.51315112, -0.39094702,-0.26874292, -0.14653882, -0.02433471, 0.09786939, 0.22007349,0.34227759, 0.46448169, 0.58668579, 0.70888989, 0.83109399,0.95329809, 1.0755022 , 1.1977063 , 1.3199104 , 1.4421145 ,1.5643186 , 1.6865227 , 1.8087268 , 1.9309309 , 2.05313501,2.17533911, 2.29754321, 2.41974731, 2.54195141, 2.66415551,2.78635961]),<a list of 50 Patch objects>)In [40]: plt.show()
直方图是 Matplotlib 中最简单的图形之一。你只需要给 hist() 函数传入一个包含数据的数组。第二个参数代表数据容器的个数。数据容器代表不同的值的间隔,并用来包含我们的数据。数据容器越多,图形上的数据条就越多。
最终你会得到类似下面的直方图:
9.标题,标签和图例
当需要快速创建图形时,你可能不需要为图形添加标签。但是当构建需要展示的图形时,你就需要添加标题,标签和图例。
In [41]: x = np.linspace(0, 2*np.pi, 50)In [42]: plt.plot(x, np.sin(x), 'r-x', label='Sin(x)')
Out[42]: [<matplotlib.lines.Line2D at 0x1dcde55db00>]In [43]: plt.plot(x, np.cos(x), 'g-^', label='Cos(x)')
Out[43]: [<matplotlib.lines.Line2D at 0x1dcde282ac8>]In [44]: plt.legend() # 展示图例
Out[44]: <matplotlib.legend.Legend at 0x1dcde282dd8>In [45]: plt.xlabel('Rads') # 给x轴添加标签
Out[45]: Text(0.5,0,'Rads')In [46]: plt.ylabel('Amplitude') # 给y轴添加标签
Out[46]: Text(0,0.5,'Amplitude')In [47]: plt.title('Sin and Cos Waves') # 添加图形标题
Out[47]: Text(0.5,1,'Sin and Cos Waves')In [48]: plt.show()
为了给图形添加图例,我们需要在 plot() 函数中添加命名参数 'label' 并赋予该参数相应的标签。然后调用 legend() 函数就会在我们的图形中添加图例。
接下来我们只需要调用函数 title(),xlabel() 和 ylabel() 就可以为图形添加标题和标签。
你会得到类似于下面这张拥有标题、标签和图例的图形:
10.饼图
饼图阴影、分裂等属性设置:
# labels参数设置每一块的标签;# labeldistance参数设置标签距离圆心的距离(比例值)# autopct参数设置比例值小数保留位(%.3f%%);# pctdistance参数设置比例值文字距离圆心的距离# explode参数设置每一块顶点距圆心的长度(比例值,列表);# colors参数设置每一块的颜色(列表);# shadow参数为布尔值,设置是否绘制阴影# startangle参数设置饼图起始角度
饼图适合展示各部分占总体的比例,条形图适合比较各部分的大小
In [51]: x = [11, 22, 33, 44]In [52]: plt.pie(x, labels=['a', 'b', 'c', 'd'])
Out[52]:
([<matplotlib.patches.Wedge at 0x1dcde8894a8>,<matplotlib.patches.Wedge at 0x1dcde8899b0>,<matplotlib.patches.Wedge at 0x1dcde889e80>,<matplotlib.patches.Wedge at 0x1dcde891390>],[Text(1.04616,0.339919,'a'),Text(0.339919,1.04616,'b'),Text(-1.04616,0.339919,'c'),Text(0.339919,-1.04616,'d')])In [53]: plt.show()
最终你会得到类似下面的饼图:
相关文章:

数据分析三剑客之Matplotlib
0.Matplotlib绘图和可视化 1.简介 我的前面两篇文章介绍了 Nimpy ,Pandas 。今天来介绍一下Matplotlib。 简单来说,Matplotlib 是 Python 的一个绘图库。它包含了大量的工具,你可以使用这些工具创建各种图形,包括简单的散点图&…...

Python Opencv实践 - LBP特征提取
参考资料: python skimage库LBP提取特征local_binary_pattern参数解释_local_binary_pattern函数_friedrichor的博客-CSDN博客 LBP特征笔记_亦枫Leonlew的博客-CSDN博客 import cv2 as cv import numpy as np import matplotlib.pyplot as plt from skimage.feat…...

Docker 搭建Redis Cluster 集群
环境: centos7 redis:7.0.5 三主三从,六个节点 一、下载redis镜像 docker pull redis:7.0.5 二、创建虚拟网卡 docker network create redis-cluster# 查看创建的Docker网卡 docker network ls 网卡类型为bridge桥接类型 三、准备redis配置文件 redi…...

解决谷歌浏览器会http网站自动变成https的问题
不知道是不是升级的缘故,最近打开公司一个http网站,会自动跳去https,用了网上说的这个方案,如下: 但发现还不行,这时我尝试用点击地址栏左边那锁的那个图标,图如下: 然后点击网站设…...

go小知识2
Golang开发新手常犯的50个错误_gezhonglei2007的博客-CSDN博客 一些题目整理,附带大佬的解释 1.go中哪些值不能寻址& 常量(const常量,字面值3.14,字符串“xxx”,函数或方法, map的val值) golang中接…...

zabbix监控H3C设备
背景 常见的服务和主机已经使用Prometheus进行监控了,但是网络设备还未配置监控。使用基于SNMP对网络设备进行监控。 设备概览 主要类型为H3C的路由器和交换机。 H3CS5560交换机 路由器MER5200 er8300 一台群晖的NAS服务 步骤 配置网络设备开启telnet远程&…...

国产化改造之Mysql迁移方案:Mysql Galera Cluster
一、背景 因某业务系统OS国产化改造,现需将生成环境Mysql 主从迁移到新部署的BCLinux OS主机上;如果保障业务不断,平滑迁移并成功割接将是本次方案的重要方向,现场环境涉及需迁移数据780G左右,目标主机OS版本ÿ…...

bootstrap表单类型
1.基本格式 <form><div class"form-group"><label>电子邮件</label><input type"email" class"form-control" placeholder"请输入你的电子邮件" /></div><div class"form-group"&g…...

第一章 SQL Server 数据库部署
个人简介:云计算网络运维专业人员,了解运维知识,掌握TCP/IP协议,每天分享网络运维知识与技能。座右铭:海不辞水,故能成其大;山不辞石,故能成其高。 个人主页:小李会科技的…...

赛事个人团体报名分组成绩查询证书h5小程序开源版开发
赛事个人团体报名分组成绩查询证书h5小程序开源版开发 以下是赛事个人团体报名分组成绩查询证书H5小程序的功能列表: 用户注册和登录:用户可以通过注册和登录功能创建账号或使用已有账号登录小程序。 赛事信息浏览:用户可以浏览小程序中提供…...

【大数据环境配置】01-安装VMware虚拟机
一、VMware的安装 1: 运行“VMware_workstation_full_12.5.2.exe”(或者其他版本) 2:引导页面,直接点击下一步 3: 同意许可,然后继续点击下一步 4: 选择VMware安装位置࿰…...
什么是C语言中的命名空间?
C语言本身并没有像某些其他编程语言(如C)中的显式命名空间(namespace)的概念,但C语言中有一些机制和约定,允许开发人员组织和管理变量、函数和其他标识符的名称,以避免名称冲突和提高代码可维护…...
Java语言特点 8种基本数据类型 标识符等练习题 插入/希尔/选择/堆/冒泡/快速/归并/计数排序
(单选题)java 的字符类型采用的是 Unicode编码方案,每个 Unicode码占用( )个比特位。 题目内容: A .8 B .16 C .32 D .64 (单选题)下列说法不正确的是( ࿰…...
建站系列(七)--- 常用前后端框架
目录 相关系列文章前言一、何为框架?二、为什么使用框架三、常用框架(一)Bootstrap(二)Layui(三)JQuery(四)Vue.js(四)ThinkPHP(五&am…...

Jmx协议远程连接java服务器
注意:本例里,我用的是jdk17 通常用jdk自带的jconsole,或者想要功能强大点的使用visualVM 需要java服务器在启动的时候加上以下参数 -Dcom.sun.management.jmxremote 启用jxm远程连接-Djava.rmi.server.hostname10.1.3.99 指定jxm监听地址&…...

consul 概念 键值对操作命令
传统配置文件的弊端 静态化配置,例如env文件配置文件无法区分环境配置文件过于分散历史版本无法查看 配置中心如何解决的呢?配置中心的思路是把项目中的配置参数全部放在一个集中的地方来管理,并提供一套标准的接口,当各个服务需要获取配置…...

R拒绝访问的解决方案
Win11系统 安装rms的时候报错: Error in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck vI[[j]]) : namespace Matrix 1.5-4.1 is already loaded, but > 1.6.0 is required## 安装rms的时候报错,显示Matrix的版本太低…...

SeaArt.ai: 海艺AI绘画艺术图片模型创作平台
【产品介绍】 • 名称 SeaArt.ai • 具体描述 SeaArt.ai是一个基于人工智能技术的AI绘画工具,它可以根据你的描述或者关键词来生成符合你想象的图片。你可以选择不同的模式来创建不同类型的图片,比如人物、风景、建筑、神话、自…...

服务器数据恢复-Xen server虚拟机数据恢复案例
服务器数据恢复环境: 一台某品牌服务器通过一张同品牌某型号RAID卡将4块STAT硬盘组建为一组RAID10阵列。上层部署Xen Server虚拟化平台,虚拟机上安装的是Windows Server操作系统,包括系统盘 数据盘两个虚拟机磁盘,作为Web服务器使…...

电工-PN结的工作原理
如果将PN结加正向电压,即P区接正极,N区接负极,如右图所示。由于外加电压的电场方向和PN结内电场方向相反。在外电场的作用下,内电场将会被削弱,使得阻挡层变窄,扩散运动因此增强。这样多数载流子将在外电场…...

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...
在Ubuntu中设置开机自动运行(sudo)指令的指南
在Ubuntu系统中,有时需要在系统启动时自动执行某些命令,特别是需要 sudo权限的指令。为了实现这一功能,可以使用多种方法,包括编写Systemd服务、配置 rc.local文件或使用 cron任务计划。本文将详细介绍这些方法,并提供…...

ElasticSearch搜索引擎之倒排索引及其底层算法
文章目录 一、搜索引擎1、什么是搜索引擎?2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长,文件大。2.其次,树深,IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...

在WSL2的Ubuntu镜像中安装Docker
Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包: for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...
使用Matplotlib创建炫酷的3D散点图:数据可视化的新维度
文章目录 基础实现代码代码解析进阶技巧1. 自定义点的大小和颜色2. 添加图例和样式美化3. 真实数据应用示例实用技巧与注意事项完整示例(带样式)应用场景在数据科学和可视化领域,三维图形能为我们提供更丰富的数据洞察。本文将手把手教你如何使用Python的Matplotlib库创建引…...

七、数据库的完整性
七、数据库的完整性 主要内容 7.1 数据库的完整性概述 7.2 实体完整性 7.3 参照完整性 7.4 用户定义的完整性 7.5 触发器 7.6 SQL Server中数据库完整性的实现 7.7 小结 7.1 数据库的完整性概述 数据库完整性的含义 正确性 指数据的合法性 有效性 指数据是否属于所定…...
4. TypeScript 类型推断与类型组合
一、类型推断 (一) 什么是类型推断 TypeScript 的类型推断会根据变量、函数返回值、对象和数组的赋值和使用方式,自动确定它们的类型。 这一特性减少了显式类型注解的需要,在保持类型安全的同时简化了代码。通过分析上下文和初始值,TypeSc…...

论文阅读笔记——Muffin: Testing Deep Learning Libraries via Neural Architecture Fuzzing
Muffin 论文 现有方法 CRADLE 和 LEMON,依赖模型推理阶段输出进行差分测试,但在训练阶段是不可行的,因为训练阶段直到最后才有固定输出,中间过程是不断变化的。API 库覆盖低,因为各个 API 都是在各种具体场景下使用。…...
十九、【用户管理与权限 - 篇一】后端基础:用户列表与角色模型的初步构建
【用户管理与权限 - 篇一】后端基础:用户列表与角色模型的初步构建 前言准备工作第一部分:回顾 Django 内置的 `User` 模型第二部分:设计并创建 `Role` 和 `UserProfile` 模型第三部分:创建 Serializers第四部分:创建 ViewSets第五部分:注册 API 路由第六部分:后端初步测…...