图解未来:数据可视化引领智慧决策时代
图表和数据可视化在数据分析中的关键作用
引言:
在现代数据科学中,数据可视化扮演着至关重要的角色。通过图表和可视化工具,我们能够更直观、更有效地理解数据的分布、趋势和关联性。本文将深入讨论三个主要的数据可视化工具:matplotlib、seaborn、plotly,它们分别代表了基础的绘图库、更高级的统计图表工具以及交互式图表的创造者。
文章目录
- 图表和数据可视化在数据分析中的关键作用
- Matplotlib:经典而灵活
- 1. **介绍:**
- 2. **基础绘图:**
- 3. **子图和布局:**
- 4. **3D绘图:**
- 5. **应用示例:**
- 6. **自定义样式:**
- 7. **结语:**
- Seaborn:统计数据的艺术
- 1. **介绍:**
- 2. **美观的默认设置:**
- 3. **强化的绘图功能:**
- 4. **使用示例:**
- 5. **结语:**
- Plotly:交互式的未来
- 1. **介绍:**
- 2. **交互式图表:**
- 3. **多种图表类型:**
- 4. **Web集成和Dash框架:**
- 5. **结语:**
Matplotlib:经典而灵活
1. 介绍:
Matplotlib是Python中最经典、最灵活的绘图库之一,被广泛用于数据可视化。其设计理念是提供丰富的绘图选项,使用户能够创建高质量、定制化的静态图表。
2. 基础绘图:
Matplotlib支持多种基础绘图,例如线图、散点图、柱状图等。通过简单的API,用户可以轻松自定义图表的各个元素,包括颜色、线型、标签等。
import matplotlib.pyplot as plt# 创建简单的折线图
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]plt.plot(x, y, label='折线图')
plt.scatter(x, y, color='red', label='散点图')
plt.xlabel('X轴标签')
plt.ylabel('Y轴标签')
plt.title('Matplotlib示例')
plt.legend()plt.show()
3. 子图和布局:
Matplotlib允许用户创建包含多个子图的复杂布局,通过subplots函数可以轻松实现。这使得用户能够在一个图中展示多个相关的数据集。
import matplotlib.pyplot as plt# 创建包含两个子图的布局
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(10, 4))# 子图1:线图
axes[0].plot([1, 2, 3, 4, 5], [2, 4, 6, 8, 10])
axes[0].set_title('线图')# 子图2:柱状图
axes[1].bar(['A', 'B', 'C', 'D', 'E'], [3, 7, 2, 5, 8], color='orange')
axes[1].set_title('柱状图')plt.show()
4. 3D绘图:
Matplotlib支持3D绘图,可以呈现立体数据。通过mplot3d工具集,用户可以创建3D散点图、曲面图等。
import matplotlib.pyplot as plt
from mpl_toolkits import mplot3d# 创建3D散点图
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
z = [3, 5, 7, 9, 11]ax.scatter(x, y, z, c='r', marker='o')ax.set_xlabel('X轴')
ax.set_ylabel('Y轴')
ax.set_zlabel('Z轴')plt.show()
5. 应用示例:
除了基本的线图和散点图,Matplotlib可以用于创建直方图、饼图、雷达图等多种图表,满足不同数据呈现需求。
import matplotlib.pyplot as plt# 创建饼图
labels = ['A', 'B', 'C', 'D']
sizes = [15, 30, 45, 10]
explode = (0, 0.1, 0, 0)plt.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%', startangle=140)
plt.axis('equal') # 保持圆形plt.title('简单饼图')
plt.show()
6. 自定义样式:
Matplotlib允许用户自定义图表的样式,通过设置不同的样式表,用户可以轻松改变图表的外观。
import matplotlib.pyplot as plt
import matplotlib.style as style# 使用ggplot样式
style.use('ggplot')x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]plt.plot(x, y)
plt.xlabel('X轴标签')
plt.ylabel('Y轴标签')
plt.title('自定义样式的折线图')
plt.show()
7. 结语:
Matplotlib以其经典和灵活的特性,提供了丰富的绘图选项,适用于多种场景。通过掌握Matplotlib的基础和进阶功能,用户可以创建出令人印象深刻的静态图表。在数据可视化的旅程中,Matplotlib为用户提供了坚实的基础。
Seaborn:统计数据的艺术
1. 介绍:
Seaborn是建立在Matplotlib之上的高级数据可视化库,专注于统计数据的呈现和解释。设计时考虑到与Pandas数据框架的兼容性,使得绘图变得更加简洁和高效。Seaborn的独特之处在于其美观的默认设置和对统计关系的强调。
2. 美观的默认设置:
Seaborn通过预定义的颜色主题和绘图样式,使得生成的图表在外观上更具吸引力。用户可以通过set_theme()函数轻松切换预设的主题,例如darkgrid、whitegrid等。
import seaborn as sns# 设置为白色网格主题
sns.set_theme(style="whitegrid")# 绘制带有线性回归拟合线的散点图
sns.regplot(x='total_bill', y='tip', data=tips)
3. 强化的绘图功能:
-
散点图和线性回归拟合: 使用
regplot函数,Seaborn能够轻松绘制散点图,并自动生成与数据相关的线性回归拟合线。这有助于直观地显示变量之间的关系。import seaborn as sns import pandas as pd# 创建DataFrame data = {'total_bill': [16.99, 10.34, 21.01, 23.68, 24.59],'tip': [1.01, 1.66, 3.50, 3.31, 3.61]} tips = pd.DataFrame(data)# 绘制带有线性回归拟合线的散点图 sns.regplot(x='total_bill', y='tip', data=tips) -
箱线图:
boxplot函数可以用于生成箱线图,展示数据的分布情况,包括中位数、上下四分位数以及异常值。import seaborn as sns import pandas as pd# 创建DataFrame data = {'day': ['Thu', 'Fri', 'Sat', 'Sun', 'Sun'],'total_bill': [16.99, 10.34, 21.01, 23.68, 24.59]} tips = pd.DataFrame(data)# 绘制箱线图 sns.boxplot(x='day', y='total_bill', data=tips) -
热力图:
heatmap函数用于绘制矩阵数据的热力图,通过颜色的深浅反映数据的大小,适用于展示相关性矩阵等信息。import seaborn as sns import numpy as np# 创建相关性矩阵 corr_matrix = np.corrcoef(np.random.randn(5, 5))# 绘制热力图 sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')
4. 使用示例:
-
绘制多个子图: Seaborn支持在同一画布上绘制多个子图,通过
FacetGrid类和map函数,用户可以根据数据的某个特征拆分图表。import seaborn as sns import pandas as pd# 创建DataFrame data = {'day': ['Thu', 'Fri', 'Sat', 'Sun', 'Sun'],'total_bill': [16.99, 10.34, 21.01, 23.68, 24.59]} tips = pd.DataFrame(data)# 创建FacetGrid对象,拆分图表 g = sns.FacetGrid(tips, col='day', height=4) g.map(sns.histplot, 'total_bill') -
绘制分布图:
distplot函数用于绘制单变量的分布图,包括直方图和核密度估计。import seaborn as sns import pandas as pd# 创建DataFrame data = {'total_bill': [16.99, 10.34, 21.01, 23.68, 24.59]} tips = pd.DataFrame(data)# 绘制分布图 sns.displot(tips['total_bill'], kde=True)
5. 结语:
- Seaborn通过其美观的默认设置和对统计关系的强调,为用户提供了更高层次的数据可视化工具。从散点图到热力图,Seaborn提供了丰富的图表类型,使得数据科学家能够更加轻松地从数据中提取信息。其兼容性和易用性使其成为数据分析中的得力助手。
Plotly:交互式的未来
1. 介绍:
Plotly是一款先进的交互式图表库,旨在提供丰富的数据可视化体验。该库支持静态和动态图表,能够在Web应用程序中实现高度交互性。
2. 交互式图表:
Plotly的主要特点之一是其卓越的交互性。用户可以通过鼠标悬停、缩放、平移等操作与图表进行实时互动,更深入地探索数据的细节。
import plotly.express as px
import pandas as pd# 创建DataFrame
data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 6, 8, 10]}
df = pd.DataFrame(data)# 绘制交互式折线图
fig = px.line(df, x='x', y='y', title='交互式折线图')
fig.show()
3. 多种图表类型:
-
动态图表: Plotly支持创建动态图表,通过添加滑块、按钮等元素,用户能够动态改变图表中显示的数据,适用于展示时间序列或其他动态变化的信息。
import plotly.express as px import pandas as pd# 创建DataFrame data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 6, 8, 10], 'z': [5, 3, 9, 7, 1]} df = pd.DataFrame(data)# 绘制动态散点图 fig = px.scatter_3d(df, x='x', y='y', z='z', animation_frame=df.index, title='动态散点图') fig.show() -
地理图: Plotly支持创建交互式的地理图,通过
scatter_geo等函数,用户可以在地图上展示数据分布。import plotly.express as px import pandas as pd# 创建DataFrame data = {'Country': ['China', 'USA', 'India', 'Brazil', 'Russia'],'Population': [1444216107, 332915073, 1393409038, 213993437, 145912025]} df = pd.DataFrame(data)# 绘制地理图 fig = px.scatter_geo(df, locations='Country', locationmode='country names', size='Population', title='世界人口分布') fig.show() -
3D图表: Plotly可以创建引人入胜的3D图表,例如3D散点图、3D曲面图等,呈现更加生动的数据视图。
import plotly.express as px import pandas as pd# 创建DataFrame data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 6, 8, 10], 'z': [5, 3, 9, 7, 1]} df = pd.DataFrame(data)# 绘制3D散点图 fig = px.scatter_3d(df, x='x', y='y', z='z', title='3D散点图') fig.show()
4. Web集成和Dash框架:
-
Web嵌入: Plotly图表可以轻松地嵌入到Web应用程序中,通过HTML标签或嵌入到Dash应用程序中,用户可以将交互式图表集成到自己的Web页面中。
import plotly.express as px# 创建DataFrame data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 6, 8, 10]} df = pd.DataFrame(data)# 绘制交互式折线图 fig = px.line(df, x='x', y='y', title='交互式折线图')# 嵌入到HTML页面 fig.write_html("interactive_plot.html") -
Dash框架: Plotly提供的Dash框架允许用户构建交互式的数据仪表板。通过Dash,用户可以将多个Plotly图表组合成一个动态的数据展示界面。
import dash import dash_core_components as dcc import dash_html_components as html# 创建Dash应用 app = dash.Dash(__name__)# 定义布局 app.layout = html.Div(children=[html.H1(children='Plotly Dash示例'),dcc.Graph(id='example-graph',figure=fig # 使用之前创建的Plotly图表) ])if __name__ == '__main__':app.run_server(debug=True)
5. 结语:
- Plotly作为一种交互式的未来,为用户提供了丰富多样的数据可视化工具。无论是静态图表、动态图表还是嵌入到Web应用程序中,Plotly都展现了其强大的灵活性和可扩展性。在大数据、动态数据展示和Web应用中,Plotly为用户提供了先进的数据可视化解决方案。
致谢:
我们感谢matplotlib、seaborn和plotly的开发团队,为数据科学家提供了强大的工具,使数据可视化变得更加轻松高效。
参考文献:
matplotlib官方文档:https://matplotlib.org/stable/contents.htmlseaborn官方文档:https://seaborn.pydata.org/plotly官方文档:https://plotly.com/python/
相关文章:
图解未来:数据可视化引领智慧决策时代
图表和数据可视化在数据分析中的关键作用 引言: 在现代数据科学中,数据可视化扮演着至关重要的角色。通过图表和可视化工具,我们能够更直观、更有效地理解数据的分布、趋势和关联性。本文将深入讨论三个主要的数据可视化工具:mat…...
例解什么是Python装饰器
Python中的装饰器一直是一个比较难理解的概念,我自己理解的就是用一个函数去修改另一个函数,主要是为另一个函数添加计时等功能,而且不用改变另一个函数,这样就大大减少了另一个函数的维护成本。 这个装饰器,英文名就…...
EtherCAT从站EEPROM组成信息详解(3):字16-63邮箱、EEPROM信息
0 工具准备 1.EtherCAT从站EEPROM数据(本文使用DE3E-556步进电机驱动器)1 字10-63邮箱、EEPROM信息 1.1 字10-63组成规范 字10-63虽然包含的空间区域很大,但实际上仅包含引导状态下邮箱配置、标准邮箱配置、EEPROM大小、执行的SII标准版本…...
【文件读取/包含】任意文件读取漏洞 afr_1
1.1漏洞描述 漏洞名称任意文件读取漏洞 afr_1漏洞类型文件读取漏洞等级⭐漏洞环境docker攻击方式 1.2漏洞等级 高危 1.3影响版本 暂无 1.4漏洞复现 1.4.1.基础环境 靶场docker工具BurpSuite 1.4.2.靶场搭建 1.创建docker-compose.yml文件 version: 3.2 services: web: …...
(八)五种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
一、五种算法(DBO、LO、SWO、COA、GRO)简介 1、蜣螂优化算法DBO 蜣螂优化算法(Dung beetle optimizer,DBO)由Jiankai Xue和Bo Shen于2022年提出,该算法主要受蜣螂的滚球、跳舞、觅食、偷窃和繁殖行为…...
通义灵码,阿里巴巴的编程辅助工具
一、官网 通义灵码_智能编码助手_AI编程_人工智能-阿里云 二、安装VSCode 如何下载安装VSCode 三、VSCode安装通义灵码 1.访问扩展详情界面 方式1 访问通义灵码安装教程页面 方法2 访问VSCode市场中的TONGYI Lingma 点击 Install 按钮访问扩展详情界面 2.打开VSCode …...
Uniapp导出的iOS应用上架详解
目录 Uniapp导出的iOS应用上架详解 摘要 引言 苹果审核标准 苹果调试 注意事项和建议 总结 摘要 本文将探讨Uniapp导出的iOS应用能否成功上架的问题。我们将从苹果审核标准、性能影响、调试流程等多个方面进行深入分析,以及向开发者提供相关注意事项和建议。…...
计算机视觉基础(7)——相机基础
前言 从这一节开始,我们来学习几何视觉。中层视觉包括相机模型、单目几何视觉、对极几何视觉和多目立体视觉等。在学习几何视觉最开始,我们先来学习一下相机模型,了解相机的基本原理,了解相机如何记录影像。 一、数字相机 1.1 基…...
解决Github上的README无法显示图片
首先感谢博主的思路:思路 最近写了点东西提交到git 发现本地能查看md里的图片用的相对路径,提交到github就看不见,并且发现不只是我自己的仓库看不见,其他人的我也看不见。那就有问题了 解决:正常使用相对路径&…...
qnx 工程目录创建工具 addvariant
文章目录 前言一、addvariant 是什么二、addvariant 使用实例1. variant names 参数说明2. 创建一个可执行文件工程3. 创建一个动态库工程 总结参考资料 前言 本文主要介绍如何在qnx 开发环境中创建工程目录及其相关的配置文件(common.mk, Makefile 文件等) 软件版本ÿ…...
计算机视觉+深度学习+机器学习+opencv+目标检测跟踪+一站式学习(代码+视频+PPT)
第1章:视觉项目资料介绍与学习指南 相关知识: 介绍计算机视觉、OpenCV库,以及课程的整体结构。学习概要: 了解课程的目标和学习路径,为后续章节做好准备。重要性: 提供学生对整个课程的整体认识࿰…...
【AI视野·今日CV 计算机视觉论文速览 第278期】Mon, 30 Oct 2023
AI视野今日CS.CV 计算机视觉论文速览 Mon, 30 Oct 2023 Totally 50 papers 👉上期速览✈更多精彩请移步主页 Daily Computer Vision Papers Image Clustering Conditioned on Text Criteria Authors Sehyun Kwon, Jaeseung Park, Minkyu Kim, Jaewoong Cho, Ernest…...
深度学习:多模态与跨模态
1 定义 1.1 多模态学习 多模态学习(Multimodal Learning)是一种利用来自多种不同感官或交互方式的数据进行学习的方法。在这个语境中,“模态”指的是不同类型的数据输入,如文本、图像、声音、视频等。多模态学习的关键在于整合和…...
大数据Hadoop之——部署hadoop+hive+Mysql环境(Linux)
目录 一、JDK的安装 1、安装jdk 2、配置Java环境变量 3、加载环境变量 4、进行校验 二、hadoop的集群搭建 1、hadoop的下载安装 2、配置文件设置 2.1. 配置 hadoop-env.sh 2.2. 配置 core-site.xml 2.3. 配置hdfs-site.xml 2.4. 配置 yarn-site.xml 2.5. 配置 ma…...
Python与ArcGIS系列(四)在地图文档中加入图层
目录 0 简述1 将图层添加到地图文档中2 将图层插入到地图文档0 简述 本篇介绍如何利用arcpy实现将图层添加到地图文档中,以及将图层插入到地图文档指定的位置。 1 将图层添加到地图文档中 arcpy的mapping模块提供的AddLayer()函数可以实现将图层添加到地图文档中。功能本质上…...
QT 程序异常崩溃
出现以下问题,大概率是你在修改代码时,在pro或者pri中增加了一些不存在的头文件或者cpp,使用BeyondCmp仔细对比,分享,希望帮助到你...
Ubuntu20.04 通过nmcli命令查看网卡状态为unmanaged
问题描述: 通过下述指令查看网卡状态为 "unmanaged" nmcli dev status 解决方法: cd /usr/lib/NetworkManager/conf.d/ sudo mv 10-globally-managed-devices.conf 10-globally-managed-devices.conf.bak sudo cp 10-globally-managed-devic…...
【R Error系列】r - fatal error : RcppEigen. h:没有这样的文件或目录
在头文件那要有 // [[Rcpp::depends(RcppEigen)]] 即: #include <Rcpp.h> #include <RcppEigen.h> using namespace Rcpp; using namespace Eigen;// [[Rcpp::depends(RcppEigen)]] // [[Rcpp::export]] 参考: r - fatal error: RcppEi…...
如何在聊天记录中实时查找大量的微信群二维码
10-5 如果你有需要从微信里收到的大量信息中实时找到别人发到群里的二维码,那本文非常适合你阅读,因为本文的教程,可以让你在海量的微信消息中,实时地把二维码自动挑出来,并且帮你分类保存。 如果你是做网推的&#…...
03-CSS基础选择器
3.1 CSS基础认知🍎 3.1.1 👁️🗨️CSS概念 CSS:层叠样式表(Cascading style sheets),为网页标签增加样式表现的 语法格式: 选择器{<!-- 属性设置 -->属性名:属性值; <!--每一个…...
谷歌浏览器插件
项目中有时候会用到插件 sync-cookie-extension1.0.0:开发环境同步测试 cookie 至 localhost,便于本地请求服务携带 cookie 参考地址:https://juejin.cn/post/7139354571712757767 里面有源码下载下来,加在到扩展即可使用FeHelp…...
C++_核心编程_多态案例二-制作饮品
#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为:煮水 - 冲泡 - 倒入杯中 - 加入辅料 利用多态技术实现本案例,提供抽象制作饮品基类,提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...
Lombok 的 @Data 注解失效,未生成 getter/setter 方法引发的HTTP 406 错误
HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误,它们的含义、原因和解决方法都有显著区别。以下是详细对比: 1. HTTP 406 (Not Acceptable) 含义: 客户端请求的内容类型与服务器支持的内容类型不匹…...
论文解读:交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(二)
HoST框架核心实现方法详解 - 论文深度解读(第二部分) 《Learning Humanoid Standing-up Control across Diverse Postures》 系列文章: 论文深度解读 + 算法与代码分析(二) 作者机构: 上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学 论文主题: 人形机器人…...
在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能
下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能,包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...
基于数字孪生的水厂可视化平台建设:架构与实践
分享大纲: 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年,数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段,基于数字孪生的水厂可视化平台的…...
tree 树组件大数据卡顿问题优化
问题背景 项目中有用到树组件用来做文件目录,但是由于这个树组件的节点越来越多,导致页面在滚动这个树组件的时候浏览器就很容易卡死。这种问题基本上都是因为dom节点太多,导致的浏览器卡顿,这里很明显就需要用到虚拟列表的技术&…...
Pinocchio 库详解及其在足式机器人上的应用
Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库,专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性,并提供了一个通用的框架&…...
GruntJS-前端自动化任务运行器从入门到实战
Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...
R 语言科研绘图第 55 期 --- 网络图-聚类
在发表科研论文的过程中,科研绘图是必不可少的,一张好看的图形会是文章很大的加分项。 为了便于使用,本系列文章介绍的所有绘图都已收录到了 sciRplot 项目中,获取方式: R 语言科研绘图模板 --- sciRplothttps://mp.…...
