当前位置: 首页 > news >正文

seaborn库图形进行数据分析(基于tips数据集)

Seaborn 是一个基于 matplotlib 的数据可视化库,可以用来绘制各种统计图表,包括散点图、条形图、折线图、箱线图等。Seaborn 提供了一些用于美化图表的默认样式和颜色主题,使得生成的图表更具有吸引力。下面是一些 Seaborn 库的常用功能和用法。

import seaborn as sns#seaborn图形进行数据分析
df=sns.load_dataset('tips')
df.head()#显示前五行
'''结果:total_bill 	tip 	sex 	smoker 	day 	time 	size
0 	16.99 	  1.01  	Female 	   No 	Sun 	Dinner 	 2
1 	10.34 	  1.66 	    Male 	   No 	Sun 	Dinner 	 3
2 	21.01 	  3.50  	Male 	   No 	Sun 	Dinner 	 3
3 	23.68 	  3.31  	Male 	   No 	Sun 	Dinner 	 2
4 	24.59 	  3.61 	    Female 	   No 	Sun 	Dinner 	 4
'''df
'''结果:total_bill 	tip 	sex 	smoker 	day 	time 	size
0 	   16.99 	1.01  	Female 	No  	Sun 	Dinner 	 2
1 	   10.34 	1.66 	Male 	No  	Sun 	Dinner 	 3
2 	   21.01 	3.50  	Male 	No  	Sun 	Dinner 	 3
3 	   23.68 	3.31  	Male 	No 	    Sun 	Dinner 	 2
4 	   24.59 	3.61 	Female 	No 	    Sun 	Dinner 	 4
... 	... 	... 	... 	... 	... 	... 	...
239 	29.03 	5.92 	Male 	No 	    Sat 	Dinner 	 3
240 	27.18 	2.00 	Female 	Yes 	Sat 	Dinner 	 2
241 	22.67 	2.00 	Male 	Yes 	Sat 	Dinner 	 2
242 	17.82 	1.75 	Male 	No 	    Sat 	Dinner 	 2
243 	18.78 	3.00 	Female 	No 	    Thur 	Dinner 	 2244 rows × 7 columns
'''df.dtypes
'''结果:
total_bill     float64
tip            float64
sex           category
smoker        category
day           category
time          category
size             int64
dtype: object'''

 1、相关性

df.corr()#三个字段的相关性
'''结果:total_bill 	tip 	     size
total_bill 	1.000000 	0.675734 	0.598315
tip 	    0.675734 	1.000000 	0.489299
size 	    0.598315 	0.489299 	1.000000'''
sns.heatmap(df.corr())#用热区图来表示相关性

 

2、变量分析

sns.jointplot(x='tip',y='total_bill',data=df,kind='hex')#单变量分析,kind用什么表示,该图是蜂窝表示

sns.jointplot(x='tip',y='total_bill',data=df,kind='reg')#单变量分析,该图是用回归表示

 

sns.pairplot(df)#匹配图,在同一数据行中,一个变量与另一个变量的值相匹配,最后显示所有变量与所有其它变量的匹配

 

sns.pairplot(df,hue='sex')#多加一个变量

 

 

sns.pairplot(df,hue='smoker')#多加一个变量

三、统计数 

df['smoker'].value_counts()
'''结果:
No     151
Yes     93
Name: smoker, dtype: int64
'''df['sex'].value_counts()
'''结果:
Male      157
Female     87
Name: sex, dtype: int64
'''
sns.countplot(x='sex',data=df)

 

sns.countplot(y='sex',data=df)

 

四、 特征值分布

sns.distplot(df['tip'])#帮助我们检查单特征分布,比例

 

sns.distplot(df['tip'],kde=False,bins=20)#帮助我们检查单特征分布,数量

五、多变量

sns.barplot(x='sex',y='total_bill',data=df)#两变量做x,y轴,柱状图

 

sns.boxplot(x='day',y='total_bill',data=df,palette='rainbow')#盒图,palette调色板

sns.boxplot(data=df,orient='v')#垂直

sns.boxplot(x='day',y='total_bill',hue='smoker',data=df)#盒图,三变量

sns.violinplot(x="total_bill",y="day",data=df,palette="rainbow")#小提琴图,帮助我们从核密度估计和箱型图两方面看到数据发布

sns.violinplot(y="total_bill",x="day",data=df,palette="rainbow")#小提琴图,帮助我们从核密度估计和箱型图两方面看到数据发布

相关文章:

seaborn库图形进行数据分析(基于tips数据集)

Seaborn 是一个基于 matplotlib 的数据可视化库,可以用来绘制各种统计图表,包括散点图、条形图、折线图、箱线图等。Seaborn 提供了一些用于美化图表的默认样式和颜色主题,使得生成的图表更具有吸引力。下面是一些 Seaborn 库的常用功能和用法…...

AC843. n皇后问题--60

我们只需要把蓝色的往上移动就行了 if(!col[i][j]&&!dg[ui]&&!udg[])//1y(i)向下,x(u)向右为正。yxb的by-x一定>0,y-xb的bxy可能>0,这个不考虑,只看-bxy....

Js WebSocket类,收发Json,带心跳,断线重连

如题 心跳:4秒发一次 断线:2秒后自动重连 收发:发送和返回json,处理粘包断包等情况,json字符串最大长度9999 缓存:未连接时,自动缓存100个包,当连接时会自动发出 JS代码 var MyWeb…...

VBA技术资料MF96:单字段多条件高级筛选

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。我的教程一共九套,分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的入门,到…...

电子取证中Chrome各版本解密Cookies、LoginData账号密码、历史记录

文章目录 1.前置知识点2.对于80.X以前版本的解密拿masterkey的几种方法方法一 直接在目标机器运行Mimikatz提取方法二 转储lsass.exe 进程从内存提取masterkey方法三 导出SAM注册表 提取user hash 解密masterkey文件(有点麻烦不太推荐)方法四 已知用户密…...

Axure元件基本介绍进阶

Axure元件基本介绍进阶 1.Axure元件基本介绍1.在 Axure 中,元件是构建原型的基本构成单元,能够帮助设计师快速创建、重复使用和管理设计元素。以下是 Axure 中元件的基本介绍:1.基本元件: 2.基本元件的使用一.【举例说明】积木&am…...

安卓11添加切换以太网动态静态方法

客户要在app中自由切换动态,静态方法,直接把系统jar-api给他搞了半天搞不定,只有在系统里给他实现一个接口,方法如下: Index: packages/apps/Settings/AndroidManifest.xml--- packages/apps/Settings/AndroidManifes…...

初级数据结构(五)——树和二叉树的概念

文中代码源文件已上传&#xff1a;数据结构源码 <-上一篇 初级数据结构&#xff08;四&#xff09;——队列 | NULL 下一篇-> 1、树结构&#xff08;Tree&#xff09; 1.1、树结构的特点 自然界中的树由根部开始向上生长&#xff0c;随机长出分支&…...

pdf读取内容缺失(漏字/文字丢失)问题

项目中遇到pdf文件漏字&#xff0c;由于文件涉密&#xff0c;不能展示&#xff0c;简单描述一下&#xff1a; 比如原pff中 姓名&#xff1a;张三 读取结果中&#xff1a;空白&#xff1a;张三 即&#xff1a;原文件说是银行出具的打款证明&#xff0c;银行内部设置了文件权限&a…...

c#面试基础语法——现有⼀个整数number,请写⼀个⽅法判断这个整数是否是2的N次⽅

1.number%20 取余&#xff08;取模&#xff09;只能判断number是不是2的倍数但不一定是2的N次方&#xff0c;如&#xff1a;6%20但是他并不是2的N次方 2.(number&(number-1))0 原理&#xff1a;如果number是2的N次方则表示2进制位只有一位是1。如&#xff1a;2 &#xff08…...

27系列DGUS智能屏发布:可实时播放高清模拟信号摄像头视频

针对高清晰度的模拟信号摄像头视频画面的显示需求&#xff0c;迪文特推出27系列DGUS智能屏。该系列智能屏可适配常见的AHD摄像头、CVBS摄像头&#xff0c;支持单路1080P高清显示、两路720P同屏显示&#xff08;同一类型摄像头&#xff09;。用户通过DGUS简单开发即可实现摄像头…...

YOLOv8改进 | 2023主干篇 | 替换LSKNet遥感目标检测主干 (附代码+修改教程+结构讲解)

一、本文介绍 本文给大家带来的改进内容是LSKNet&#xff08;Large Kernel Selection, LK Selection&#xff09;&#xff0c;其是一种专为遥感目标检测设计的网络架构&#xff0c;其核心思想是动态调整其大的空间感受野&#xff0c;以更好地捕捉遥感场景中不同对象的范围上下…...

【工具】VUE 前端列表拖拽功能代码

【工具】VUE 前端列表拖拽功能代码 使用组件 yarn add sortablejs --save Sortable.js中文网 (sortablejs.com) 以下代码只是举个例子&#xff0c; 大家可以举一反三去实现各自的业务功能 <template><div><el-button type"primary" click"切换…...

人工智能与量子计算:开启未知领域的智慧之旅

导言 人工智能与量子计算的结合是科技领域的一场创新盛宴&#xff0c;引领我们进入了探索未知领域的新时代。本文将深入研究人工智能与量子计算的交汇点&#xff0c;探讨其原理、应用以及对计算领域的深远影响。 量子计算的崛起为人工智能领域注入了新的活力&#xff0c;开启了…...

2023了,前端实现AI电子秤思路分析

前景小知识&#xff1a; 这几年ai这个话题非常火爆&#xff0c;笔者从事零售行业软件开发也接到了新需求&#xff0c;希望实现ai电子秤&#xff0c;老规矩&#xff0c;先看需求 举个栗子&#xff1a; 或许&#xff0c;你已经留意到&#xff0c;当你在某些大型超市超市或生鲜类…...

CSS学习

CSS学习 1. 什么是css?2.css引入方式2.1 内嵌式2.2 外联式2.3 行内式2.4 引入方式特点 3. 基础选择器3.1 标签选择器3.2 类选择器3.3 id选择器3.4 通配符选择器 4. 文字基本样式4.1 字体样式4.1.1 字体大小4.1.2 字体粗细4.1.3 倾斜4.1.4 字体4.1.5 字体font相关属性连写 4.2 …...

Flask基本用法:一个HelloWorld,搭建服务、发起请求

目录 1、简介 2、安装 3、Flask使用示例 参考 1、简介 官网文档 Flask是一个轻量的web服务框架&#xff0c;我们可以利用它快速搭建一个服务&#xff0c;对外提供接口&#xff0c;其他人可以轻松调用我们的服务。这对算法工程师来说比较关键&#xff0c;我们通常不擅长搞开发…...

Tomcat-安装部署(源码包安装)

一、简介 Tomcat 是由 Apache 开发的一个 Servlet 容器&#xff0c;实现了对 Servlet 和 JSP 的支持&#xff0c;并提供了作为Web服务器的一些特有功能&#xff0c;如Tomcat管理和控制平台、安全域管理和Tomcat阀等。 简单来说&#xff0c;Tomcat是一个WEB应用程序的托管平台…...

【Hadoop_06】MapReduce的概述与wc案例

1、MapReduce概述1.1 MapReduce定义1.2 MapReduce优点1.3 MapReduce缺点1.4 MapReduce核心思想1.5 MapReduce进程1.6 常用数据序列化类型1.7 源码与MapReduce编程规范 2、WordCount案例实操2.1 本地测试2.2 提交到集群测试 1、MapReduce概述 1.1 MapReduce定义 MapReduce是一…...

Qt点击子窗口时父窗口标题栏高亮设计思路

父窗口调用findChildren得到其子孙窗口的列表&#xff0c;列表元素统一为QWidget*&#xff0c;遍历列表元素&#xff0c;每个元素调用installEventFilter&#xff0c;过滤QEvent::FocusIn和QEvent::FocusOut事件&#xff0c;做相应处理即可&#xff1a; QWidget* parent; QLis…...

Python 3.14 JIT编译器实测对比:启动耗时降63%、内存开销压减41%,你的服务还在用默认配置?

第一章&#xff1a;Python 3.14 JIT编译器实测性能跃迁全景Python 3.14 引入的实验性 JIT 编译器&#xff08;基于 Pyjion 与 CPython 运行时深度集成&#xff09;首次在标准发行版中启用可配置的即时编译通道&#xff0c;显著改变了传统解释执行的性能边界。我们通过统一基准套…...

如何一键获取国家中小学智慧教育平台所有电子课本?这个智能下载工具给你答案

如何一键获取国家中小学智慧教育平台所有电子课本&#xff1f;这个智能下载工具给你答案 【免费下载链接】tchMaterial-parser 国家中小学智慧教育平台 电子课本下载工具 项目地址: https://gitcode.com/GitHub_Trending/tc/tchMaterial-parser 还在为繁琐的教材下载流程…...

LeetCode知识点总结 - 524

LeetCode 524. Longest Word in Dictionary through Deleting考点难度ArrayMedium题目 Given a string s and a string array dictionary, return the longest string in the dictionary that can be formed by deleting some of the given string characters. If there is mor…...

程序员成长之路:从技术热爱到工程艺术

1. 程序人生&#xff1a;从技术热爱到工程艺术1.1 技术启蒙与早期实践1987年进入武汉大学计算机系标志着一段技术人生的开始。最初接触的是Motorola 68000处理器系统&#xff0c;配置540KB内存&#xff0c;运行UNIX操作系统。这种八人共享的计算环境成为编程技术的第一课堂。大…...

PaddleOCR方向分类器优化:基于文本矩形框筛选的准确率提升实践

1. 为什么需要优化PaddleOCR方向分类器 在实际项目中&#xff0c;我们经常遇到需要处理各种方向文本图片的场景。PaddleOCR作为一款优秀的开源OCR工具&#xff0c;虽然内置了方向分类功能&#xff0c;但在实际使用中发现&#xff0c;对于90度和270度旋转的文本图片&#xff0c;…...

DataX 实战:从零部署到多场景数据同步

1. DataX入门&#xff1a;为什么选择它作为数据同步工具 第一次接触DataX是在三年前的一个紧急项目里&#xff0c;当时需要把生产环境的MySQL数据实时同步到分析库。试过几种方案后&#xff0c;最终被DataX的稳定性和灵活性打动。作为阿里开源的数据同步工具&#xff0c;它最大…...

OpenClaw安全指南:Qwen3-32B本地化部署的权限管控策略

OpenClaw安全指南&#xff1a;Qwen3-32B本地化部署的权限管控策略 1. 为什么需要特别关注OpenClaw的安全问题 第一次在本地部署OpenClaw时&#xff0c;我被它强大的自动化能力震撼了——这个AI助手能像真人一样操作我的电脑&#xff0c;从文件管理到网页浏览无所不能。但当我…...

Docker vs Pip:MinerU本地部署全攻略,哪种方式更适合你的PDF解析需求?

Docker与Pip部署MinerU深度对比&#xff1a;如何为PDF解析选择最佳方案 在文档自动化处理领域&#xff0c;PDF解析工具的选择往往直接影响工作效率。MinerU作为一款开源的PDF解析工具&#xff0c;因其对复杂排版的良好支持而受到开发者青睐。但面对Pip和Docker两种主流部署方式…...

Transformer横空出世!解决NLP难题,引爆AI革命!

Transformer模型自2017年推出以来&#xff0c;已成为人工智能领域最具影响力的创新之一。本文深入探讨了Transformer的基本原理、出现背景及其精巧的架构设计。Transformer通过自注意力机制&#xff0c;成功克服了RNN在处理长序列数据时的长距离依赖和并行计算瓶颈&#xff0c;…...

打造高效AI训练与推理服务器:2025年硬件配置与QLoRA实战指南

1. 2025年AI服务器硬件配置指南 组装一台兼顾训练和推理的AI服务器&#xff0c;核心在于平衡显存容量、内存带宽和计算吞吐量。2025年的硬件市场已经趋于成熟&#xff0c;二手显卡性价比尤为突出。我实测过多种配置组合&#xff0c;发现双RTX 3090的方案在微调7B-14B参数模型时…...