当前位置: 首页 > news >正文

【数据可视化复习方向】

1.数据可视化就是数据中信息的可视化

2.数据可视化主要从数据中寻找三个方面的信息:模式、关系和异常

3.大数据可视化分类:科学可视化、信息可视化、可视分析学

4.大数据可视化作用:记录信息、分析推理、信息传播与协同

5.可视化流程:1️⃣数据采集 2️⃣数据处理和变换 3️⃣ 可视化映射和人机交互 5️⃣用户感知

6.数据4V特征:大量、多样、高速、价值

7.可视化元素由三个部分组成:可视化空间、标记、视觉通道(分别对应什么东西)

8.可视化设计原则:1.数据筛选原则 2.数据到可视化的直观映射原则 3.视图选择与交互设计原则 4.美学原则 5.适当运用隐喻原则 6.颜色与透明度选择原则

9.时间数据分类主要有两种:连续型时间数据可视化,离散型时间数据可视化

连续型时间数据可视化:阶梯图、折线图、螺旋图、热图

离散型时间数据可视化:散点图、柱形图、堆叠柱形图、点线图

10.时间数据可视化设计三个维度:表达、比例和布局

11.P31-P34 不同图形之间有什么特点 (各个图形进行比较)

12.时空比例数据可视化 + 这些图干嘛的

13.关系数据可视化

关系数据具有关联性和分布性

关联性:正相关、负相关和不相关

14.气泡图、散点图矩阵等展现了关系数据什么特性?茎叶图,直方图等展现什么特性?要会画?

15.文本数据可视化包括哪几种可视化方式?

文本数据大致可以分为三种:单文本、文档集合和时序文本数据;对应的文本可视化也可分为:文本内容可视化、文本关系可视化、文本多层面信息的可视化

文本内容可视化:是对文本内的关键信息分析后的展示

文本关系可视化:既可以对单个文本进行内部的关系展示,也可以对多个文本进行文本之间的关系展示;

文本多特征信息可视化:是结合文本的多个特征进行全方位的可视化展示

16.对文本的理解需求分成哪几个层级?不同层级使用什么方法?

词汇级、语法级、语义级;

词汇级使用各类分词算法,语法级使用一些句法分析算法,语义级使用主题提取算法

17.文本可视化的基本流程

涉及到文本流程图一定要看

18.时序文本是干嘛的?特点,图形有哪些,不同可视化元素代表什么?

时序文本具有时间性和顺序性。对具有明显时序信息的文本进行可视化时,需要在结果中体现这种变化。

有三种流图可以满足这种可视化需求

1️⃣主题河流:两个属性:颜色用以区分主题的类型,相同主题用相同颜色的涌流表示;宽度表示主题的数量,涌流状态随着主题变化,可能扩展、收缩或者保持不变

2️⃣文本流:是主题河流的一种变形,可以表达主题变化,以及随着时间流动,各个主题之间的分裂和合并信息

3️⃣故事流:可以表达文本的情节或者电影中的情节

19.文本分布可视化

文本分布可视化实际上是引入了词语在文本当中的位置、句子长度等信息,这些信息常被制作成文本弧。文本弧特性如下:P48

20.文本关系可视化P48

21.第七章看看书和PPT吧

22.实验部分作业

数据可视化/实验一.ipynb · 南毅c/school - Gitee.com

数据可视化/子图绘制.ipynb · 南毅c/school - Gitee.com

数据可视化/实验二.ipynb · 南毅c/school - Gitee.com

import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['Songti SC']  # 解决中文不能正常显示的问题
# 子类目
categories = ['童装', '奶粉辅食', '母婴专区', '洗护喂养', '宝宝尿裤', '春夏新品', '童车童床', '玩具文娱', '童鞋']
# 销售额
sales = [29665, 3135.4, 4292.4, 5240.9, 5543.4, 5633.8, 6414.5, 9308.1, 10353]# 计算占比
total_sales = sum(sales)
percentages = [(sale / total_sales) * 100 for sale in sales]# 设置饼图标题
plt.title("拼多多平台子类目的销售额")# 绘制饼图
patches, texts, autotexts = plt.pie(percentages, labels=categories, autopct='%1.1f%%', startangle=90)# 添加图例
plt.legend(patches, categories, loc="best")# 添加表格
plt.table(cellText=[sales], rowLabels=["销售额"], colLabels=categories, cellLoc='center', loc='bottom')# 确保饼图是圆形
plt.axis('equal')# 显示图形
plt.show()

 

import matplotlib.pyplot as plt# 各专业各年的选课人数
data = {"电子商务": [136, 197, 428, 263],"可视化": [327, 379, 315, 317],"网络爬虫": [148, 195, 239, 193],"python基础": [495, 140, 211, 452]
}# 年份
years = [2016, 2017, 2018, 2019]# 设置柱状图的底部位置
bottoms = [[0] * len(years) for _ in range(len(data))]# 颜色对应年份
colors = ['blue', 'orange', 'green', 'red']# 绘制堆积柱状图
for i, (key, values) in enumerate(data.items()):for j, value in enumerate(values):if j > 0:bottoms[i][j] = bottoms[i][j - 1] + values[j - 1]plt.bar([key], [value], bottom=bottoms[i][j], color=colors[j], label=str(years[j]))# 设置标题和坐标轴标签
plt.title("招生情况")
plt.xlabel("专业")
plt.ylabel("人数")# 显示图例
plt.legend(title="年份")# 显示图形
plt.show()

 

数据可视化复习1-Matplotlib简介属性和创建子图_python多子图插入插图-CSDN博客

数据可视化复习2-绘制折线图+条形图(叠加条形图,并列条形图,水平条形图)+ 饼状图 + 直方图_条形图+折线图-CSDN博客

相关文章:

【数据可视化复习方向】

1.数据可视化就是数据中信息的可视化 2.数据可视化主要从数据中寻找三个方面的信息:模式、关系和异常 3.大数据可视化分类:科学可视化、信息可视化、可视分析学 4.大数据可视化作用:记录信息、分析推理、信息传播与协同 5.可视化流程&…...

CentOS下安装RabbitMQ

提示:“奔跑吧邓邓子” 的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件(如 IBM System 3650 M5)、云服务平台(如腾讯云、华为云)、服务器软件(如 Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker 等)、开发工具(如 Gi…...

探究音频丢字位置和丢字时间对pesq分数的影响

丢字的本质 丢字的本质是在一段音频中一小段数据变为0 丢字对主观感受的影响 1. 丢字位置 丢字的位置对感知效果有很大影响。如果丢字发生在音频信号的静音部分或低能量部分,感知可能不明显;而如果丢字发生在高能量部分或关键音素上,感知…...

音视频入门基础:MPEG2-TS专题(23)——通过FFprobe显示TS流每个packet的信息

音视频入门基础:MPEG2-TS专题系列文章: 音视频入门基础:MPEG2-TS专题(1)——MPEG2-TS官方文档下载 音视频入门基础:MPEG2-TS专题(2)——使用FFmpeg命令生成ts文件 音视频入门基础…...

Bert各种变体——RoBERTA/ALBERT/DistillBert

RoBERTa 会重复一个语句10次,然后每次都mask不同的15%token。丢弃了NSP任务,论文指出NSP任务有时甚至会损害性能。使用了BPE ALBERT 1. 跨层参数共享 可以共享多头注意力层的参数,或者前馈网络层的参数,或者全部共享。 实验结果…...

Go入门篇:(一)golang的安装和编辑工具安装

一、前言 最近我有幸接触到Go语言,深入了解后,发现go语言确实有很多让人惊叹的地方。作为一个有着多年Java编程经验的程序员,我深深地被它所吸引,并且决定记录下我的学习之路,以便与大家分享我的经验和感悟。 与Java不同,Go语言的语法和运行效率都非常高,特别是对于并…...

【技术实战】R语言统计分析与可视化从入门到精通

前言 随着大数据时代的到来,数据分析已经成为各行各业的重要技能。R语言作为一种强大的统计分析和数据可视化工具,广泛应用于科学研究、数据分析和商业决策支持。 本文将带领读者从入门到精通,掌握R语言在统计分析和数据可视化方面的核心技…...

【Lua之·Lua与C/C++交互·Lua CAPI访问栈操作】

系列文章目录 文章目录 前言一、概述1.1 Lua堆栈 二、栈操作2.1 基本的栈操作2.2 入栈操作函数2.3 出栈操作函数2.4 既入栈又出栈的操作函数2.5 栈检查与类型转换函数2.5 获取表数据 三、实例演示总结 前言 Lua是一种轻量级的、高性能的脚本语言,经常被用于游戏开发…...

LabVIEW实现LoRa通信

目录 1、LoRa通信原理 2、硬件环境部署 3、程序架构 4、前面板设计 5、程序框图设计 6、测试验证 本专栏以LabVIEW为开发平台,讲解物联网通信组网原理与开发方法,覆盖RS232、TCP、MQTT、蓝牙、Wi-Fi、NB-IoT等协议。 结合实际案例,展示如何利用LabVIEW和常用模块实现物联网系…...

【数字化】华为数字化转型架构蓝图-2

目录 1、客户联结的架构思路 1.1 ROADS体验设计 1.2 具体应用场景 1.3 统一的数据底座 1.4 案例与成效 2、一线作战平台的架构思路 2.1 核心要素 2.2 关键功能 2.3 实施路径 2.4 案例与成效 3、能力数字化的架构思路 3.1 能力数字化的核心目标 3.2 能力数字化的实…...

【Agent】AutoGen Studio2.0开源框架-UI层环境安装+详细操作教程(从0到1带跑通智能体AutoGen Studio)

💥 欢迎来到我的博客!很高兴能在这里与您相遇! 首页:GPT-千鑫 – 热爱AI、热爱Python的天选打工人,活到老学到老!!!导航 - 人工智能系列:包含 OpenAI API Key教程, 50个…...

Linux 网络配置基础

文章目录 1. 前言2. Linux 的网络配置2.1 传统的网络配置方法2.2 新的网络配置方法2.3 用 DHCP 客户端管理网络 3. 参考资料 1. 前言 限于作者能力水平,本文可能存在谬误,因此而给读者带来的损失,作者不做任何承诺。 2. Linux 的网络配置 …...

科技创新 数智未来|清科·沙丘投研院走进竹云

12月20日,清科沙丘投研院带领企投家团队走进竹云交流分享,聚焦技术创新、企业数字化管理、行业前沿应用案例等热点议题,深入探讨数字技术如何点燃企业高质量发展的澎湃动力,共话企业数字化、智能化发展之道。 达晨财智股权管理部…...

Java 常见面试算法题汇总与解析

Java 常见面试算法题汇总与解析 算法题是程序员面试中常见的一部分,也是提升编程能力的核心手段。本文将汇总一些 Java 中常见的算法题,并提供详细的解析和实现代码,帮助开发者更好地理解和掌握算法。 一、字符串相关算法 1.1 字符串反转 …...

【社区投稿】自动特征auto trait的扩散规则

自动特征auto trait的扩散规则 公式化地概括,auto trait marker trait derived trait。其中,等号右侧的marker与derived是在Rustonomicon书中的引入的概念,鲜见于Rust References。所以,若略感生僻,不奇怪。 marker …...

云原生相关的 Go 语言工程师技术路线(含博客网址导航)

要成为一名云原生相关的 Go 语言工程师,需要在 Go 语言、云原生技术栈以及相关的开发和运维工具上建立扎实的基础。下面是一个前字节员工总结的技术路线规划: 1. 掌握 Go 语言基础 深入理解 Go 语言:你需要熟练掌握 Go 的语法、数据结构、并…...

mui框架开发的手机APP——众筹约课类【只有前端,无后端】

点击获取源码...

Python的内存管理

文章目录 1. **内存管理的基本原理**(1)动态内存分配(2)引用计数机制 2. **垃圾回收(Garbage Collection, GC)机制**(1)循环引用问题(2)垃圾回收器的作用 3. …...

VSCode调试

目录 C/C远程本地调试插件配置参考 C/C远程本地调试 测试源码:https://github.com/jrhee17/ssl-study 插件 Remote - SSH C/C 配置 .vscode/launch.json {"version": "0.2.0","configurations": [{"name": "afte…...

Direct Preference Optimization (DPO) 简介与流程解析:中英双语

Direct Preference Optimization (DPO) 简介与流程解析 Direct Preference Optimization (DPO) 是一种基于人类偏好的强化学习优化方法,用于训练语言模型,使其更好地满足用户需求或偏好。本文将详细介绍 DPO 的核心思想、优化流程,并结合代码…...

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...

国防科技大学计算机基础课程笔记02信息编码

1.机内码和国标码 国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制,因此这个了16进制的数据既可以翻译成为这个机器码,也可以翻译成为这个国标码,所以这个时候很容易会出现这个歧义的情况; 因此,我们的这个国…...

IGP(Interior Gateway Protocol,内部网关协议)

IGP(Interior Gateway Protocol,内部网关协议) 是一种用于在一个自治系统(AS)内部传递路由信息的路由协议,主要用于在一个组织或机构的内部网络中决定数据包的最佳路径。与用于自治系统之间通信的 EGP&…...

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色 点击visual studio 上方的 工具-> 选项 在选项窗口中,选择 环境 -> 常规 ,将其中的颜色主题改成深色 点击确定,更改完成...

剑指offer20_链表中环的入口节点

链表中环的入口节点 给定一个链表,若其中包含环,则输出环的入口节点。 若其中不包含环,则输出null。 数据范围 节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。 节点 val 值各不相同。 链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

unix/linux,sudo,其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...

零基础设计模式——行为型模式 - 责任链模式

第四部分:行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习!行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。 核心思想:使多个对象都有机会处…...

CSS设置元素的宽度根据其内容自动调整

width: fit-content 是 CSS 中的一个属性值&#xff0c;用于设置元素的宽度根据其内容自动调整&#xff0c;确保宽度刚好容纳内容而不会超出。 效果对比 默认情况&#xff08;width: auto&#xff09;&#xff1a; 块级元素&#xff08;如 <div>&#xff09;会占满父容器…...

C#中的CLR属性、依赖属性与附加属性

CLR属性的主要特征 封装性&#xff1a; 隐藏字段的实现细节 提供对字段的受控访问 访问控制&#xff1a; 可单独设置get/set访问器的可见性 可创建只读或只写属性 计算属性&#xff1a; 可以在getter中执行计算逻辑 不需要直接对应一个字段 验证逻辑&#xff1a; 可以…...

【Linux系统】Linux环境变量:系统配置的隐形指挥官

。# Linux系列 文章目录 前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变量的生命周期 四、环境变量的组织方式五、C语言对环境变量的操作5.1 设置环境变量&#xff1a;setenv5.2 删除环境变量:unsetenv5.3 遍历所有环境…...