当前位置: 首页 > news >正文

一般用哪些工具做大数据可视化分析?

做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少!

这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图类、快速出图类、词云生成类、综合分析类5大类。个人经验,大家按需采纳:

01 纯统计图表类——简道云

可视化模板>>https://www.jiandaoyun.com

适用群体:更适合职场各种业务端的数据分析,可在线使用,替代Excel偷懒的神器!

这是一款我用了4年多的数据分析偷懒神器,模板一共提供10+基础数据分析图表,一般业务上的数据分析我用它就够了。

可以先看看效果:

像上面这种数据看板,放在excel里面做起来是很复杂的,但用简道云做可视化看板,就能轻松达到四两拨千斤的效果。

示例:

导入简道云>新建仪表盘>点击数据组件-统计表>添加刚刚的表格数据-订单管理

比如:想要在仪表盘中显示“订单总额”,即把“订单总额”字段拉入指标处,选择图标类型即可。

制作完成之后的可视化看板如下图:

我选择用它来做业务数据分析的另一个重要原因是——它能做的不止数据分析图表,基本上能够高效辅助完成所有业务数据的收集、处理、分析、展示、以及流程管理:

  • 可以用它的在线表单来做数据收集
  • 收集好的数据可以导入数据工厂自动处理分析
  • 处理好的数据可以生成各种分析图表
  • 流程引擎能够配合做好各业务环节之间的流转
  • ......

不足:由于简道云本身就是偏向企业层面的,所以更适合一些偏业务端的数据分析。如果是想要做一些非常专业复杂的数据分析大屏,它是不如哪些专业做数据大屏的工具的。


02 CIS地图可视化类——QGIS

官网>>https://www.qgis.org/en/site/

适用于:适合想做专业地图可视化的伙伴,并且需要有一定的编程基础。

QGIS是我目前使用最多的GIS软件,免费、跨平台,不仅可以做各种分析,还可以制作各种漂亮的可视化地图,比如可以做这种非常炫酷的图表:

具体图表制作上稍微有些复杂,需要先安装QGIS(可在 linux、unix、mac 和 windows 上运行)并上传底图。

内容列表中有很多图层,在 QGIS 画布中能看到各式各样的世界地图,语言是可以设置为中文的,你用担心自己看不懂。

不会设计的也可以看他们官方的帮助文档,非常详细,入门的话完全足够了,如果还不会的话也有很多平台会针对QGIS发布一些教程,可以自己去搜搜。

不足:地图制作功能非常繁琐,这也是很多人不愿意用QGIS的原因,虽然它功能很强大但对于初学者来说太复杂了,劝退了很多人。


03 快速出图类——datawrapper

https://www.datawrapper.de/

适合自媒体快速出图、操作简单、开源、免费

datawrapper创建之初是为了服务一些新闻网站和报纸媒体的,尤其是金融媒体,需要用到非常多的可视化图表,而datawrapper的优势就在于能够在几分钟内就制作出一些简单、正确和可嵌入的图片。

注意:制作图表前要先将数据放到google文档里,然后在软件里导入Google文档。

比如下面的示例,先添加新的图表输入google文档地址

第二步是检查和调整数据,可以在这一步进行数据的删减、查询等。

第三步就是选择图表,datawrapper提供了非常多的图表模板,这里就用分列横向柱状图吧

第四步就可以生成图表,也可以生成分享链接,上传到平台上让更多人看到。

整个过程几乎不怎么费时间,缺点是外文工具,没有汉化版。


04 词云生成类——wordsift

官网>>https://wordsift.org/

适用于:适用于需要经常做各种词云生成、分析的伙伴,比较方便快捷

这是我用的比较多的一款词云生成类工具类,使用起来很方便,没有那些繁琐的步骤,而且页面很简洁,在我这里是上大分了!!

比如需要提取一段话里面的热点词汇,复制一段,然后点击Sift,这里示例我就直接用工具内置的词包了,是可以生成中文词云的哈!

就会自动生成一个词云图,可以选择自己喜欢的词云格式,也可以选择单词是怎么分的,比如从A-Z,正序还是倒序等等。

右上角分别是:刷新,放大和设置按钮,可以点开设置Scale为三种类别,如果频次相差太大,可以进行log,如果不大,可以选择n即可。

同时下方的角度from角度to角度,可以设置词汇的倾斜角度。Front可以设置字体,Colorset可以设置颜色为一个三色系或者同一个颜色的不同深浅。

最下面就是图片的下载,做好之后可以自行下载图片。

可以点击图中的单词,看到词汇出现的频次,最下面是这个单词在文中出现了几处以及地方。当然,你也可以点击文本可视化,这样,软件会对文本进行一个数据统计,右侧是统计的数据

不足:这个网站有个bug,有的时候不能下载图片,大家只能通过截图保存了,这也是唯一的缺点,说不定过阵子就好了。


05 综合可视化分析类——Tableau

https://www.tableau.com/

优点:OLAP功能强大、支持网页集成、学习难度适中

世界知名的BI工具,以超强的可视化能力著称。它已经成为商业BI界的TOP选手,很多大型公司像阿里、谷歌都在使用,能快速搭建数据系统。

打开Tableau,点击工作表,可以看到以下界面:

  • 1) 功能区-作图过程需要使用的工具
  • 2) 画布-展示图形的看板
  • 3) 页选项卡-可添加或删除多页与切换数据源 工作表 仪表板不同页面
  • 4) 筛选器-可筛选数据字段
  • 5) “可视化效果”窗格-根据需要选择不同的图形
  • 6) 搜索表格字段等

可以通过设置页面动画,来制作动态可视化图表,比如这种:

不足:tableau对计算机的硬件要求比较高(不止一次卡死过),而且需要有些可视化功能需要收费。

分享结束,如果有更好的工具推荐,欢迎一起交流讨论!

相关文章:

一般用哪些工具做大数据可视化分析?

做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少! 这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图…...

Python每日一练(20230308)

目录 1. Excel表列名称 ★ 2. 同构字符串 ★★ 3. 分割回文串 II ★★★ 🌟 每日一练刷题专栏 C/C 每日一练 ​专栏 Python 每日一练 专栏 1. Excel表列名称 给你一个整数 columnNumber ,返回它在 Excel 表中相对应的列名称。 例如&#xff1…...

jvm之堆解读

堆(Heap)的核心概述 堆针对一个JVM进程来说是唯一的,也就是一个进程只有一个JVM,但是进程包含多个线程,他们是共享同一堆空间的。 一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。 Java堆区…...

重构·改善既有代码的设计.02

前言之前在《重构改善既有代码的设计.01》中初步了解了重构的基本前提,基础原则等入门知识。今天我们继续第二更......识别代码的坏味道Duplicated Code 重复代码。最单纯的Duplicated Code就是“同一个类中含有相同的表达式”或“两个互为兄弟的子类内含有相同表达…...

脑电信号处理总成

目录一. EEG(脑电图)1.1 脑波1.2 伪迹1.2.1 眼动伪迹1.2.2 肌电伪迹1.2.3 运动伪迹1.2.4 心电伪迹1.2.5 血管波伪迹1.2.6 50Hz和静电干扰1.3 伪迹去除方法1.3.1 避免伪迹产生法1.3.2 直接移除法1.3.3 伪迹消除法一. EEG(脑电图) 1.1 脑波 脑波(英语:br…...

判断推理之图形推理

考点一动态位置变化(一)平移1.特征:图形在平面上的移动,图形本身的大小和形状不发生改变。2.方向:直线(上下、左右、斜对角线),绕圈(顺时针、逆时针)3.距离&a…...

【预告】ORACLE Unifier v22.12 虚拟机发布

引言 离ORACLE Primavera Unifier 最新系统 v22.12已过去了3个多月,应盆友需要,也为方便大家体验,我近日将构建最新的Unifier的虚拟环境,届时将分享给大家,最终可通过VMWare vsphere (esxi) / workstation 或Oracle …...

Sql执行流程与Redo log、 Undo log、 Bin log日志文件

文章目录Sql执行流程与日志文件Sql的执行流程Redo LogBin logUndo logSql执行流程与日志文件 Sql的执行流程 mysql的内部组件结构如下图所示 连接器 与客户端建立连接,检验登录密码,分配相应权限 查询缓存 执行sql语句时会先从这里找一下,…...

如何提高软件测试执行力

高效的测试执行力 不管在哪个行业,高校的执行力都是不可或缺的。在软件测试行业更是这样。有些测试人员,很勤奋也很吃苦,但是可能最终不能很好的完成测试任务。究其原因就是一个测试执行力的问题。 高效执行就是有目标,有计划&…...

Open3D 计算点到平面的距离

目录 一、算法原理二、代码实现三、结果展示一、算法原理 平面外一点 ( x 1 , y 1 , z 1 ) (x_1,y_1,z_1) (x...

DDD领域驱动设计初探

DDD 强调领域模型要兼顾业务和技术两个视角。 我们怎么用一套系统化的方法,抽丝剥茧、一步一步地把需求落实到代码呢?咱们看看下面这张图,它表示了领域驱动设计中的主要流程。 领域驱动设计主要的开发流程你可以看到,在整个开发流…...

C中AES_cbc_encrypt加密对应java中的解密

前言知识: 1.AES(Advanced Encryption Standard)高级加密标准,作为分组密码(把明文分成一组一组的,每组长度相等,每次加密一组数据,直到加密完整个明文)。 2.在AES标准…...

演化算法:乌鸦搜索算法 (Crow Search Algorithm)

前言 如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。 在机器学习中,我们所要优化的问题很多时候难以求导,因此通常会采用一些演化算法(又称零…...

基于open62541的OPC UA服务器和客户端开发技术

一、OPC UA的基本概念 1、OPC(OLE for Process Control),是一个工业标准,管理这个标准的国际组织是OPC基金会; 2、OPC通信结构:是指包含一个或多个OPC客户端与服务器相互通信的集合。以下是一个简单的流程图:标准的C/S结构。 3、OPC服务器:TOPC基金会定义了四种;...

测试测开面试要知道的那些事01

列表与元组的区别列表是动态数组,它们可变且可以重设长度(改变其内部元素的个数)。元组是静态数组,它们不可变,且其内部数据一旦创建便无法改变。元组缓存于Python运行时环境,这意味着我们每次使用元组时无…...

物联网毕设 -- 智能厨房监测系统(改)

前言 在家庭生活中,厨房是必不可少的,所以厨房的安全问题关乎着我们大家的生命,所以提出智能厨房监测系统,目的就是为我们减少不必要的安全问题 ⚠️⚠️(本文章仅提供思路和实现方法,并不包含代码&#x…...

macOS 13.3 Beta 3 (22E5236f)发布

系统介绍3 月 8 日消息,苹果今日向 Mac 电脑用户推送了 macOS 13.3 开发者预览版 Beta 3 更新(内部版本号:22E5236f),本次更新距离上次发布隔了 7 天。macOS Ventura 带来了台前调度、连续互通相机、FaceTime 通话接力…...

Failed to configure a DataSource: ‘url‘ attribute

一 完整的错误信息 *************************** APPLICATION FAILED TO START *************************** Description: Failed to configure a DataSource: url attribute is not specified and no embedded datasource could be configured. Reason: Failed to dete…...

Mysql高级——锁

锁 mysql锁的分类 从性能上分为:乐观锁、悲观锁从锁的粒度上分:行锁、间隙锁、页锁、悲观锁从对数据库的操作分类:读锁、写锁 乐观锁需要我们自己通过version字段来实现,如果更新失败则在代码中进行where重试。而我们常见的读锁…...

Spring的Async注解线程池扩展方案

目录- [Spring的Async注解线程池扩展方案]- [目录]- [1. 扩展目的]- [2. 扩展实现]- [2.1 扩展Async注解的执行拦截器AnnotationAsyncExecutionInterceptor]- [2.2 扩展Async注解的Spring代理顾问AsyncAnnotationAdvisor]- [2.3 扩展Async注解的 Spring Bean 后置处理器AsyncAn…...

云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?

大家好,欢迎来到《云原生核心技术》系列的第七篇! 在上一篇,我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在,我们就像一个拥有了一块崭新数字土地的农场主,是时…...

内存分配函数malloc kmalloc vmalloc

内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...

RocketMQ延迟消息机制

两种延迟消息 RocketMQ中提供了两种延迟消息机制 指定固定的延迟级别 通过在Message中设定一个MessageDelayLevel参数,对应18个预设的延迟级别指定时间点的延迟级别 通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后&#xf…...

前端倒计时误差!

提示:记录工作中遇到的需求及解决办法 文章目录 前言一、误差从何而来?二、五大解决方案1. 动态校准法(基础版)2. Web Worker 计时3. 服务器时间同步4. Performance API 高精度计时5. 页面可见性API优化三、生产环境最佳实践四、终极解决方案架构前言 前几天听说公司某个项…...

ESP32读取DHT11温湿度数据

芯片:ESP32 环境:Arduino 一、安装DHT11传感器库 红框的库,别安装错了 二、代码 注意,DATA口要连接在D15上 #include "DHT.h" // 包含DHT库#define DHTPIN 15 // 定义DHT11数据引脚连接到ESP32的GPIO15 #define D…...

苍穹外卖--缓存菜品

1.问题说明 用户端小程序展示的菜品数据都是通过查询数据库获得,如果用户端访问量比较大,数据库访问压力随之增大 2.实现思路 通过Redis来缓存菜品数据,减少数据库查询操作。 缓存逻辑分析: ①每个分类下的菜品保持一份缓存数据…...

Java 加密常用的各种算法及其选择

在数字化时代,数据安全至关重要,Java 作为广泛应用的编程语言,提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景,有助于开发者在不同的业务需求中做出正确的选择。​ 一、对称加密算法…...

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案 什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中,部分节点存储的数据量或访问量远高于其他节点,导致这些节点负载过高,影响整体性能。 数据倾斜的主要表现 部分节点内存使用率远高于其他节…...

HarmonyOS运动开发:如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit(传感器服务)# 前言 在运动类应用中,运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据,如配速、距离、卡路里消耗等,用户可以更清晰…...

day36-多路IO复用

一、基本概念 (服务器多客户端模型) 定义:单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用:应用程序通常需要处理来自多条事件流中的事件,比如我现在用的电脑,需要同时处理键盘鼠标…...