当前位置: 首页 > news >正文

一般用哪些工具做大数据可视化分析?

做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少!

这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图类、快速出图类、词云生成类、综合分析类5大类。个人经验,大家按需采纳:

01 纯统计图表类——简道云

可视化模板>>https://www.jiandaoyun.com

适用群体:更适合职场各种业务端的数据分析,可在线使用,替代Excel偷懒的神器!

这是一款我用了4年多的数据分析偷懒神器,模板一共提供10+基础数据分析图表,一般业务上的数据分析我用它就够了。

可以先看看效果:

像上面这种数据看板,放在excel里面做起来是很复杂的,但用简道云做可视化看板,就能轻松达到四两拨千斤的效果。

示例:

导入简道云>新建仪表盘>点击数据组件-统计表>添加刚刚的表格数据-订单管理

比如:想要在仪表盘中显示“订单总额”,即把“订单总额”字段拉入指标处,选择图标类型即可。

制作完成之后的可视化看板如下图:

我选择用它来做业务数据分析的另一个重要原因是——它能做的不止数据分析图表,基本上能够高效辅助完成所有业务数据的收集、处理、分析、展示、以及流程管理:

  • 可以用它的在线表单来做数据收集
  • 收集好的数据可以导入数据工厂自动处理分析
  • 处理好的数据可以生成各种分析图表
  • 流程引擎能够配合做好各业务环节之间的流转
  • ......

不足:由于简道云本身就是偏向企业层面的,所以更适合一些偏业务端的数据分析。如果是想要做一些非常专业复杂的数据分析大屏,它是不如哪些专业做数据大屏的工具的。


02 CIS地图可视化类——QGIS

官网>>https://www.qgis.org/en/site/

适用于:适合想做专业地图可视化的伙伴,并且需要有一定的编程基础。

QGIS是我目前使用最多的GIS软件,免费、跨平台,不仅可以做各种分析,还可以制作各种漂亮的可视化地图,比如可以做这种非常炫酷的图表:

具体图表制作上稍微有些复杂,需要先安装QGIS(可在 linux、unix、mac 和 windows 上运行)并上传底图。

内容列表中有很多图层,在 QGIS 画布中能看到各式各样的世界地图,语言是可以设置为中文的,你用担心自己看不懂。

不会设计的也可以看他们官方的帮助文档,非常详细,入门的话完全足够了,如果还不会的话也有很多平台会针对QGIS发布一些教程,可以自己去搜搜。

不足:地图制作功能非常繁琐,这也是很多人不愿意用QGIS的原因,虽然它功能很强大但对于初学者来说太复杂了,劝退了很多人。


03 快速出图类——datawrapper

https://www.datawrapper.de/

适合自媒体快速出图、操作简单、开源、免费

datawrapper创建之初是为了服务一些新闻网站和报纸媒体的,尤其是金融媒体,需要用到非常多的可视化图表,而datawrapper的优势就在于能够在几分钟内就制作出一些简单、正确和可嵌入的图片。

注意:制作图表前要先将数据放到google文档里,然后在软件里导入Google文档。

比如下面的示例,先添加新的图表输入google文档地址

第二步是检查和调整数据,可以在这一步进行数据的删减、查询等。

第三步就是选择图表,datawrapper提供了非常多的图表模板,这里就用分列横向柱状图吧

第四步就可以生成图表,也可以生成分享链接,上传到平台上让更多人看到。

整个过程几乎不怎么费时间,缺点是外文工具,没有汉化版。


04 词云生成类——wordsift

官网>>https://wordsift.org/

适用于:适用于需要经常做各种词云生成、分析的伙伴,比较方便快捷

这是我用的比较多的一款词云生成类工具类,使用起来很方便,没有那些繁琐的步骤,而且页面很简洁,在我这里是上大分了!!

比如需要提取一段话里面的热点词汇,复制一段,然后点击Sift,这里示例我就直接用工具内置的词包了,是可以生成中文词云的哈!

就会自动生成一个词云图,可以选择自己喜欢的词云格式,也可以选择单词是怎么分的,比如从A-Z,正序还是倒序等等。

右上角分别是:刷新,放大和设置按钮,可以点开设置Scale为三种类别,如果频次相差太大,可以进行log,如果不大,可以选择n即可。

同时下方的角度from角度to角度,可以设置词汇的倾斜角度。Front可以设置字体,Colorset可以设置颜色为一个三色系或者同一个颜色的不同深浅。

最下面就是图片的下载,做好之后可以自行下载图片。

可以点击图中的单词,看到词汇出现的频次,最下面是这个单词在文中出现了几处以及地方。当然,你也可以点击文本可视化,这样,软件会对文本进行一个数据统计,右侧是统计的数据

不足:这个网站有个bug,有的时候不能下载图片,大家只能通过截图保存了,这也是唯一的缺点,说不定过阵子就好了。


05 综合可视化分析类——Tableau

https://www.tableau.com/

优点:OLAP功能强大、支持网页集成、学习难度适中

世界知名的BI工具,以超强的可视化能力著称。它已经成为商业BI界的TOP选手,很多大型公司像阿里、谷歌都在使用,能快速搭建数据系统。

打开Tableau,点击工作表,可以看到以下界面:

  • 1) 功能区-作图过程需要使用的工具
  • 2) 画布-展示图形的看板
  • 3) 页选项卡-可添加或删除多页与切换数据源 工作表 仪表板不同页面
  • 4) 筛选器-可筛选数据字段
  • 5) “可视化效果”窗格-根据需要选择不同的图形
  • 6) 搜索表格字段等

可以通过设置页面动画,来制作动态可视化图表,比如这种:

不足:tableau对计算机的硬件要求比较高(不止一次卡死过),而且需要有些可视化功能需要收费。

分享结束,如果有更好的工具推荐,欢迎一起交流讨论!

相关文章:

一般用哪些工具做大数据可视化分析?

做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少! 这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图…...

Python每日一练(20230308)

目录 1. Excel表列名称 ★ 2. 同构字符串 ★★ 3. 分割回文串 II ★★★ 🌟 每日一练刷题专栏 C/C 每日一练 ​专栏 Python 每日一练 专栏 1. Excel表列名称 给你一个整数 columnNumber ,返回它在 Excel 表中相对应的列名称。 例如&#xff1…...

jvm之堆解读

堆(Heap)的核心概述 堆针对一个JVM进程来说是唯一的,也就是一个进程只有一个JVM,但是进程包含多个线程,他们是共享同一堆空间的。 一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。 Java堆区…...

重构·改善既有代码的设计.02

前言之前在《重构改善既有代码的设计.01》中初步了解了重构的基本前提,基础原则等入门知识。今天我们继续第二更......识别代码的坏味道Duplicated Code 重复代码。最单纯的Duplicated Code就是“同一个类中含有相同的表达式”或“两个互为兄弟的子类内含有相同表达…...

脑电信号处理总成

目录一. EEG(脑电图)1.1 脑波1.2 伪迹1.2.1 眼动伪迹1.2.2 肌电伪迹1.2.3 运动伪迹1.2.4 心电伪迹1.2.5 血管波伪迹1.2.6 50Hz和静电干扰1.3 伪迹去除方法1.3.1 避免伪迹产生法1.3.2 直接移除法1.3.3 伪迹消除法一. EEG(脑电图) 1.1 脑波 脑波(英语:br…...

判断推理之图形推理

考点一动态位置变化(一)平移1.特征:图形在平面上的移动,图形本身的大小和形状不发生改变。2.方向:直线(上下、左右、斜对角线),绕圈(顺时针、逆时针)3.距离&a…...

【预告】ORACLE Unifier v22.12 虚拟机发布

引言 离ORACLE Primavera Unifier 最新系统 v22.12已过去了3个多月,应盆友需要,也为方便大家体验,我近日将构建最新的Unifier的虚拟环境,届时将分享给大家,最终可通过VMWare vsphere (esxi) / workstation 或Oracle …...

Sql执行流程与Redo log、 Undo log、 Bin log日志文件

文章目录Sql执行流程与日志文件Sql的执行流程Redo LogBin logUndo logSql执行流程与日志文件 Sql的执行流程 mysql的内部组件结构如下图所示 连接器 与客户端建立连接,检验登录密码,分配相应权限 查询缓存 执行sql语句时会先从这里找一下,…...

如何提高软件测试执行力

高效的测试执行力 不管在哪个行业,高校的执行力都是不可或缺的。在软件测试行业更是这样。有些测试人员,很勤奋也很吃苦,但是可能最终不能很好的完成测试任务。究其原因就是一个测试执行力的问题。 高效执行就是有目标,有计划&…...

Open3D 计算点到平面的距离

目录 一、算法原理二、代码实现三、结果展示一、算法原理 平面外一点 ( x 1 , y 1 , z 1 ) (x_1,y_1,z_1) (x...

DDD领域驱动设计初探

DDD 强调领域模型要兼顾业务和技术两个视角。 我们怎么用一套系统化的方法,抽丝剥茧、一步一步地把需求落实到代码呢?咱们看看下面这张图,它表示了领域驱动设计中的主要流程。 领域驱动设计主要的开发流程你可以看到,在整个开发流…...

C中AES_cbc_encrypt加密对应java中的解密

前言知识: 1.AES(Advanced Encryption Standard)高级加密标准,作为分组密码(把明文分成一组一组的,每组长度相等,每次加密一组数据,直到加密完整个明文)。 2.在AES标准…...

演化算法:乌鸦搜索算法 (Crow Search Algorithm)

前言 如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。 在机器学习中,我们所要优化的问题很多时候难以求导,因此通常会采用一些演化算法(又称零…...

基于open62541的OPC UA服务器和客户端开发技术

一、OPC UA的基本概念 1、OPC(OLE for Process Control),是一个工业标准,管理这个标准的国际组织是OPC基金会; 2、OPC通信结构:是指包含一个或多个OPC客户端与服务器相互通信的集合。以下是一个简单的流程图:标准的C/S结构。 3、OPC服务器:TOPC基金会定义了四种;...

测试测开面试要知道的那些事01

列表与元组的区别列表是动态数组,它们可变且可以重设长度(改变其内部元素的个数)。元组是静态数组,它们不可变,且其内部数据一旦创建便无法改变。元组缓存于Python运行时环境,这意味着我们每次使用元组时无…...

物联网毕设 -- 智能厨房监测系统(改)

前言 在家庭生活中,厨房是必不可少的,所以厨房的安全问题关乎着我们大家的生命,所以提出智能厨房监测系统,目的就是为我们减少不必要的安全问题 ⚠️⚠️(本文章仅提供思路和实现方法,并不包含代码&#x…...

macOS 13.3 Beta 3 (22E5236f)发布

系统介绍3 月 8 日消息,苹果今日向 Mac 电脑用户推送了 macOS 13.3 开发者预览版 Beta 3 更新(内部版本号:22E5236f),本次更新距离上次发布隔了 7 天。macOS Ventura 带来了台前调度、连续互通相机、FaceTime 通话接力…...

Failed to configure a DataSource: ‘url‘ attribute

一 完整的错误信息 *************************** APPLICATION FAILED TO START *************************** Description: Failed to configure a DataSource: url attribute is not specified and no embedded datasource could be configured. Reason: Failed to dete…...

Mysql高级——锁

锁 mysql锁的分类 从性能上分为:乐观锁、悲观锁从锁的粒度上分:行锁、间隙锁、页锁、悲观锁从对数据库的操作分类:读锁、写锁 乐观锁需要我们自己通过version字段来实现,如果更新失败则在代码中进行where重试。而我们常见的读锁…...

Spring的Async注解线程池扩展方案

目录- [Spring的Async注解线程池扩展方案]- [目录]- [1. 扩展目的]- [2. 扩展实现]- [2.1 扩展Async注解的执行拦截器AnnotationAsyncExecutionInterceptor]- [2.2 扩展Async注解的Spring代理顾问AsyncAnnotationAdvisor]- [2.3 扩展Async注解的 Spring Bean 后置处理器AsyncAn…...

linux arm系统烧录

1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 (忘了有没有这步了 估计有) 刷机程序 和 镜像 就不提供了。要刷的时…...

【论文笔记】若干矿井粉尘检测算法概述

总的来说,传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度,通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

【算法训练营Day07】字符串part1

文章目录 反转字符串反转字符串II替换数字 反转字符串 题目链接&#xff1a;344. 反转字符串 双指针法&#xff0c;两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

基于Docker Compose部署Java微服务项目

一. 创建根项目 根项目&#xff08;父项目&#xff09;主要用于依赖管理 一些需要注意的点&#xff1a; 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件&#xff0c;否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

在鸿蒙HarmonyOS 5中使用DevEco Studio实现录音机应用

1. 项目配置与权限设置 1.1 配置module.json5 {"module": {"requestPermissions": [{"name": "ohos.permission.MICROPHONE","reason": "录音需要麦克风权限"},{"name": "ohos.permission.WRITE…...

MySQL用户和授权

开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务&#xff1a; test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...

Java线上CPU飙高问题排查全指南

一、引言 在Java应用的线上运行环境中&#xff0c;CPU飙高是一个常见且棘手的性能问题。当系统出现CPU飙高时&#xff0c;通常会导致应用响应缓慢&#xff0c;甚至服务不可用&#xff0c;严重影响用户体验和业务运行。因此&#xff0c;掌握一套科学有效的CPU飙高问题排查方法&…...

无人机侦测与反制技术的进展与应用

国家电网无人机侦测与反制技术的进展与应用 引言 随着无人机&#xff08;无人驾驶飞行器&#xff0c;UAV&#xff09;技术的快速发展&#xff0c;其在商业、娱乐和军事领域的广泛应用带来了新的安全挑战。特别是对于关键基础设施如电力系统&#xff0c;无人机的“黑飞”&…...

如何应对敏捷转型中的团队阻力

应对敏捷转型中的团队阻力需要明确沟通敏捷转型目的、提升团队参与感、提供充分的培训与支持、逐步推进敏捷实践、建立清晰的奖励和反馈机制。其中&#xff0c;明确沟通敏捷转型目的尤为关键&#xff0c;团队成员只有清晰理解转型背后的原因和利益&#xff0c;才能降低对变化的…...

消息队列系统设计与实践全解析

文章目录 &#x1f680; 消息队列系统设计与实践全解析&#x1f50d; 一、消息队列选型1.1 业务场景匹配矩阵1.2 吞吐量/延迟/可靠性权衡&#x1f4a1; 权衡决策框架 1.3 运维复杂度评估&#x1f527; 运维成本降低策略 &#x1f3d7;️ 二、典型架构设计2.1 分布式事务最终一致…...