一般用哪些工具做大数据可视化分析?
做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少!
这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图类、快速出图类、词云生成类、综合分析类5大类。个人经验,大家按需采纳:
01 纯统计图表类——简道云
可视化模板>>https://www.jiandaoyun.com
适用群体:更适合职场各种业务端的数据分析,可在线使用,替代Excel偷懒的神器!
这是一款我用了4年多的数据分析偷懒神器,模板一共提供10+基础数据分析图表,一般业务上的数据分析我用它就够了。
可以先看看效果:
像上面这种数据看板,放在excel里面做起来是很复杂的,但用简道云做可视化看板,就能轻松达到四两拨千斤的效果。
示例:
导入简道云>新建仪表盘>点击数据组件-统计表>添加刚刚的表格数据-订单管理
比如:想要在仪表盘中显示“订单总额”,即把“订单总额”字段拉入指标处,选择图标类型即可。
制作完成之后的可视化看板如下图:
我选择用它来做业务数据分析的另一个重要原因是——它能做的不止数据分析图表,基本上能够高效辅助完成所有业务数据的收集、处理、分析、展示、以及流程管理:
- 可以用它的在线表单来做数据收集
- 收集好的数据可以导入数据工厂自动处理分析
- 处理好的数据可以生成各种分析图表
- 流程引擎能够配合做好各业务环节之间的流转
- ......
不足:由于简道云本身就是偏向企业层面的,所以更适合一些偏业务端的数据分析。如果是想要做一些非常专业复杂的数据分析大屏,它是不如哪些专业做数据大屏的工具的。
02 CIS地图可视化类——QGIS
官网>>https://www.qgis.org/en/site/
适用于:适合想做专业地图可视化的伙伴,并且需要有一定的编程基础。
QGIS是我目前使用最多的GIS软件,免费、跨平台,不仅可以做各种分析,还可以制作各种漂亮的可视化地图,比如可以做这种非常炫酷的图表:
具体图表制作上稍微有些复杂,需要先安装QGIS(可在 linux、unix、mac 和 windows 上运行)并上传底图。
内容列表中有很多图层,在 QGIS 画布中能看到各式各样的世界地图,语言是可以设置为中文的,你用担心自己看不懂。
不会设计的也可以看他们官方的帮助文档,非常详细,入门的话完全足够了,如果还不会的话也有很多平台会针对QGIS发布一些教程,可以自己去搜搜。
不足:地图制作功能非常繁琐,这也是很多人不愿意用QGIS的原因,虽然它功能很强大但对于初学者来说太复杂了,劝退了很多人。
03 快速出图类——datawrapper
https://www.datawrapper.de/
适合自媒体快速出图、操作简单、开源、免费
datawrapper创建之初是为了服务一些新闻网站和报纸媒体的,尤其是金融媒体,需要用到非常多的可视化图表,而datawrapper的优势就在于能够在几分钟内就制作出一些简单、正确和可嵌入的图片。
注意:制作图表前要先将数据放到google文档里,然后在软件里导入Google文档。
比如下面的示例,先添加新的图表输入google文档地址
第二步是检查和调整数据,可以在这一步进行数据的删减、查询等。
第三步就是选择图表,datawrapper提供了非常多的图表模板,这里就用分列横向柱状图吧
第四步就可以生成图表,也可以生成分享链接,上传到平台上让更多人看到。
整个过程几乎不怎么费时间,缺点是外文工具,没有汉化版。
04 词云生成类——wordsift
官网>>https://wordsift.org/
适用于:适用于需要经常做各种词云生成、分析的伙伴,比较方便快捷
这是我用的比较多的一款词云生成类工具类,使用起来很方便,没有那些繁琐的步骤,而且页面很简洁,在我这里是上大分了!!
比如需要提取一段话里面的热点词汇,复制一段,然后点击Sift,这里示例我就直接用工具内置的词包了,是可以生成中文词云的哈!
就会自动生成一个词云图,可以选择自己喜欢的词云格式,也可以选择单词是怎么分的,比如从A-Z,正序还是倒序等等。
右上角分别是:刷新,放大和设置按钮,可以点开设置Scale为三种类别,如果频次相差太大,可以进行log,如果不大,可以选择n即可。
同时下方的角度from角度to角度,可以设置词汇的倾斜角度。Front可以设置字体,Colorset可以设置颜色为一个三色系或者同一个颜色的不同深浅。
最下面就是图片的下载,做好之后可以自行下载图片。
可以点击图中的单词,看到词汇出现的频次,最下面是这个单词在文中出现了几处以及地方。当然,你也可以点击文本可视化,这样,软件会对文本进行一个数据统计,右侧是统计的数据
不足:这个网站有个bug,有的时候不能下载图片,大家只能通过截图保存了,这也是唯一的缺点,说不定过阵子就好了。
05 综合可视化分析类——Tableau
https://www.tableau.com/
优点:OLAP功能强大、支持网页集成、学习难度适中
世界知名的BI工具,以超强的可视化能力著称。它已经成为商业BI界的TOP选手,很多大型公司像阿里、谷歌都在使用,能快速搭建数据系统。
打开Tableau,点击工作表,可以看到以下界面:
- 1) 功能区-作图过程需要使用的工具
- 2) 画布-展示图形的看板
- 3) 页选项卡-可添加或删除多页与切换数据源 工作表 仪表板不同页面
- 4) 筛选器-可筛选数据字段
- 5) “可视化效果”窗格-根据需要选择不同的图形
- 6) 搜索表格字段等
可以通过设置页面动画,来制作动态可视化图表,比如这种:
不足:tableau对计算机的硬件要求比较高(不止一次卡死过),而且需要有些可视化功能需要收费。
分享结束,如果有更好的工具推荐,欢迎一起交流讨论!
相关文章:

一般用哪些工具做大数据可视化分析?
做数据分析这些年来,从刚开始的死磕excel,到现在成为数据分析行业的偷懒大户,使用过的工具还真不少! 这篇分享一些我在可视化工具上的使用心得,由简单到复杂,按照可视化类型一共分为纯统计图表类、GIS地图…...

Python每日一练(20230308)
目录 1. Excel表列名称 ★ 2. 同构字符串 ★★ 3. 分割回文串 II ★★★ 🌟 每日一练刷题专栏 C/C 每日一练 专栏 Python 每日一练 专栏 1. Excel表列名称 给你一个整数 columnNumber ,返回它在 Excel 表中相对应的列名称。 例如࿱…...

jvm之堆解读
堆(Heap)的核心概述 堆针对一个JVM进程来说是唯一的,也就是一个进程只有一个JVM,但是进程包含多个线程,他们是共享同一堆空间的。 一个JVM实例只存在一个堆内存,堆也是Java内存管理的核心区域。 Java堆区…...

重构·改善既有代码的设计.02
前言之前在《重构改善既有代码的设计.01》中初步了解了重构的基本前提,基础原则等入门知识。今天我们继续第二更......识别代码的坏味道Duplicated Code 重复代码。最单纯的Duplicated Code就是“同一个类中含有相同的表达式”或“两个互为兄弟的子类内含有相同表达…...
脑电信号处理总成
目录一. EEG(脑电图)1.1 脑波1.2 伪迹1.2.1 眼动伪迹1.2.2 肌电伪迹1.2.3 运动伪迹1.2.4 心电伪迹1.2.5 血管波伪迹1.2.6 50Hz和静电干扰1.3 伪迹去除方法1.3.1 避免伪迹产生法1.3.2 直接移除法1.3.3 伪迹消除法一. EEG(脑电图) 1.1 脑波 脑波(英语:br…...

判断推理之图形推理
考点一动态位置变化(一)平移1.特征:图形在平面上的移动,图形本身的大小和形状不发生改变。2.方向:直线(上下、左右、斜对角线),绕圈(顺时针、逆时针)3.距离&a…...

【预告】ORACLE Unifier v22.12 虚拟机发布
引言 离ORACLE Primavera Unifier 最新系统 v22.12已过去了3个多月,应盆友需要,也为方便大家体验,我近日将构建最新的Unifier的虚拟环境,届时将分享给大家,最终可通过VMWare vsphere (esxi) / workstation 或Oracle …...

Sql执行流程与Redo log、 Undo log、 Bin log日志文件
文章目录Sql执行流程与日志文件Sql的执行流程Redo LogBin logUndo logSql执行流程与日志文件 Sql的执行流程 mysql的内部组件结构如下图所示 连接器 与客户端建立连接,检验登录密码,分配相应权限 查询缓存 执行sql语句时会先从这里找一下,…...

如何提高软件测试执行力
高效的测试执行力 不管在哪个行业,高校的执行力都是不可或缺的。在软件测试行业更是这样。有些测试人员,很勤奋也很吃苦,但是可能最终不能很好的完成测试任务。究其原因就是一个测试执行力的问题。 高效执行就是有目标,有计划&…...
Open3D 计算点到平面的距离
目录 一、算法原理二、代码实现三、结果展示一、算法原理 平面外一点 ( x 1 , y 1 , z 1 ) (x_1,y_1,z_1) (x...

DDD领域驱动设计初探
DDD 强调领域模型要兼顾业务和技术两个视角。 我们怎么用一套系统化的方法,抽丝剥茧、一步一步地把需求落实到代码呢?咱们看看下面这张图,它表示了领域驱动设计中的主要流程。 领域驱动设计主要的开发流程你可以看到,在整个开发流…...

C中AES_cbc_encrypt加密对应java中的解密
前言知识: 1.AES(Advanced Encryption Standard)高级加密标准,作为分组密码(把明文分成一组一组的,每组长度相等,每次加密一组数据,直到加密完整个明文)。 2.在AES标准…...

演化算法:乌鸦搜索算法 (Crow Search Algorithm)
前言 如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。 在机器学习中,我们所要优化的问题很多时候难以求导,因此通常会采用一些演化算法(又称零…...

基于open62541的OPC UA服务器和客户端开发技术
一、OPC UA的基本概念 1、OPC(OLE for Process Control),是一个工业标准,管理这个标准的国际组织是OPC基金会; 2、OPC通信结构:是指包含一个或多个OPC客户端与服务器相互通信的集合。以下是一个简单的流程图:标准的C/S结构。 3、OPC服务器:TOPC基金会定义了四种;...

测试测开面试要知道的那些事01
列表与元组的区别列表是动态数组,它们可变且可以重设长度(改变其内部元素的个数)。元组是静态数组,它们不可变,且其内部数据一旦创建便无法改变。元组缓存于Python运行时环境,这意味着我们每次使用元组时无…...

物联网毕设 -- 智能厨房监测系统(改)
前言 在家庭生活中,厨房是必不可少的,所以厨房的安全问题关乎着我们大家的生命,所以提出智能厨房监测系统,目的就是为我们减少不必要的安全问题 ⚠️⚠️(本文章仅提供思路和实现方法,并不包含代码&#x…...

macOS 13.3 Beta 3 (22E5236f)发布
系统介绍3 月 8 日消息,苹果今日向 Mac 电脑用户推送了 macOS 13.3 开发者预览版 Beta 3 更新(内部版本号:22E5236f),本次更新距离上次发布隔了 7 天。macOS Ventura 带来了台前调度、连续互通相机、FaceTime 通话接力…...
Failed to configure a DataSource: ‘url‘ attribute
一 完整的错误信息 *************************** APPLICATION FAILED TO START *************************** Description: Failed to configure a DataSource: url attribute is not specified and no embedded datasource could be configured. Reason: Failed to dete…...
Mysql高级——锁
锁 mysql锁的分类 从性能上分为:乐观锁、悲观锁从锁的粒度上分:行锁、间隙锁、页锁、悲观锁从对数据库的操作分类:读锁、写锁 乐观锁需要我们自己通过version字段来实现,如果更新失败则在代码中进行where重试。而我们常见的读锁…...

Spring的Async注解线程池扩展方案
目录- [Spring的Async注解线程池扩展方案]- [目录]- [1. 扩展目的]- [2. 扩展实现]- [2.1 扩展Async注解的执行拦截器AnnotationAsyncExecutionInterceptor]- [2.2 扩展Async注解的Spring代理顾问AsyncAnnotationAdvisor]- [2.3 扩展Async注解的 Spring Bean 后置处理器AsyncAn…...

linux arm系统烧录
1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 (忘了有没有这步了 估计有) 刷机程序 和 镜像 就不提供了。要刷的时…...
【论文笔记】若干矿井粉尘检测算法概述
总的来说,传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度,通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...
【算法训练营Day07】字符串part1
文章目录 反转字符串反转字符串II替换数字 反转字符串 题目链接:344. 反转字符串 双指针法,两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

基于Docker Compose部署Java微服务项目
一. 创建根项目 根项目(父项目)主要用于依赖管理 一些需要注意的点: 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件,否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...
在鸿蒙HarmonyOS 5中使用DevEco Studio实现录音机应用
1. 项目配置与权限设置 1.1 配置module.json5 {"module": {"requestPermissions": [{"name": "ohos.permission.MICROPHONE","reason": "录音需要麦克风权限"},{"name": "ohos.permission.WRITE…...
MySQL用户和授权
开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务: test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...
Java线上CPU飙高问题排查全指南
一、引言 在Java应用的线上运行环境中,CPU飙高是一个常见且棘手的性能问题。当系统出现CPU飙高时,通常会导致应用响应缓慢,甚至服务不可用,严重影响用户体验和业务运行。因此,掌握一套科学有效的CPU飙高问题排查方法&…...

无人机侦测与反制技术的进展与应用
国家电网无人机侦测与反制技术的进展与应用 引言 随着无人机(无人驾驶飞行器,UAV)技术的快速发展,其在商业、娱乐和军事领域的广泛应用带来了新的安全挑战。特别是对于关键基础设施如电力系统,无人机的“黑飞”&…...

如何应对敏捷转型中的团队阻力
应对敏捷转型中的团队阻力需要明确沟通敏捷转型目的、提升团队参与感、提供充分的培训与支持、逐步推进敏捷实践、建立清晰的奖励和反馈机制。其中,明确沟通敏捷转型目的尤为关键,团队成员只有清晰理解转型背后的原因和利益,才能降低对变化的…...

消息队列系统设计与实践全解析
文章目录 🚀 消息队列系统设计与实践全解析🔍 一、消息队列选型1.1 业务场景匹配矩阵1.2 吞吐量/延迟/可靠性权衡💡 权衡决策框架 1.3 运维复杂度评估🔧 运维成本降低策略 🏗️ 二、典型架构设计2.1 分布式事务最终一致…...