告别Excel,免费大数据分析与可视化工具,让你的论文图表“高大上”
数据分析工具很多,可以分为表格、数据库、BI工具、编程等四大工具。每个大类又有很多的工具,例如表格包括Excel、WPS、Google Sheets、Airtable等。编程工具包括Python和R。

搞科研几年了,笔者一直都是在使用Excel做数据分析和可视化,论文里也多用Excel生成的图表。笔者也学习过Matlab、Python、R,它们虽然功能强大,但是编程分析数据太花费时间了,效率偏低。
后来,笔者机缘巧合学习使用了微软的Power BI,让笔者对数据建模、数据分析、数据可视化有了更加清晰的认识,甚至改变了笔者做数据分析的思维,拓展了数据分析和可视化的方法,让笔者专注于数据分析而不是如何使用工具。
为什么选择Power BI
从数据中获取信息的最佳方式之一,就是数据可视化。对于数据分析来说,数据可视化既可以帮助提高分析效率,也能为报告锦上添花,是一项必不可少的技能。
做数据可视化,选对工具很重要。市场上数据可视化工具很多,好坏参差不齐,在了解过N多款数据可视化工具后,笔者总结了自己曾经使用过的3款比较常见数据分析和可视化工具!
1.Microsoft的Excel
Excel是很多人第一次接触数据分析和可视化的工具之一。
Excel太强大了,在不同人手里,它可以是数据库、可以是数据处理工具,甚至还可以是IDE。当然,我们也可以把Excel当成一款数据可视化工具。
用Excel,我们可以创建专业的数据透视表和基本的统计图表。Excel最大的特点就是简洁方便,它内置了较为全面的图表样式和丰富的设置选项,但操作逻辑都是极为简便易懂的,几乎不需要教程即可摸索掌握。
不过相比于后面介绍的工具,Excel只能算作一款数据可视化的入门级工具。一是因为它难以支撑大数据量的数据可视化,二是它内置的图表在样式、颜色、线条上都只能选默认的,更改自由度不够。

2.Python及第三方模块
Python数据分析常用的第三方模块包括:Pandas、Numpy、Scikit-learn,封装好的数据读取存储方法、常用统计计算方法和机器学习方法等,可以大幅提高用户的效率。
Python数据可视化相关的众多第三方模块中,可视化库(Matplotlib、Seaborn)是非常强大的。几乎覆盖了我们所有常用的图表工具。
而且作为数据分析师,ESP三件套(Excel+SQL+Python)都是基本功,学会Python绝对不亏。
(1)Matplotlib
Matplotlib是python中公认的数据可视化工具,通过Matplotlib,几行代码即可生成线图、直方图、功率谱、条形图、错误图、散点图等,还可以用一些MATLAB函数来更改控制行样式、字体属性、轴属性等。

(2)Seaborn
Seaborn是基于matplotlib产生的一个模块,专攻于统计可视化,可以和pandas进行无缝链接,使初学者更容易上手。相对于matplotlib,Seaborn语法更简洁,两者关系类似于numpy和pandas之间的关系。
Seaborn的可视化效果要比matplotlib更加高大上。其实,我们只需要掌握matplotlib和Seaborn中的一个模块就可以了,有需要再现学现用也来得及。

3. R语言
R是一门用于统计计算与作图的语言,但不仅仅是一门语言,它有数据计算与分析的环境,可以说是专门用于数据分析领域。入门R,不会很难,花几天时间学,可以掌握基本的数据结构和可视化,在实际解决问题的过程中,去寻找需要的R包,结合网络资料阅读使用技巧,基本就能应对。
R的特点是免费、开源。第三方的R包很多,但相应的第三方R包的质量也参差不齐,单机处理能力较弱。虽然入门不难,但作为一门语言,操作还是比较抽象。
笔者不太推荐R语言,因为R算是比较小众的语言,应用场景远不如Python广泛和流行。如果一定要学习一种编程语言实现数据分分析和可视化,那么笔者推荐Python及第三方模块,掌握Python,对于未来的职业发展也是大有裨益。

Power BI(商业数据分析工具)
虽然Power BI是商务数据分析工具,但是它的应用不仅仅是商务领域,很多领域都可以使用它,包括科研的数据分析和可视化。
如果只是为了做数据可视化,那么去学习一门语言有点得不偿失。用现成的数据分析和可视化工具,性价比会更高。
Excel是一个不错的选择,既然会使用Excel,那Power BI是更好的选择之一。Power BI可以用于处理大数据,使用起来也更加符合数据处理、分析、建模和可视化的工作,使你的工作流程更加直观和简化,仪表盘更加商业化。
笔者尤其喜欢Power BI的动态、交互报表,这可以非常生动地模拟数据演化过程,这对于一些分析工作非常有用。此外,Power BI也会涉及函数脚本,类似Excel,难度要比Python、Matlab简单很多。
例如,你能想象下面这张仪表盘是通过Power BI就可以简单拖拽实现的吗?这个图表是可以交互的吗?这写数据可以动态演化吗?

通过Power BI,我们可以把历史数据放在一个图表上,通过时间切片,控制不同时间点或者时间段的数据展现。再也不用粘贴那么多张图片到PPT里了。
写在最后
Power BI功能强大,笔者是亲身体会后(完成了一篇小论文),决定分享给大家,向大家推荐这个免费的工具做科研。Power BI并不复杂,有一定的Excel基础,学起来就会非常简单。Power BI的网上教程非常多,通过几个案例系统学习一下就能掌握了,笔者就不赘述了。总结一下,笔者推荐学习Python及第三方模块+Power BI。
Power BI能够满足笔者的科研需求,未必满足你的科研需求,请大家调研了解后,在做决定,仅供参考!
Power BI 官方网址:
https://powerbi.microsoft.com/zh-cn/
相关文章:
告别Excel,免费大数据分析与可视化工具,让你的论文图表“高大上”
数据分析工具很多,可以分为表格、数据库、BI工具、编程等四大工具。每个大类又有很多的工具,例如表格包括Excel、WPS、Google Sheets、Airtable等。编程工具包括Python和R。 搞科研几年了,笔者一直都是在使用Excel做数据分析和可视化…...
C++ 中的继承和多态
C 中的继承和多态 一、继承二、函数重载、隐藏、覆盖、重写1.函数重载(Function Overload)2.函数隐藏(Function Hiding)3.函数重写与函数覆盖(Function Override) 三、多态四、纯虚函数和抽象类五、多重继承…...
NestedFormer:用于脑肿瘤分割的嵌套模态感知Transformer
文章目录 NestedFormer: Nested Modality-AwareTransformer for Brain Tumor Segmentation摘要方法Global Poolformer EncoderNested Modality-Aware Feature AggregationModality-Sensitive Gating 实验结果 NestedFormer: Nested Modality-AwareTransformer for Brain Tumor …...
【SQLServer】sqlserver数据库导入oracle
将sqlserver数据库导入到oracle 实用工具: SQL Server Management Studio 15.0.18424.0 SQL Server 管理对象 (SMO) 16.100.47021.07eef34a564af48c5b0cf0d617a65fd77f06c3eb1 Microsoft Analysis Services 客户端工具 15.0.19750.0 Microsoft 数据访问组件 (MDAC) …...
【5.20】四、性能测试—性能测试工具
目录 4.5 性能测试工具 4.5.1 LoadRunner 4.5.2 JMeter 4.5 性能测试工具 性能测试是软件测试中一个很重要的分支,人们为了提高性能测试的效率,开发出了很多性能测试工具。一款好的测试工具可以极大地提高测试效率,为发现软件缺陷提供重要…...
朗诵素材-《少年正是读书时》(两角色主持朗诵)
少年正是读书时 1、少年正是读书时 男:我们生活在/古老的土地上 男:我们拥有/共同的梦想 女:那朗朗的书声/那浓浓的墨香 女:都在告诉我们 合:少年正是/读书时 2、为何要读书 男:养心&am…...
凭借这个笔记,拿下8家大厂offer....
如何拿到多家大厂的offer,没有过硬的实力,就需要不断的学习。 我是如何拿到,阿里,腾讯,百度等八家大厂的offer的,今天我就给大家来分享我的秘密武器,阿里大神整理的包括,测试基础&am…...
介绍一下全链路压测平台的相关内容
随着互联网技术的不断发展,越来越多的企业开始依赖互联网来实现业务的发展和增长。而对于这些企业而言,如何保证他们的业务在高并发、高负载的情况下依然能够正常运行,是非常重要的一个问题。为了解决这个问题,企业可以使用全链路…...
对于无效的数据,该如何处理
一、无效数据的来源: 在进行数据管理时,无效数据是非常常见的问题。 无效数据可能来自于数据采集、输入错误、数据处理或存储错误等方面。 这些无效数据会对结果造成严重的影响,因此需要及时发现和处理。 二、处理无效数据: …...
港联证券:机器人行业有望迎来整体性机会 六氟磷酸锂翻倍上涨
表示,当前AI调整的时间空间已接近13年水位,且调整的促发因素有望缓和,后续可积极一些。一方面,13年三次调整时间在40日以内、幅度在15%以内。当前AI调整已持续1个月、幅度在10%以上,时空已接近历史。另一方面ÿ…...
css 伪类选择器 结构伪类
css 伪类选择器 结构伪类 常用的: :first-child 所有兄弟元素中的第一个 :last-child 所有兄弟元素中的最后一个 :nth-child(n) 所有兄弟元素中的第n个 :first-of-type 所有同类型兄弟元素中的第一个 :last-of-type 所有同类型兄弟元素中的最后一个 :nth-of-type(…...
常用的表格检测识别方法-表格区域检测方法(上)
常用的表格检测识别方法 表格检测识别一般分为三个子任务:表格区域检测、表格结构识别和表格内容识别。本章将围绕这三个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内国外的发展历史和最新进展,并提供几个先进…...
【运维知识进阶篇】集群架构-Rewrite重定向
Rewrite主要实现url地址重写,以及重定向,就是把传入web的请求重定向到其他url的过程。 分以下几种场景使用 1、地址跳转,用户访问一个URL,将其定向到另一个URL 2、协议跳转,用户通过http协议请求网站时,…...
JavaScript如何使用while循环
JavaScript 中的 while 循环是一种常用的循环结构,用于在满足一定条件时重复执行一段代码块。while 循环会先检查条件是否为真,如果为真,则执行循环体中的代码,然后再次检查条件。当条件变为假时,循环会结束。 while(…...
『MySQL 实战 45 讲』16 - “order by” 是怎么工作的
“order by” 是怎么工作的 首先创建一个表 CREATE TABLE t ( id int(11) NOT NULL, city varchar(16) NOT NULL, name varchar(16) NOT NULL, age int(11) NOT NULL, addr varchar(128) DEFAULT NULL, PRIMARY KEY (id), KEY city (city) ) ENGINEInnoDB;全字段排序 在 cit…...
怎么给移动硬盘查错?移动硬盘查错能恢复数据吗
移动硬盘在长期使用或使用不当的情况下,可能会出现硬盘文件损坏或者出现坏道等问题,影响数据安全和文件操作。这时候,移动硬盘查错工具就派上用场了。它可以帮助用户发现移动硬盘中的问题,并且还可以对移动硬盘进行修复。 但是&a…...
javaIO流之缓冲流
目录 简介1、字节缓冲流1.1构造方法1.2缓冲流的高效1.3为什么字节缓冲流会这么快?1.4byte & 0xFF 2、字符缓冲流2.1构造方法2.2字符缓冲流特有方法 3、练习 简介 Java 的缓冲流是对字节流和字符流的一种封装,通过在内存中开辟缓冲区来提高 I/O 操作…...
定义制造业操作(定义 MES/MOM 系统)
制造业操作包含众多工厂级活动,涉及设备(定义、使用、时间表和维护)、材料(识别、属性、位置和状态)、人员(资格、可用性和时间表),以及这些资源与包含其信息碎片的众多系统之间的互…...
人工智能专栏第二讲——人工智能的基础技术
目录 一、机器学习 二、深度学习 三、自然语言处理 四、计算机视觉 五、总结 在第一讲中,我们介绍了人工智能的概念和发展趋势&#...
注意!ChatGPT的Plus账号也会被封禁
文 / 高扬(微信公众号:量子论) 最近经常看到有人丢个截图,然后悲伤地说,ChatGPT账号被封了。 这不是账号被封,而是所用的代理节点被OpenAI封了,换个节点即可。 这个截图才是账号真正被封的提示&…...
系统设计 --- MongoDB亿级数据查询优化策略
系统设计 --- MongoDB亿级数据查询分表策略 背景Solution --- 分表 背景 使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log,共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题,不能使用ELK只能使用…...
跨链模式:多链互操作架构与性能扩展方案
跨链模式:多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈:模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展(H2Cross架构): 适配层…...
【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分
一、项目背景回顾 前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。 本弹重点聚焦于服务端的模块划分与架构设计,提升代码结构的可维护性与扩展性。 二、服务端模块设计目标 高内聚低耦合:各模块职责清晰,便于独立开发…...
脑机新手指南(七):OpenBCI_GUI:从环境搭建到数据可视化(上)
一、OpenBCI_GUI 项目概述 (一)项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台,其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言,首次接触 OpenBCI 设备时,往…...
Mac flutter环境搭建
一、下载flutter sdk 制作 Android 应用 | Flutter 中文文档 - Flutter 中文开发者网站 - Flutter 1、查看mac电脑处理器选择sdk 2、解压 unzip ~/Downloads/flutter_macos_arm64_3.32.2-stable.zip \ -d ~/development/ 3、添加环境变量 命令行打开配置环境变量文件 ope…...
C#最佳实践:为何优先使用as或is而非强制转换
C#最佳实践:为何优先使用as或is而非强制转换 在 C# 的编程世界里,类型转换是我们经常会遇到的操作。就像在现实生活中,我们可能需要把不同形状的物品重新整理归类一样,在代码里,我们也常常需要将一个数据类型转换为另…...
ABAP设计模式之---“Tell, Don’t Ask原则”
“Tell, Don’t Ask”是一种重要的面向对象编程设计原则,它强调的是对象之间如何有效地交流和协作。 1. 什么是 Tell, Don’t Ask 原则? 这个原则的核心思想是: “告诉一个对象该做什么,而不是询问一个对象的状态再对它作出决策。…...
day51 python CBAM注意力
目录 一、CBAM 模块简介 二、CBAM 模块的实现 (一)通道注意力模块 (二)空间注意力模块 (三)CBAM 模块的组合 三、CBAM 模块的特性 四、CBAM 模块在 CNN 中的应用 一、CBAM 模块简介 在之前的探索中…...
Linux--vsFTP配置篇
一、vsFTP 简介 vsftpd(Very Secure FTP Daemon)是 Linux 下常用的 FTP 服务程序,具有安全性高、效率高和稳定性好等特点。支持匿名访问、本地用户登录、虚拟用户等多种认证方式,并可灵活控制权限。 二、安装与启动 1. 检查是否已…...
Clickhouse统计指定表中各字段的空值、空字符串或零值比例
下面是一段Clickhouse SQL代码,用于统计指定数据库中多张表的字段空值情况。代码通过动态生成查询语句实现自动化统计,处理逻辑如下: 从系统表获取指定数据库(替换your_database)中所有表的字段元数据根据字段类型动态…...
