当前位置: 首页 > news >正文

告别Excel,免费大数据分析与可视化工具,让你的论文图表“高大上”

数据分析工具很多,可以分为表格数据库BI工具编程等四大工具。每个大类又有很多的工具,例如表格包括Excel、WPS、Google Sheets、Airtable等。编程工具包括Python和R。

搞科研几年了,笔者一直都是在使用Excel做数据分析和可视化,论文里也多用Excel生成的图表。笔者也学习过Matlab、Python、R,它们虽然功能强大,但是编程分析数据太花费时间了,效率偏低。

后来,笔者机缘巧合学习使用了微软的Power BI,让笔者对数据建模、数据分析、数据可视化有了更加清晰的认识,甚至改变了笔者做数据分析的思维,拓展了数据分析和可视化的方法,让笔者专注于数据分析而不是如何使用工具。

为什么选择Power BI

从数据中获取信息的最佳方式之一,就是数据可视化。对于数据分析来说,数据可视化既可以帮助提高分析效率,也能为报告锦上添花,是一项必不可少的技能。

做数据可视化,选对工具很重要。市场上数据可视化工具很多,好坏参差不齐,在了解过N多款数据可视化工具后,笔者总结了自己曾经使用过的3款比较常见数据分析和可视化工具!

1.Microsoft的Excel

Excel是很多人第一次接触数据分析和可视化的工具之一。

Excel太强大了,在不同人手里,它可以是数据库、可以是数据处理工具,甚至还可以是IDE。当然,我们也可以把Excel当成一款数据可视化工具。

用Excel,我们可以创建专业的数据透视表和基本的统计图表。Excel最大的特点就是简洁方便,它内置了较为全面的图表样式和丰富的设置选项,但操作逻辑都是极为简便易懂的,几乎不需要教程即可摸索掌握。

不过相比于后面介绍的工具,Excel只能算作一款数据可视化的入门级工具。一是因为它难以支撑大数据量的数据可视化,二是它内置的图表在样式、颜色、线条上都只能选默认的,更改自由度不够。

2.Python及第三方模块

Python数据分析常用的第三方模块包括:Pandas、Numpy、Scikit-learn,封装好的数据读取存储方法、常用统计计算方法和机器学习方法等,可以大幅提高用户的效率。

Python数据可视化相关的众多第三方模块中,可视化库(Matplotlib、Seaborn)是非常强大的。几乎覆盖了我们所有常用的图表工具。

而且作为数据分析师,ESP三件套(Excel+SQL+Python)都是基本功,学会Python绝对不亏。

(1)Matplotlib

Matplotlib是python中公认的数据可视化工具,通过Matplotlib,几行代码即可生成线图、直方图、功率谱、条形图、错误图、散点图等,还可以用一些MATLAB函数来更改控制行样式、字体属性、轴属性等。

(2)Seaborn

Seaborn是基于matplotlib产生的一个模块,专攻于统计可视化,可以和pandas进行无缝链接,使初学者更容易上手。相对于matplotlib,Seaborn语法更简洁,两者关系类似于numpy和pandas之间的关系。

Seaborn的可视化效果要比matplotlib更加高大上。其实,我们只需要掌握matplotlib和Seaborn中的一个模块就可以了,有需要再现学现用也来得及。

3. R语言

R是一门用于统计计算与作图的语言,但不仅仅是一门语言,它有数据计算与分析的环境,可以说是专门用于数据分析领域。入门R,不会很难,花几天时间学,可以掌握基本的数据结构和可视化,在实际解决问题的过程中,去寻找需要的R包,结合网络资料阅读使用技巧,基本就能应对。

R的特点是免费、开源。第三方的R包很多,但相应的第三方R包的质量也参差不齐,单机处理能力较弱。虽然入门不难,但作为一门语言,操作还是比较抽象。

笔者不太推荐R语言,因为R算是比较小众的语言,应用场景远不如Python广泛和流行。如果一定要学习一种编程语言实现数据分分析和可视化,那么笔者推荐Python及第三方模块,掌握Python,对于未来的职业发展也是大有裨益。

Power BI(商业数据分析工具)

虽然Power BI是商务数据分析工具,但是它的应用不仅仅是商务领域,很多领域都可以使用它,包括科研的数据分析和可视化。

如果只是为了做数据可视化,那么去学习一门语言有点得不偿失。用现成的数据分析和可视化工具,性价比会更高。

Excel是一个不错的选择,既然会使用Excel,那Power BI是更好的选择之一。Power BI可以用于处理大数据,使用起来也更加符合数据处理、分析、建模和可视化的工作,使你的工作流程更加直观和简化,仪表盘更加商业化。

笔者尤其喜欢Power BI的动态、交互报表,这可以非常生动地模拟数据演化过程,这对于一些分析工作非常有用。此外,Power BI也会涉及函数脚本,类似Excel,难度要比Python、Matlab简单很多。

例如,你能想象下面这张仪表盘是通过Power BI就可以简单拖拽实现的吗?这个图表是可以交互的吗?这写数据可以动态演化吗?

通过Power BI,我们可以把历史数据放在一个图表上,通过时间切片,控制不同时间点或者时间段的数据展现。再也不用粘贴那么多张图片到PPT里了。

写在最后

Power BI功能强大,笔者是亲身体会后(完成了一篇小论文),决定分享给大家,向大家推荐这个免费的工具做科研。Power BI并不复杂,有一定的Excel基础,学起来就会非常简单。Power BI的网上教程非常多,通过几个案例系统学习一下就能掌握了,笔者就不赘述了。总结一下,笔者推荐学习Python及第三方模块+Power BI

Power BI能够满足笔者的科研需求,未必满足你的科研需求,请大家调研了解后,在做决定,仅供参考!

Power BI 官方网址:

https://powerbi.microsoft.com/zh-cn/

相关文章:

告别Excel,免费大数据分析与可视化工具,让你的论文图表“高大上”

数据分析工具很多,可以分为表格、数据库、BI工具、编程等四大工具。每个大类又有很多的工具,例如表格包括Excel、WPS、Google Sheets、Airtable等。编程工具包括Python和R。 搞科研几年了,笔者一直都是在使用Excel做数据分析和可视化&#xf…...

C++ 中的继承和多态

C 中的继承和多态 一、继承二、函数重载、隐藏、覆盖、重写1.函数重载(Function Overload)2.函数隐藏(Function Hiding)3.函数重写与函数覆盖(Function Override) 三、多态四、纯虚函数和抽象类五、多重继承…...

NestedFormer:用于脑肿瘤分割的嵌套模态感知Transformer

文章目录 NestedFormer: Nested Modality-AwareTransformer for Brain Tumor Segmentation摘要方法Global Poolformer EncoderNested Modality-Aware Feature AggregationModality-Sensitive Gating 实验结果 NestedFormer: Nested Modality-AwareTransformer for Brain Tumor …...

【SQLServer】sqlserver数据库导入oracle

将sqlserver数据库导入到oracle 实用工具: SQL Server Management Studio 15.0.18424.0 SQL Server 管理对象 (SMO) 16.100.47021.07eef34a564af48c5b0cf0d617a65fd77f06c3eb1 Microsoft Analysis Services 客户端工具 15.0.19750.0 Microsoft 数据访问组件 (MDAC) …...

【5.20】四、性能测试—性能测试工具

目录 4.5 性能测试工具 4.5.1 LoadRunner 4.5.2 JMeter 4.5 性能测试工具 性能测试是软件测试中一个很重要的分支,人们为了提高性能测试的效率,开发出了很多性能测试工具。一款好的测试工具可以极大地提高测试效率,为发现软件缺陷提供重要…...

朗诵素材-《少年正是读书时》(两角色主持朗诵)

少年正是读书时 1、少年正是读书时 男:我们生活在/古老的土地上 男:我们拥有/共同的梦想 女:那朗朗的书声/那浓浓的墨香 女:都在告诉我们 合:少年正是/读书时 2、为何要读书 男:养心&am…...

凭借这个笔记,拿下8家大厂offer....

如何拿到多家大厂的offer,没有过硬的实力,就需要不断的学习。 我是如何拿到,阿里,腾讯,百度等八家大厂的offer的,今天我就给大家来分享我的秘密武器,阿里大神整理的包括,测试基础&am…...

介绍一下全链路压测平台的相关内容

随着互联网技术的不断发展,越来越多的企业开始依赖互联网来实现业务的发展和增长。而对于这些企业而言,如何保证他们的业务在高并发、高负载的情况下依然能够正常运行,是非常重要的一个问题。为了解决这个问题,企业可以使用全链路…...

对于无效的数据,该如何处理

一、无效数据的来源: 在进行数据管理时,无效数据是非常常见的问题。 无效数据可能来自于数据采集、输入错误、数据处理或存储错误等方面。 这些无效数据会对结果造成严重的影响,因此需要及时发现和处理。 二、处理无效数据: …...

港联证券:机器人行业有望迎来整体性机会 六氟磷酸锂翻倍上涨

表示,当前AI调整的时间空间已接近13年水位,且调整的促发因素有望缓和,后续可积极一些。一方面,13年三次调整时间在40日以内、幅度在15%以内。当前AI调整已持续1个月、幅度在10%以上,时空已接近历史。另一方面&#xff…...

css 伪类选择器 结构伪类

css 伪类选择器 结构伪类 常用的: :first-child 所有兄弟元素中的第一个 :last-child 所有兄弟元素中的最后一个 :nth-child(n) 所有兄弟元素中的第n个 :first-of-type 所有同类型兄弟元素中的第一个 :last-of-type 所有同类型兄弟元素中的最后一个 :nth-of-type(…...

常用的表格检测识别方法-表格区域检测方法(上)

常用的表格检测识别方法 表格检测识别一般分为三个子任务:表格区域检测、表格结构识别和表格内容识别。本章将围绕这三个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内国外的发展历史和最新进展,并提供几个先进…...

【运维知识进阶篇】集群架构-Rewrite重定向

Rewrite主要实现url地址重写,以及重定向,就是把传入web的请求重定向到其他url的过程。 分以下几种场景使用 1、地址跳转,用户访问一个URL,将其定向到另一个URL 2、协议跳转,用户通过http协议请求网站时,…...

JavaScript如何使用while循环

JavaScript 中的 while 循环是一种常用的循环结构,用于在满足一定条件时重复执行一段代码块。while 循环会先检查条件是否为真,如果为真,则执行循环体中的代码,然后再次检查条件。当条件变为假时,循环会结束。 while(…...

『MySQL 实战 45 讲』16 - “order by” 是怎么工作的

“order by” 是怎么工作的 首先创建一个表 CREATE TABLE t ( id int(11) NOT NULL, city varchar(16) NOT NULL, name varchar(16) NOT NULL, age int(11) NOT NULL, addr varchar(128) DEFAULT NULL, PRIMARY KEY (id), KEY city (city) ) ENGINEInnoDB;全字段排序 在 cit…...

怎么给移动硬盘查错?移动硬盘查错能恢复数据吗

移动硬盘在长期使用或使用不当的情况下,可能会出现硬盘文件损坏或者出现坏道等问题,影响数据安全和文件操作。这时候,移动硬盘查错工具就派上用场了。它可以帮助用户发现移动硬盘中的问题,并且还可以对移动硬盘进行修复。 但是&a…...

javaIO流之缓冲流

目录 简介1、字节缓冲流1.1构造方法1.2缓冲流的高效1.3为什么字节缓冲流会这么快?1.4byte & 0xFF 2、字符缓冲流2.1构造方法2.2字符缓冲流特有方法 3、练习 简介 Java 的缓冲流是对字节流和字符流的一种封装,通过在内存中开辟缓冲区来提高 I/O 操作…...

定义制造业操作(定义 MES/MOM 系统)

制造业操作包含众多工厂级活动,涉及设备(定义、使用、时间表和维护)、材料(识别、属性、位置和状态)、人员(资格、可用性和时间表),以及这些资源与包含其信息碎片的众多系统之间的互…...

人工智能专栏第二讲——人工智能的基础技术

目录 一、机器学习 二、深度学习 三、自然语言处理 四、计算机视觉 五、总结 在第一讲中,我们介绍了人工智能的概念和发展趋势&#...

注意!ChatGPT的Plus账号也会被封禁

文 / 高扬(微信公众号:量子论) 最近经常看到有人丢个截图,然后悲伤地说,ChatGPT账号被封了。 这不是账号被封,而是所用的代理节点被OpenAI封了,换个节点即可。 这个截图才是账号真正被封的提示&…...

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...

19c补丁后oracle属主变化,导致不能识别磁盘组

补丁后服务器重启,数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后,存在与用户组权限相关的问题。具体表现为,Oracle 实例的运行用户(oracle)和集…...

零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?

一、核心优势:专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发,是一款收费低廉但功能全面的Windows NAS工具,主打“无学习成本部署” 。与其他NAS软件相比,其优势在于: 无需硬件改造:将任意W…...

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架,支持"一次开发,多端部署",可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务,为旅游应用带来&#xf…...

Nuxt.js 中的路由配置详解

Nuxt.js 通过其内置的路由系统简化了应用的路由配置,使得开发者可以轻松地管理页面导航和 URL 结构。路由配置主要涉及页面组件的组织、动态路由的设置以及路由元信息的配置。 自动路由生成 Nuxt.js 会根据 pages 目录下的文件结构自动生成路由配置。每个文件都会对…...

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章 参考资料 源码: https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

听写流程自动化实践,轻量级教育辅助

随着智能教育工具的发展,越来越多的传统学习方式正在被数字化、自动化所优化。听写作为语文、英语等学科中重要的基础训练形式,也迎来了更高效的解决方案。 这是一款轻量但功能强大的听写辅助工具。它是基于本地词库与可选在线语音引擎构建,…...

【生成模型】视频生成论文调研

工作清单 上游应用方向:控制、速度、时长、高动态、多主体驱动 类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

【C++进阶篇】智能指针

C内存管理终极指南:智能指针从入门到源码剖析 一. 智能指针1.1 auto_ptr1.2 unique_ptr1.3 shared_ptr1.4 make_shared 二. 原理三. shared_ptr循环引用问题三. 线程安全问题四. 内存泄漏4.1 什么是内存泄漏4.2 危害4.3 避免内存泄漏 五. 最后 一. 智能指针 智能指…...

并发编程 - go版

1.并发编程基础概念 进程和线程 A. 进程是程序在操作系统中的一次执行过程,系统进行资源分配和调度的一个独立单位。B. 线程是进程的一个执行实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。C.一个进程可以创建和撤销多个线程;同一个进程中…...