当前位置: 首页 > article >正文

数据分析实战2(Tableau)

1、Tableau功能

数据赋能(让业务一线也可以轻松使用最新数据)

  • 分析师可以直接将数据看板发布到线上
  • 自动更新看板
  • 自由下载数据
  • 线上修改图表
  • 邮箱发送数据
  • 设置数据预警

数据探索(通过统计分析和数据可视化,从数据发现问题,用数据验证假设)

  • 支持亿级数据的连接和处理
  • 自由地对字段进行各种计算
  • 拖拽就可以轻松制作图表
  • 数据可以随意聚合下钻
  • 图表类型可以灵活转换
  • 内置算法智能建模

2、下载安装

下载网址:https://www.tableau.com/zh-cn/products/public/download

3、数据连接

①连接类型

  • 本地文件
    • csv数据连接到文本
    • xls/xlsx连接到Excel
    • json直接连接到json
  • 数据库
    • 下载数据库对应的驱动后,填写地址等参数连接到对应数据库

②连接方式

  • 默认使用智能连接,只需选择连接所用的数据字段即可
  • 连接所用的字段可以通过函数进行计算和编辑
  • 表格之间的连接原理
  • 课程操作 

③提取方式

  • 实时
    • 每次计算都会连接一次数据库进行取数运算
    • 这是因为Tableau的本质是Vizql查询语言,每做一个操作就查询一次是可以实现的不过在数据量级较大的情况下就会比较慢了
  • 数据提取
    • 将当前连接所涉及的数据全部都查询提取到hyper格式的数据提取(相当于Tableau自己的数据库和对应类型的文件)
    • 如果保存为twbx格式,hyper会自动打包进twbx,使tableau自带数据
    • 缺点是每次修改完数据源都要重新提取一遍数据,如果是实时,则不需要先提取,等你作图时他才会再提取
    • 如果要将Tableau上传到Sever服务器,则必须使用提取的数据连接方式
    • 其实大量级数据都要用数据提取,除了修改连接键,其他操作在工作表的视图界面都能操作

④提取选项

  • 如果选择数据提取,Tableau还支持对表格进行基于字段和函数的增量刷新,提升数据提取的性能,但百万级以下的数据,除非频繁提取,否则一般不需要这样操作

⑤连接筛选

  • 可以在提取数据后进行预筛选,只保留筛选后的数据进行视图操作保存类型
  • twb不包含数据
  • twbx内置数据到tableau的文件中点提取但是还没保存时,tableau会让你先保存提取的数据数据处理
  • 可以查看数据,进行排序、重命名、拆分等操作,这些操作在做图界面也可以完成

⑥理解本次课程的数据

  • shop表有2385行
  • cpc表有1177行
  • orders表有4419行

4、数据可视化原理

人是可视化动物,看图比看数据快

①2类型:

  • 度量:映射图形
    • 可映射的图形类型
      • 位置
      • 长度
      • 角度
      • 方向
      • 形状
      • 面积和体积
      • 颜色和深浅
  • 维度:负责区分

②将数据变成图表

  • 对【度量】和【维度】进行拖拽操作,从而完成可视化图标的制作,是被称作Tableau第一概念,是最重要的知识。(!!智能推荐不算作图)
    • 行:纵坐标
    • 列:横坐标

  • 离散形成标签,连续形成数轴

③5个知识点总结

  • 度量默认聚合
  • 度量值会形成图形标记,图形标记可以切换
  • 维度会对度量值进行区分,增加度量值的信息密度(单个图标传达信息的多少)
  • 图标分为有轴图标和无轴图表(极坐标图表)
  • 离散形成标签,连续形成数轴

④基础图标制作

堆积图:

折线图:

面积图:

5、数据可视化原则、BI仪表盘搭建

(1)数据可视化原则

  • 区分用户
  • 主次分明、详略得当
    • 强调信息的方式有很多种,用恰当的方式去强调恰当的内容
  • 真实准确:数据要从0开始
  • 符合大众的认知和审美
  • 适度原则
    • 颜色不超过8种
    • 排版、字体、大小、形状等都要合适
    • 避免使用3d效果,容易产生错觉
  • 五秒原则(5秒能看懂)
  • 恰到好处的说明(说明:标题、图例、标注等)
  • 少即是多
  • 可视化案例

(2)BI仪表盘搭建

①仪表盘搭建原则

  • 符合业务的阅读、思考、操作逻辑

②明确仪表盘主题

观众是谁,他们对什么感兴趣

  • 普通业务人员(跟业务相关的数据)
    • 销售:注册—激活—成交
    • 投放:消耗—转化率
    • 运维:搬车数—换电数
  • 中层管理者
    • 整体的总体报告
      • 业务整体的绝对值、达成率、同比环比;
      • 有哪些数据异常、优秀表现
    • 各个维度的数据
      • 各个业务动作的绝对值、达成率、同比环比
      • 数据异常的具体原因
  • 高层管理者
    • 整体的总结报告
      • 业务整体的绝对值、达成率、同比环比;
      • 有哪些数据异常、优秀表现
  • 用人单位
    • 有一个明确的分析主题
    • 分析维度越多越好
    • 图标越高级越好

课程数据可发挥的主题

  • 每日营收情况
  • 无效订单与配送距离的关系
  • 用户下单时间分布
  • 用户客单价变化
  • cpc投放效果

③仪表盘主题拆解

  • 怎样的数据能表达清楚想说的主题?
    • 这个主题涉及到哪些数据?
    • 数据的重要程度是否相同?
    • 最适合数据的图表是那种?
      • 对比
        • 绝对值对比——条形图/柱状图
      • 变化
        • 没有累计关系——折线图+柱状图
        • 有累计关系——面积图/堆积图
      • 构成
        • 对象少于3个——环形图
        • 对象大于3个——树地图
      • 分布
        • 单变量分布——直方图
        • 多变量分布——散点图、气泡图
  • 以每日营收情况主题为例
    • 关键数据
      • 营收数据
        • GMV
        • 商家实收
        • 用户实付
        • 总订单数
        • cpc总费用
        • 各平台数据对比
      • 流量数据
        • 曝光人数
        • 进店人数
        • 下单人数
        • 进店转化率
        • 下单转化率
        • 新客数
        • 老客数
        • 复购率
    • 数据排序
      • 营收>投放>流量
    • 图表选择
      • 经营情况总览:突出显示的文字
      • 经营数据详情:表格
      • 每日营收数据:多轴折线图
      • 每日流量数据:双轴组合图
      • 新老客占比:环形图
      • 平台占比:环形图
      • 门店排名:条形图
      • 投放情况:散点图

④开发设计工作表

  • 经营情况总览:突出显示的文字
  • 经营数据详情:表格
  • 每日营收数据:多轴折线图
  • 每日流量数据:双轴组合图
  • 新老客占比:环形图
  • 平台占比:环形图
  • 门店排名:条形图
  • 投放情况:散点图

⑤构思仪表盘布局

⑥加“亿点点”细节

相关文章:

数据分析实战2(Tableau)

1、Tableau功能 数据赋能(让业务一线也可以轻松使用最新数据) 分析师可以直接将数据看板发布到线上自动更新看板自由下载数据线上修改图表邮箱发送数据设置数据预警 数据探索(通过统计分析和数据可视化,从数据发现问题&#xf…...

游戏开发中的CI/CD优化案例:知名游戏公司Gearbox使用TeamCity简化CI/CD流程

案例背景 关于Gearbox: Gearbox 是一家美国电子游戏公司,总部位于德克萨斯州弗里斯科,靠近达拉斯。Gearbox 成立于1999年,推出过多款史上最具代表性的视频游戏,包括《半衰期》、《战火兄弟连》以及《无主之地》。 团队…...

Linux --TCP协议实现简单的网络通信(中英翻译)

一、什么是TCP协议 1.1 、TCP是传输层的协议,TCP需要连接,TCP是一种可靠性传输协议,TCP是面向字节流的传输协议; 二、TCPserver端的搭建 2.1、我们最终好实现的效果是 客户端在任何时候都能连接到服务端,然后向服务…...

LlamaIndex 工作流简介以及基础工作流

什么是工作流? 工作流是一种由事件驱动、基于步骤的应用程序执行流程控制方式。 你的应用程序被划分为多个称为“步骤(Steps)”的部分,这些步骤由“事件(Events)”触发,并且它们自身也会发出事…...

如何利用Elastic Stack(ELK)进行安全日志分析

在以下文章中,我将解释如何使用Elastic Stack(ELK)进行安全日志分析,以提高安全性和监控网络活动。ELK是一个功能强大的开源日志管理和分析平台,由Elasticsearch、Logstash和Kibana组成,适用于各种用例&…...

创客匠人:以 AI 利器赋能创始人 IP 打造,加速知识变现新路径

在知识付费与个人 IP 崛起的时代,创客匠人作为行业领先的技术服务商,正通过 AI 工具重构创始人 IP 打造与知识变现的生态。其推出的三大 AI 利器 ——AI 销售信、免训数字人、AI 智能客服,精准解决 IP 运营中的核心痛点。 以 AI 销售信为例&…...

Opencv中的copyto函数

一.OpenCV中copyto函数详解 copyto()是 OpenCV 中用于图像复制和融合的核心函数,支持灵活的数据复制和掩模(Mask)操作,其功能和使用方法如下: 1. 核心功能 基础复制:将源图像&…...

TeamCity Agent 配置完整教程(配合 Docker Compose 快速部署)

在《使用 Docker Compose 从零部署 TeamCity PostgreSQL(详细新手教程)》中,我们成功部署了 TeamCity Server 和数据库服务。但要真正运行构建任务,还需要至少一个 Build Agent(构建代理)。 本教程将继续…...

基于深度强化学习的Scrapy-Redis分布式爬虫动态调度策略研究

在大数据时代,网络数据的采集与分析变得至关重要,分布式爬虫作为高效获取海量数据的工具,被广泛应用于各类场景。然而,传统的爬虫调度策略在面对复杂多变的网络环境和动态的抓取需求时,往往存在效率低下、资源浪费等问…...

在 Ubuntu 24.04 LTS 上安装 Jenkins 并配置全局工具(Git、JDK、Maven)

在 Ubuntu 24.04 LTS 上安装 Jenkins 并配置全局工具(Git、JDK、Maven) Jenkins 是一款开源的持续集成和持续交付(CI/CD)工具,在 DevOps 实践中有着广泛的应用。本文将手把手带你在 Ubuntu 24.04 LTS 系统中完成 Jenkins 的安装,并配置所需的全局工具:Git、JDK 和 Maven…...

Tika Server:企业级文档内容解析的轻量级服务化方案

目录 Tika Server:企业级文档内容解析的轻量级服务化方案 一、什么是 Tika Server? 二、Tika Server 的功能特点 1. 多种文档格式支持 2. 提取结构化信息 3. RESTful 接口设计 三、是否开源?是否支持私有化部署? 四、部署…...

LMG1020YFFR 电子元器件详解

LMG1020YFFR 电子元器件详解 基本概述 LMG1020YFFR是德州仪器(TI)生产的一款高性能、低侧栅极驱动器,属于其GaN(氮化镓)功率器件驱动产品系列。 主要功能特性 驱动能力: 峰值输出电流:5A/-5A 可驱动GaN FETs、SiC MOSFETs和高速硅MOSFETs…...

防爆型断链保护器的应用场景有哪些?

​ ​防爆型断链保护器是一种用于防止链条断裂导致设备损坏或安全事故的装置,尤其适用于存在爆炸风险的工业环境。以下是其主要应用场景: ​ ​1.石油化工行业 在石油化工厂、炼油厂等场所,防爆型断链保护器可用于保护输送设备&#xf…...

leetcode_206 反转链表

1. 题意 原地反转链表,非常经典的一道题。 2. 解决 2.1 非递归 非递归的比较好理解;链表需要维护前驱和后继两个信息,当我们要更改后继时,先要把原来的后继先存起来。 /*** Definition for singly-linked list.* struct List…...

OPenCV CUDA模块光流------高效地执行光流估计的类BroxOpticalFlow

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 cv::cuda::BroxOpticalFlow 是 OpenCV CUDA 模块中实现Brox光流算法的类。该类用于在 GPU 上高效地计算两帧图像之间的稠密光流(Dens…...

高考:如何合理选择学科、专业以及职业

如何合理选择学科、专业以及职业 一、自我认知:明确自身兴趣与优势(一)兴趣探索(二)能力评估(三)价值观与目标 二、外部调研:深入了解学科、专业与职业(一)学…...

K8S认证|CKS题库+答案| 3. 默认网络策略

目录 3. 默认网络策略 免费获取并激活 CKA_v1.31_模拟系统 题目 开始操作: 1)、切换集群 2)、官网找模板 3)、按照题目要求创建networkpolicy 4)、应用networkpolicy 5)、检查策略 3. 默认网络策略…...

HTTP、WebSocket、SSE 对比

特性HTTPWebSocketSSE (Server-Sent Events)通信模式请求-响应(单向)全双工双向通信服务器到客户端的单向通信连接方式短连接(默认)长连接长连接协议基础TCP(HTTP/1.1, HTTP/2)基于HTTP升级基于HTTP数据格式…...

Linux编程:1、文件编程

一、Linux 文件编程与 C 语言文件编程的区别 特性C 语言 I/O 库函数Linux 文件编程(系统调用)实现层面用户空间(glibc 库)内核空间(系统调用)跨平台性跨平台(Windows/Linux)仅限 Li…...

Kyosan K5BMC ELECTRONIC INTERLOCKING MANUAL 电子联锁

Kyosan K5BMC ELECTRONIC INTERLOCKING MANUAL 电子联锁...

【Spark征服之路-2.3-Spark运行架构】

运行架构 Spark 框架的核心是一个计算引擎,整体来说,它采用了标准 master-slave 的结构。 如下图所示,它展示了一个 Spark 执行时的基本结构。图形中的 Driver 表示 master,负责管理整个集群中的作业任务调度。图形中的 Executor …...

PART 6 树莓派小车+QT (TCP控制)

1. 树莓派作为服务器的程序 (1)服务器tcp_server_socket程序 可以实现小车前进、后退、左转、右转、加减速(可能不行) carMoveControl.py import RPi.GPIO as GPIO import time import tty,sys,select,termios import socket…...

软珊瑚成分 CI-A:靶向口腔癌细胞的 “氧化利剑” 与 ERK 密码

在生命科学探索的浩瀚星海中,癌症研究始终是最为耀眼却又充满挑战的领域之一。口腔癌,作为全球范围内日益严峻的公共健康问题,尤其在中南亚、美拉尼西亚以及我国台湾地区,其发病率和死亡率持续攀升,如同隐藏在黑暗中的…...

Cilium动手实验室: 精通之旅---4.Cilium Gateway API - Lab

Cilium动手实验室: 精通之旅---4.Cilium Gateway API - Lab 1. 环境准备2. API 网关--HTTP2.1 部署应用2.2 部署网关2.3 HTTP路径匹配2.4 HTTP头匹配 3. API网关--HTTPS3.1 创建TLS证书和私钥3.2 部署HTTPS网关3.3 HTTPS请求测试 4. API网关--TLS 路由4.1 部署应用4.2 部署网关…...

【芯片设计- RTL 数字逻辑设计入门 4.2 -- 组合逻辑赋值 + 时序逻辑状态保持】

文章目录 Overview原语句分析变量含义假设(根据命名推测)状态更新逻辑详解状态转移逻辑举个实际例子小结Overview 本文将详细介绍 verilog rtl 中 assign reg_halt_mode_nx = halt_taken | (reg_halt_mode & ~halt_return);的作用,以及这里为何要使用 reg_halt_mode,…...

如何使用索引和条件批量更改Series数据

视频演示 如何通过索引与布尔条件修改 pandas Series?实操演示来了 一、前言:掌握Series数据修改是数据处理的基础 在使用Python进行数据分析时,Pandas库的Series对象是最常用的结构之一。在上一个视频中我们已经学习了如何创建Series对象&a…...

Java转Go日记(六十):gin其他常用知识

1. 日志文件 package mainimport ("io""os""github.com/gin-gonic/gin" )func main() {gin.DisableConsoleColor()// Logging to a file.f, _ : os.Create("gin.log")gin.DefaultWriter io.MultiWriter(f)// 如果需要同时将日志写入…...

89.实现添加收藏的功能的后端实现

实现完查看收藏列表之后,实现的是添加收藏的功能 我的设想是:在对话界面中,如果用户认为AI的回答非常好,可以通过点击该回答对应的气泡中的图标,对该内容进行添加 所以后端实现为: service类中添加&…...

v1.0.1版本更新·2025年5月22日发布-优雅草星云物联网AI智控系统

v1.0.1版本更新2025年5月22日发布-优雅草星云物联网AI智控系统 开源地址 星云智控官网: 优雅草星云物联网AI智控软件-移动端vue: 优雅草星云物联网AI智控软件-移动端vue 星云智控PC端开源: 优雅草星云物联网AI智控软件-PC端vue: 优雅草星云物联网AI…...

如何创造出一种不同于程序语言的人与机器自然交互语言?

人机交互自然语言通过模拟人类日常交流方式,使机器能够理解并响应人类的自然表达,从而打破编程语言的复杂性壁垒,极大地提升人机协同的效率和自然性,让机器更好地融入人类的工作与生活场景。创造一种通用的人与机器自然交互语言是…...