当前位置: 首页 > news >正文

浅谈对BI工具价值的看法

浅谈对BI工具价值的看法

BI的定义看法

百度百科的定义:

商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术线上分析处理技术数据挖掘数据展现技术进行数据分析以实现商业价值。

总结是业务系统数据源-数据加工模型-数据可视化分析的过程

BI是否是个通过托拉拽实现数据可视化工具?

最好是认为是。

尤其目前大多数厂商为了销售产品将BI吹嘘的各种全能、数据处理分析一体化,自助分析很简单等等。

虽然商业BI具备了一定数据仓库、数据ETL、甚至整合数据指标、数据治理等功能,但规模数据体量下将数据all in one还是不现实的。利用低上手难度特性

刻意绕开了项目建设过程中存在的挑战和风险。

所以认为BI就是分享数据成果的功能化板块,同时降低个人数据应用门槛和节省前端开发的成本

另外补充一点随着商业经营玩法增多,维度随着递增同时,各类度量指标也是层出不穷。

一帮商业BI具备了一定的计算能力,包括在创建数据集的时候新建模型指标或计算字段,可节省大量数据加工的时间减少存储冗余,提升数据模型的长期支撑能力与应变度

BI建设质量的问题和看法

据Gartner调研表明,在过去十年间,有85%以上的BI项目并不成功。

成功的项目都是相似的,失败的项目各有各的问题。例举几个常见的问题

  • 数据质量问题
    这几乎所有数据项目的痛点问题,常见的场景各内容间指标不统一、数据冗余改了一份另一份却没改、数据生命周期低无法长期信任等。
    通常是一开始就没有规划好数据标准和指标体系,需求先行数据基建却没跟上,就想盖房子没有扎实的地基,塌方也只是早晚的事。

  • 性能质量问题

    在实际使用体验中,性能体验也是常见的吐槽点,但具体影响性能是哪个部分得根据数据上下游(数据读取、存储、处理、传输与呈现)去分析。

    BI 与数据仓库技术、olap 引擎有着直接的上下游关系。其中数据仓库主要起到统一数据源、保证数据准确度的作用;
    而 OLAP 引擎则帮助 BI 加速查询。它们组合在一起发力方可获得一个好的体验。影响性能的实际常见的有以下几点

    1. 数据量大
    2. 复杂的查询语句
    3. 并发过多系统资源不足或加载性能
  • 利用效率问题
    人人都是分析师使用初期后往往会出现堆量的现象,从而出现表达逻辑模糊,价值不明确,从而利用率不高、内容管理混乱等问题

    1. 数量多雷同多,质量高的少
    2. 表盘内容多,价值清晰的少
    3. 逻辑输出面向对象问题(受众对象,表达逻辑,表现方式)

反过来讲,若想BI项目的成功应该做到以下几点

  • 打造数仓确保信息化统一牢固,拥有良好的数据质量
  • 深入了解数据传递上下游技术,让各个环节不再有性能瓶颈
  • 数据价值表达根据受众对象选择表达方式,有重点逻辑,简明扼要,精益求精

最终从质量、效率、价值的角度形成一个闭环来验证商业BI的项目成败

相关文章:

浅谈对BI工具价值的看法

浅谈对BI工具价值的看法 BI的定义看法 百度百科的定义: 商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术…...

创建定时任务

import schedule import timedef task():print("Im working...")if __name__ __main__:schedule.every(10).seconds.do(task) # 每10秒一次schedule.every(10).minutes.do(task) # 10分钟一次schedule.every().hour.do(task) # 每小时schedule.every().day.at(&q…...

MyBatis的使用、Spring AOP、Spring事务

一、MyBatis 的使用 1、环境配置 1.1、建库建表 -- 创建数据库 drop database if exists mycnblog; create database mycnblog DEFAULT CHARACTER SET utf8mb4;-- 使⽤数据数据 use mycnblog;-- 创建表[⽤户表] drop table if exists userinfo; create table userinfo(id in…...

Apache Doris 冷热分层技术如何实现存储成本降低 70%?

在数据分析的实际场景中,冷热数据往往面临着不同的查询频次及响应速度要求。例如在电商订单场景中,用户经常访问近 6 个月的订单,时间较久远的订单访问次数非常少;在行为分析场景中,需支持近期流量数据的高频查询且时效…...

MySQL 两个备机同时挂掉故障分析

来源: 接报线上出现两个5.7.38的备库同时crash,crash堆栈相同,内容如下: stack_bottom 7fd7700b0d30 thread_stack 0x40000 /home/service/app/mysql33066/bin/mysqld(my_print_stacktrace0x2c)[0xf1062c] /home/service/app/m…...

序列化与反序列化深入理解

序列化与反序列化深入理解 1 介绍1.1 概述1.2 序列化实现的需求 2 常用序列化实现函数序列化语言内置开源序列化实现 3 各序列化实现比较4 各序列化实现概述XMLJSONProtobufJava 内置TLVVLE(Variable Length Encoding) 5 flex & bison5.1 介绍应用解…...

hudi系列-小文件优化

hudi使用mvcc来实现数据的读写一致性和并发控制,基于timeline实现对事务和表服务的管理,会产生大量比较小的数据文件和元数据文件。大量小文件会对存储和查询性能产生不利影响,包括增加文件系统的开销、文件管理的复杂性以及查询性能的下降。对于namenode而言,当整个集群中…...

mysql 是否包含 返回索引 截取字符串

是否包含返回索引 原文链接:https://www.cnblogs.com/shoshana-kong/p/16474175.html 方法1:使用通配符%。 通配符也就是模糊匹配,可以分为前导模糊查询、后导模糊查询和全导匹配查询,适用于查询某个字符串中是否包含另一个模糊…...

【LeetCode】74. 搜索二维矩阵

74. 搜索二维矩阵(中等) 方法一:二分查找 思路 总体思路 由于二维矩阵固定列的「从上到下」或者固定行的「从左到右」都是升序的 因此我们可以使用两次二分来定位到目标位置。 第一次二分: 从第 0 列中的「所有行」开始找&#x…...

Nginx rewrite

一.location 大致可以分为三类: 精准匹配:location / {…}一般匹配:location / {…}正则匹配:location ~ / {…} 1.location 常用的匹配规则: :进行普通字符精确匹配,也就是完全匹配。^~ &am…...

【数据分享】1929-2022年全球站点的逐日降水量(Shp\Excel\12000个站点)

气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、湿度等指标,说到常用的降水数据,最详细的降水数据是具体到气象监测站点的降水数据! 有关气象指标的监测站点数据,之前我们分享过1929-2022年全…...

【论文阅读】(2013)Exact algorithms for the bin packing problem with fragile objects

文章目录 一、摘要二、介绍三、之前在这个问题上的工作四、易碎物品背包问题的求解4.1 ILP模型4.2 基于KP01的方法4.3 动态规划 五、二元分支方案5.1 分支方案1(基于决策变量的分支)5.2 分支方案2(基于yj和xji的分支)5.3 将L2嵌入…...

K8S YAML 部署XXLJOB 集群

apiVersion: apps/v1 kind: Deployment metadata: labels: app: xxl-job-admin name: xxl-job-admin namespace: ccetest #根据情况修改namespace spec: replicas: 3 #根据情况修改副本数 selector: matchLabels: app: xxl-job-admin strat…...

Linux防火墙学习笔记3

iptables链的概念: 当客户端访问服务器端的Web服务的时候,客户端发送请求报文到网卡,而TCP/IP协议栈是属于内核的一部分。客户端的请求报文会通过内核的TCP协议传输到用户空间的Web服务,而客户端报文的目的地址为Web服务器所监听的…...

数仓用户行为数据分析

分层优点:复杂的东西可以简单化、解耦(屏蔽层作用)、提高复用、方便管理 SA 贴源 数据组织结构与源系统保持一致 shm 历史层 针对不同特征的数据做不同算法,目的都是为了得到一份完整的数据 PDM 明细层 做最细粒度的数据明细…...

RK3288 Android5.1添加WiFiBT模块AP6212

CPU:RK3288 系统:Android 5.1 注:RK3288系统,目前 Android 5.0 Kernel 3.10 SDK 支持 Braodcom,Realtek 等 WiFi BT 模块 各个 WiFi BT 模块已经做到动态兼容,Android 上层不再需要像以前一样进 行特定宏的配置 此…...

使用 YApi 管理 API 文档,测试, mock

随着互联网的发展,API变的至关重要。根据统计,目前市面上有上千万的开发者,互联网项目超过10亿,保守统计涉及的 API 数量大约有 100 亿。这么大基数的API,只要解决某些共有的痛点,将会是非常有意义的事情。…...

chatgpt生成【2023高考作文】北京卷二 - 亮相

舞台上,戏曲演员有登场亮相的瞬间。生活中也有许多亮相时刻:国旗下的讲话,研学成果的汇报,新产品的发布……每一次亮相,都受到众人关注;每一次亮相,也会有一段故事。 请以“亮相”为题目&#x…...

实验四、shell编程

一、实验目的 1.了解shell的特点和主要种类。 2.掌握 shel1 脚本的建立和执行方式。 3.掌握bash的基本语法。 4.学会编写shell 脚本。 二、实验内容 shell 脚本的建立和执行。历史命令和别名定义。shell变量和位置参数、环境变量。bash的特殊字符。一般控制结构。算术运算及…...

【代码随想录】刷题Day51

1.最佳买卖股票时机含冷冻期 309. 最佳买卖股票时机含冷冻期 1.dp数组的含义:dp[i][0]为第i天卖出股票的最大价值;dp[i][1]为第i天持有股票的最大价值 2.dp数组的条件:由于有冷冻期,所以dp数组的条件就变了。第i天卖出股票的最大…...

FanControl深度解析:Windows上最强大的风扇控制软件终极指南

FanControl深度解析:Windows上最强大的风扇控制软件终极指南 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trend…...

门电路的电气特性详解

门电路的电气特性详解 深入理解门电路的电气参数,是设计可靠数字系统的必备知识。 🎯 本章学习要点 理解输入/输出电压阈值参数掌握扇入扇出的概念和计算了解传输延迟对电路的影响理解功耗来源及优化策略 1️⃣ 输入输出特性参数 1.1 电压阈值参数 &a…...

告别Navicat后,我用DBeaver的这10个设置让效率翻倍(含豆沙绿护眼教程)

从Navicat到DBeaver:10个高效设置与健康护眼方案 当公司技术栈调整要求从Navicat迁移到DBeaver时,许多数据库开发者面临的不仅是工具切换,更是工作习惯的重构。作为一款开源的多数据库管理工具,DBeaver在功能深度和可定制性上其实…...

从Simulink模型到C代码:Assignment模块的‘Index Mode’选Zero还是One?一个影响深远的决定

从Simulink模型到C代码:索引模式选择的工程实践指南 在嵌入式软件开发中,模型与代码的协同设计一直是提高开发效率的关键环节。当Simulink模型工程师将算法模型转换为C代码时,一个看似简单的参数配置——Assignment模块的"Index Mode&q…...

脉冲微波信号高速采集与实时测频模块设计【附程序】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导,毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅如需沟通交流,点击《获取方式》 (1)多相并行FFT与二次曲线拟合测频方案: 针…...

为Cursor AI Agent构建专用HTTP客户端:扩展智能体联网能力实战

1. 项目概述:一个为Cursor AI Agent定制的HTTP客户端 如果你和我一样,深度使用Cursor作为日常开发的主力工具,那你肯定对它的“Agent”功能又爱又恨。爱的是,它能理解你的意图,帮你生成代码、重构函数、甚至写测试&…...

3步快速上手Thorium浏览器:新手也能掌握的完整性能优化指南

3步快速上手Thorium浏览器:新手也能掌握的完整性能优化指南 【免费下载链接】thorium Chromium fork named after radioactive element No. 90. Source code and Linux releases. Windows/MacOS/ARM builds served in different repos, links are towards the top o…...

国产化服务器运维笔记:手把手搞定MariaDB/PostgreSQL(瀚高)服务启停、远程连接与基础排查

国产化环境数据库运维实战:MariaDB与瀚高数据库深度管理指南 在信息技术应用创新背景下,国产服务器与开源数据库的组合已成为企业基础架构的重要选择。面对复杂的生产环境,掌握数据库服务的精细化管理能力,是每位运维工程师的必备…...

AI智能体核心技能体系解析:从任务分解到工具调用的工程实践

1. 项目概述:从代码仓库到智能体技能库的深度解构 最近在GitHub上看到一个挺有意思的项目,叫“agent-skills”。乍一看,这名字有点抽象,但点进去之后,你会发现它其实是一个关于“智能体技能”的集合或清单。这个项目由…...

如何用Zutilo插件提升Zotero文献管理效率:5个实用技巧帮你节省50%时间

如何用Zutilo插件提升Zotero文献管理效率:5个实用技巧帮你节省50%时间 【免费下载链接】Zutilo Zotero plugin providing some additional editing features 项目地址: https://gitcode.com/gh_mirrors/zu/Zutilo 你是否经常在Zotero中花费大量时间处理文献标…...