扩展学习|商业智能和大数据分析的研究前景(比对分析)
文献来源: Liang T P , Liu Y H .Research Landscape of Business Intelligence and Big Data analytics: A bibliometrics study[J].Expert Systems with Applications, 2018, 111(NOV.):2-10.DOI:10.1016/j.eswa.2018.05.018.
信息和通信技术的快速发展导致了数字化数据的快速增长,也引起了人们对管理、社会科学和人文领域大数据分析和商业智能研究机会的极大关注。商业智能的大数据和分析趋势为支持数据驱动的决策过程提供了巨大的资源和强大的方法,这是“商业智能”的核心。
一、大数据与商务智能的对比
“大数据”(BD)和“商业智能”(BI)都是近年来学术研究中快速增长的关键词。虽然“大数据”最近很流行,但“商业智能”的提出要早得多。Luhn(1958)开始使用“商业智能”一词来描述传播信息和支持决策过程的自动系统。这一概念后来被纳入决策支助和信息系统领域。例如,Vitt等人(2002)将商业智能定义为一个多方面的概念,包括三个不同的观点:更快地做出更好的决策,将数据转换为信息,并使用合理的方法来管理(第13页)。他们将BI周期定义为包括四个阶段:分析、洞察、行动和性能度量。头巾等进一步扩展了BI,涵盖了数据仓库、数据采集、数据挖掘、业务分析和可视化。
一般来说,BD强调数据方面,包括数据收集、存储和分析,而BI更侧重于数据分析、可视化和用于业务决策的应用。
二、在过去十年中,与“大数据”和“商业智能”相关的学术成果是如何发展和演变的?

第一个分析是出版趋势。图1显示了“大数据”和“商业智能”的时间趋势。截至2011年,“大数据”学术产出不足38篇。2012年,这一数字增加到92个,此后迅速增加。仅2016年一年,BD出版物数量就达到了3287种。
与“大数据”相比,BI出版物的数量多年来保持相对稳定。“商业智能”的趋势早在2012年之前就开始了,2008年增加到48家,远高于BD,但到2016年仅增加到183家。这可能是因为作为一种技术,BD的研究范围比专注于业务应用的BI要广泛得多。

图2显示了BD&BI出版物的时间趋势。这些出版物的数量在2015年显著增加到32篇,并继续增长,但仍无法与BD论文相比。发表数量少的原因可能是,尽管BI和BD的应用通常是重叠的,但大多数论文可能会选择将其主要方向显示为技术或管理。另一种可能性是,大数据在很大程度上是一个流行词,在商业领域也被广泛使用,而商业智能则更多地局限于某些领域。
表1给出了数据集中文档类型的统计信息。

三、在这些学术成果中,研究主题是如何变化和演变的?
表2总结了“大数据”和“商业智能”出版物的高频关键词。关键词按出现频率降序排列。在10637篇“大数据”相关文章中,排名前5位的相关关键词是“模型”、“算法”、“系统”、“MapReduce”和“云计算”。在1168篇“商业智能”类出版物中,排名前五的关键词是“管理”、“数据仓库”、“大数据”、“数据挖掘”和“系统”。虽然“数据挖掘”、“社交媒体”和“管理”等几个关键词有重叠,但我们看到这两组研究之间存在显著差异。
与BD相关的关键词更侧重于算法和计算,而与BI相关的关键词更侧重于管理和决策支持系统。
证据与我们的观点一致,即业务开发更偏向于技术,而商业智能更偏向于应用。


图3显示了10637篇BD出版物中关键词的可视化云。
重要的关键字用较大的字体突出显示,而关键字的颜色由关键字所属的集群决定。关键词之间的线表示关键词之间最强的共被引联系。“大数据”是云的中心,因为它是搜索关键。与表2一致,“模型”、“算法”、“系统”、“云计算”、“管理”、“网络”和“信息”都是突出的关键词。在标签云中,用不同颜色标记的5个主要簇属于5个不同的主要区域。红色集群由医疗保健领域的出版物组成,绿色集群属于计算机科学领域。“商业智能”位于顶部,属于黄色集群。黄色集群主要属于管理领域。“商业智能”与“管理”、“数据分析”和“预测分析”直接相关,而“知识管理”在同一集群中更大

图4按时间顺序显示了高频关键词的演变。从acceptmanuscript 10时间轴来看,2016年和2017年“云计算”、“数据仓库”和“知识管理”被更加强调。与2014年的“数据挖掘”、“文本挖掘”、“数据科学”等关键词相比,2016年之后的研究重点发生了转移。


四、哪个学科推动相关研究?
我们使用研究期刊发表的特刊作为证据。表4总结了8个BD和BI特刊的学术领域。3本期刊属于计算机科学领域,其他期刊与信息科学和管理相关。这意味着,计算机科学一直是推动BD和BI研究的核心学科,而信息科学和管理也是重要学科。


表5按降序列出了BD和BI发文量排名前10位的期刊。我们可以发现这两组期刊有重叠,但它们的排名却大不相同。与BI论文主要发表在计算机科学类期刊、信息系统类期刊和管理类期刊相比,BD论文发表在更加多元化的期刊上,强调跨学科应用。有三种期刊是专门针对BD的,并声称是多学科的。综上所述,发表商业智能研究的期刊更多地涉及管理领域,而发表商业智能研究的期刊范围更广。


五、谁是这些产出的主要贡献者?
表6列出了学术网络中被引频次和中心性最高的出版物。


六、未来研究
鉴于在前面的分析中指出的概况,我们能够确定未来研究的几个关键方向。图7显示了将研究主题划分为四个维度的一般框架:技术、应用、管理和影响。在每个维度中,需要进一步探索许多可能的主题。例如,技术维度包括与数据收集、存储、分析和集成基础设施相关的问题。例如,情感分析需要正确地收集和分析文本数据。正确解析所收集文本数据的技术以及对积极或消极情绪的界定也是研究的重点。

应用程序问题是与将特定技术应用于特定领域相关的问题。例如,商业应用程序以盈利为导向,而医疗应用程序可能更注重准确性或计算效率。涉及不同应用程序领域的风险可能也很重要。例如,由于对客户细分不准确而产生的营销计划可能会导致金钱损失,但错误的患者诊断处方可能导致生命损失,这是完全不可接受的。因此,研究人员在进行BD/BI研究时需要考虑到应用领域特有的问题。
管理问题包括影响采用业务流程/商业智能技术的因素、采用技术时的成本效益评估、业务流程/商业智能涉及的安全和隐私问题,以及采用业务流程/商业智能的组织准备情况(如人力资源)。有许多与采用信息技术有关的理论。它们有助于调查为什么采用或不采用BD/BI。从管理角度来看,安全和隐私问题也是一个大问题。
BD/BI的影响是另一个尚未深入研究的方面。以往的研究大多集中在业务流程/商业智能的积极一面,以促进技术的发展,但尚未证明业务流程/商业智能的价值创造或避免负面影响。大多数现有病例报告都是基于轶事证据。我们需要更多的大规模研究来验证BD/BI的价值,包括战略价值和管理价值。我们还需要研究BD/BI对个人生活、组织运作和社会活动的影响(积极和消极的)。例如,从移动应用程序(如谷歌地图)收集的用户的位置或交通数据如何在最小程度侵犯个人隐私的情况下增强社区的安全(或警察殴打)。
相关文章:
扩展学习|商业智能和大数据分析的研究前景(比对分析)
文献来源: Liang T P , Liu Y H .Research Landscape of Business Intelligence and Big Data analytics: A bibliometrics study[J].Expert Systems with Applications, 2018, 111(NOV.):2-10.DOI:10.1016/j.eswa.2018.05.018. 信息和通信技术的快速发展导致了数字…...
『Docker入门指南』- 详细安装与配置教程,助你起航容器化世界!
引言 在探索云计算和自动化部署的时代,Docker以其独特的容器化技术站在了风口浪尖。如果你期待着无缝地将你的应用从一个环境迁移到另一个环境,那么Docker无疑是你的得力助手。但首先,我们得学会如何正确地安装和配置Docker。这篇文章将详细…...
如何提高http连接成功率?
问题 丢包、错包、乱包 高延迟 响应数据回来时间长,甚至大于客户端等待时间 带宽小 每次能够通信的内容较少,数据包越大受影响可能越大 网络断续 网络经常断开又连接 优化处理 采用TCP协议、实现长连接,采用长连接池,节省…...
Elasticsearch 中使用MustNot等同于不等于遇到的坑
1、在写关键词推荐时,需要把当前文章过滤掉,不能再推荐自己的文章,所以再es中需要用到 MustNot属性查询 /// <summary> /// 服务中心es检索 /// </summary> /// <param name="input"></param> /// <returns></…...
嵌入式工程师day15(链表)
内存管理 一.内存管理: 1.malloc void *malloc(size_t size); 功能: 申请堆区空间 参数: size:申请堆区空间的大小 返回值: 返回获得的空间的首地址 失败返回NULL 2.free void free(void *ptr); 功能: 释放…...
Coppeliasim倒立摆demo
首先需要将使用Python远程控制的文件导入到文件夹,核心是深蓝色的三个文件。 本版本为4.70,其文件所在位置如下图所示,需要注意的是,目前不支持Ubuntu22的远程api: 双击Sphere这一行的灰色文件,可以看到远程…...
汽车燃油泵数据分析:全球市场的年复合增长率将达到10%左右
燃油泵是汽车配件行业的专业术语。是电喷汽车燃油喷射系统的基本组成之一,位于车辆油箱内部,燃油泵在启动和发动机运转时工作,如果发动机停止而点火开关仍处于ON时,HFM-SFI控制模块关闭燃油泵的电源,以避免意外点火。 …...
DC-磁盘管理(23国赛真题)
2023全国职业院校技能大赛网络系统管理赛项–模块B:服务部署(WindowServer2022) 文章目录 题目配置步骤组成RAID 5,磁盘分区命名为卷标H盘:Raid5。手动测试破坏一块磁盘,做RAID磁盘修复,确认RAID 5配置完毕。验证查看Raid5(打开磁盘管理器,查看raid信息)Raid5磁盘修复…...
216961-98-7,BODIPY 493/503 NHS 活化酯,可以应用于分子生物学等领域中
您好,欢迎来到新研之家 文章关键词:216961-98-7,BODIPY 493/503 NHS 活化酯,BODIPY 493/503 NHS ester,BODIPY 493/503 SE 一、基本信息 产品简介:BODIPY 493/503 NHS ester是一种特殊的染料,…...
Python采集学习笔记-读取excel数据
表格格式 方法一:使用xlrd import xlrd 1.读取Excel文件 workbook xlrd.open_workbook(plc.xlsx) 2.读取第一个表 sheet workbook.sheet_by_index(0) 3.获取表格总行数 total_rows sheet.nrows 4.创建列表,存储表格一行中每一列信息 plc_info [] for row in range(1…...
幻兽帕鲁服务器游戏怎么升级版本?
幻兽帕鲁服务器游戏怎么升级版本?自建幻兽帕鲁服务器进入Palworld游戏提示“您正尝试加入的比赛正在运行不兼容的游戏版本,请尝试升级游戏版本”什么原因?这是由于你的客户端和幻兽帕鲁服务器版本不匹配,如何解决?更新…...
【ASP.NET Core 基础知识】--身份验证和授权--授权和策略
一、授权和策略的概念及应用 在ASP.NET Core中,授权和策略是重要的安全概念,用于确定用户是否有权限执行特定的操作或访问特定的资源。以下是关于ASP.NET Core中授权和策略的概念及其应用的一些重要信息: 1.1 授权(Authorizatio…...
20240130在ubuntu20.04.6下卸载NVIDIA显卡的驱动
20240130在ubuntu20.04.6下卸载NVIDIA显卡的驱动 2024/1/30 12:58 缘起,为了在ubuntu20.4.6下使用whisper,以前用的是GTX1080M,装了535的驱动。 现在在PDD拼多多上了入手了一张二手的GTX1080,需要将安装最新的545的驱动程序&#…...
汽车标定技术(十七)--Bypass的前世今生
目录 1.Bypass的诞生 2.Bypass的发扬光大 2.1 基于XCP的Bypassing 2.2 基于Debug的Bypass 2.3 小结 3.Bypass的实际应用 1.Bypass的诞生 下图我相信只要用过INCA的朋友都非常熟悉。 这是远古时期(2000年左右?我猜)ETAS针对发动机控制参数标定设计的一种并行数据…...
【开源精选导航】GitHub-Chinese-Top-Charts:一榜在手,优质中文项目轻松找寻
各位热爱开源技术的朋友们,你们是否有过这样的困扰:面对浩瀚的GitHub海洋,想找寻那些具有高质量中文文档的优秀开源项目却无从下手?今天,我们就为大家揭晓一个宝藏般的开源项目——GitHub 中文项目集合(访问…...
C++ 11新特性之语法甜点1
概述 C 11中引入了许多简化编程工作的语法上的新特性,我们暂且美其名曰:“语法甜点”。下面,我们将对这些“语法甜点”一一进行介绍。 语法甜点1:序列for循环 序列for循环是一种简化的for循环,可用于遍历一组序列&…...
【智能家居】6、语音控制及网络控制代码实现
一、语音控制 1、指令结构体编写 这个结构体定义了一个命令输入的模型。在这个模型中,包含以下几个部分: cmdName:一个长度为128的字符串,用于存储命令名称。dvicesName:一个长度为128的字符串,用于存储设…...
Windows断开映射磁盘提示“此网络连接不存在”,并且该磁盘直在资源管理器中
1、打开注册表编辑器 快捷键winR 打开“运行”, 输入 regedit 2、 删除下列注册表中和无法移除的磁盘相关的选项 \HKEY_CURRENT_USER\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\MountPoints2\ 3、打开“任务管理器”,重新启动“Windows资源…...
Java项目要不要部署在Docker里?
部署Java项目有很多种方式,传统的方式是直接在物理机或虚拟机上部署应用,但为什么现在容器化部署变得越来越流行, 个人觉得原因有以下几个: 1、 环境一致性:使用Docker可以确保开发、测试和生产环境的一致性ÿ…...
Linux 入门基础知识(一)—— Linux的基本使用
Linux 入门基础知识 一、Linux的基本使用和配置1.1、终端1.2、消耗内存1.3、运行级别1.6、登录前欢迎语1.5、登录后欢迎语1.6、shell1.7、ps aux1.8、设置主机名1.9、whoami和who am i1.10、命令提示符 二、Linux执行命令的过程详解和命令类型2.1、命令执行2.2、hash缓存表2.3、…...
应用升级/灾备测试时使用guarantee 闪回点迅速回退
1.场景 应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。 相对于RMAN恢复需要很长时间, 数据库闪回只需要几分钟。 2.技术实现 数据库设置 2个db_recovery参数 创建guarantee闪回点,不需要开启数据库闪回。…...
Java 语言特性(面试系列1)
一、面向对象编程 1. 封装(Encapsulation) 定义:将数据(属性)和操作数据的方法绑定在一起,通过访问控制符(private、protected、public)隐藏内部实现细节。示例: public …...
椭圆曲线密码学(ECC)
一、ECC算法概述 椭圆曲线密码学(Elliptic Curve Cryptography)是基于椭圆曲线数学理论的公钥密码系统,由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA,ECC在相同安全强度下密钥更短(256位ECC ≈ 3072位RSA…...
C++ 基础特性深度解析
目录 引言 一、命名空间(namespace) C 中的命名空间 与 C 语言的对比 二、缺省参数 C 中的缺省参数 与 C 语言的对比 三、引用(reference) C 中的引用 与 C 语言的对比 四、inline(内联函数…...
微服务商城-商品微服务
数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...
基于IDIG-GAN的小样本电机轴承故障诊断
目录 🔍 核心问题 一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) 梯度归一化(Gradient Normalization) (2) 判别器梯度间隙正则化(Discriminator Gradient Gap Regularization) (3) 自注意力机制(Self-Attention) 3. 完整损失函数 二…...
Web中间件--tomcat学习
Web中间件–tomcat Java虚拟机详解 什么是JAVA虚拟机 Java虚拟机是一个抽象的计算机,它可以执行Java字节码。Java虚拟机是Java平台的一部分,Java平台由Java语言、Java API和Java虚拟机组成。Java虚拟机的主要作用是将Java字节码转换为机器代码&#x…...
「全栈技术解析」推客小程序系统开发:从架构设计到裂变增长的完整解决方案
在移动互联网营销竞争白热化的当下,推客小程序系统凭借其裂变传播、精准营销等特性,成为企业抢占市场的利器。本文将深度解析推客小程序系统开发的核心技术与实现路径,助力开发者打造具有市场竞争力的营销工具。 一、系统核心功能架构&…...
【LeetCode】算法详解#6 ---除自身以外数组的乘积
1.题目介绍 给定一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法,且在 O…...
云原生周刊:k0s 成为 CNCF 沙箱项目
开源项目推荐 HAMi HAMi(原名 k8s‑vGPU‑scheduler)是一款 CNCF Sandbox 级别的开源 K8s 中间件,通过虚拟化 GPU/NPU 等异构设备并支持内存、计算核心时间片隔离及共享调度,为容器提供统一接口,实现细粒度资源配额…...
