扩展学习|商业智能和大数据分析的研究前景(比对分析)
文献来源: Liang T P , Liu Y H .Research Landscape of Business Intelligence and Big Data analytics: A bibliometrics study[J].Expert Systems with Applications, 2018, 111(NOV.):2-10.DOI:10.1016/j.eswa.2018.05.018.
信息和通信技术的快速发展导致了数字化数据的快速增长,也引起了人们对管理、社会科学和人文领域大数据分析和商业智能研究机会的极大关注。商业智能的大数据和分析趋势为支持数据驱动的决策过程提供了巨大的资源和强大的方法,这是“商业智能”的核心。
一、大数据与商务智能的对比
“大数据”(BD)和“商业智能”(BI)都是近年来学术研究中快速增长的关键词。虽然“大数据”最近很流行,但“商业智能”的提出要早得多。Luhn(1958)开始使用“商业智能”一词来描述传播信息和支持决策过程的自动系统。这一概念后来被纳入决策支助和信息系统领域。例如,Vitt等人(2002)将商业智能定义为一个多方面的概念,包括三个不同的观点:更快地做出更好的决策,将数据转换为信息,并使用合理的方法来管理(第13页)。他们将BI周期定义为包括四个阶段:分析、洞察、行动和性能度量。头巾等进一步扩展了BI,涵盖了数据仓库、数据采集、数据挖掘、业务分析和可视化。
一般来说,BD强调数据方面,包括数据收集、存储和分析,而BI更侧重于数据分析、可视化和用于业务决策的应用。
二、在过去十年中,与“大数据”和“商业智能”相关的学术成果是如何发展和演变的?
第一个分析是出版趋势。图1显示了“大数据”和“商业智能”的时间趋势。截至2011年,“大数据”学术产出不足38篇。2012年,这一数字增加到92个,此后迅速增加。仅2016年一年,BD出版物数量就达到了3287种。
与“大数据”相比,BI出版物的数量多年来保持相对稳定。“商业智能”的趋势早在2012年之前就开始了,2008年增加到48家,远高于BD,但到2016年仅增加到183家。这可能是因为作为一种技术,BD的研究范围比专注于业务应用的BI要广泛得多。
图2显示了BD&BI出版物的时间趋势。这些出版物的数量在2015年显著增加到32篇,并继续增长,但仍无法与BD论文相比。发表数量少的原因可能是,尽管BI和BD的应用通常是重叠的,但大多数论文可能会选择将其主要方向显示为技术或管理。另一种可能性是,大数据在很大程度上是一个流行词,在商业领域也被广泛使用,而商业智能则更多地局限于某些领域。
表1给出了数据集中文档类型的统计信息。
三、在这些学术成果中,研究主题是如何变化和演变的?
表2总结了“大数据”和“商业智能”出版物的高频关键词。关键词按出现频率降序排列。在10637篇“大数据”相关文章中,排名前5位的相关关键词是“模型”、“算法”、“系统”、“MapReduce”和“云计算”。在1168篇“商业智能”类出版物中,排名前五的关键词是“管理”、“数据仓库”、“大数据”、“数据挖掘”和“系统”。虽然“数据挖掘”、“社交媒体”和“管理”等几个关键词有重叠,但我们看到这两组研究之间存在显著差异。
与BD相关的关键词更侧重于算法和计算,而与BI相关的关键词更侧重于管理和决策支持系统。
证据与我们的观点一致,即业务开发更偏向于技术,而商业智能更偏向于应用。
图3显示了10637篇BD出版物中关键词的可视化云。
重要的关键字用较大的字体突出显示,而关键字的颜色由关键字所属的集群决定。关键词之间的线表示关键词之间最强的共被引联系。“大数据”是云的中心,因为它是搜索关键。与表2一致,“模型”、“算法”、“系统”、“云计算”、“管理”、“网络”和“信息”都是突出的关键词。在标签云中,用不同颜色标记的5个主要簇属于5个不同的主要区域。红色集群由医疗保健领域的出版物组成,绿色集群属于计算机科学领域。“商业智能”位于顶部,属于黄色集群。黄色集群主要属于管理领域。“商业智能”与“管理”、“数据分析”和“预测分析”直接相关,而“知识管理”在同一集群中更大
图4按时间顺序显示了高频关键词的演变。从acceptmanuscript 10时间轴来看,2016年和2017年“云计算”、“数据仓库”和“知识管理”被更加强调。与2014年的“数据挖掘”、“文本挖掘”、“数据科学”等关键词相比,2016年之后的研究重点发生了转移。
四、哪个学科推动相关研究?
我们使用研究期刊发表的特刊作为证据。表4总结了8个BD和BI特刊的学术领域。3本期刊属于计算机科学领域,其他期刊与信息科学和管理相关。这意味着,计算机科学一直是推动BD和BI研究的核心学科,而信息科学和管理也是重要学科。
表5按降序列出了BD和BI发文量排名前10位的期刊。我们可以发现这两组期刊有重叠,但它们的排名却大不相同。与BI论文主要发表在计算机科学类期刊、信息系统类期刊和管理类期刊相比,BD论文发表在更加多元化的期刊上,强调跨学科应用。有三种期刊是专门针对BD的,并声称是多学科的。综上所述,发表商业智能研究的期刊更多地涉及管理领域,而发表商业智能研究的期刊范围更广。
五、谁是这些产出的主要贡献者?
表6列出了学术网络中被引频次和中心性最高的出版物。
六、未来研究
鉴于在前面的分析中指出的概况,我们能够确定未来研究的几个关键方向。图7显示了将研究主题划分为四个维度的一般框架:技术、应用、管理和影响。在每个维度中,需要进一步探索许多可能的主题。例如,技术维度包括与数据收集、存储、分析和集成基础设施相关的问题。例如,情感分析需要正确地收集和分析文本数据。正确解析所收集文本数据的技术以及对积极或消极情绪的界定也是研究的重点。
应用程序问题是与将特定技术应用于特定领域相关的问题。例如,商业应用程序以盈利为导向,而医疗应用程序可能更注重准确性或计算效率。涉及不同应用程序领域的风险可能也很重要。例如,由于对客户细分不准确而产生的营销计划可能会导致金钱损失,但错误的患者诊断处方可能导致生命损失,这是完全不可接受的。因此,研究人员在进行BD/BI研究时需要考虑到应用领域特有的问题。
管理问题包括影响采用业务流程/商业智能技术的因素、采用技术时的成本效益评估、业务流程/商业智能涉及的安全和隐私问题,以及采用业务流程/商业智能的组织准备情况(如人力资源)。有许多与采用信息技术有关的理论。它们有助于调查为什么采用或不采用BD/BI。从管理角度来看,安全和隐私问题也是一个大问题。
BD/BI的影响是另一个尚未深入研究的方面。以往的研究大多集中在业务流程/商业智能的积极一面,以促进技术的发展,但尚未证明业务流程/商业智能的价值创造或避免负面影响。大多数现有病例报告都是基于轶事证据。我们需要更多的大规模研究来验证BD/BI的价值,包括战略价值和管理价值。我们还需要研究BD/BI对个人生活、组织运作和社会活动的影响(积极和消极的)。例如,从移动应用程序(如谷歌地图)收集的用户的位置或交通数据如何在最小程度侵犯个人隐私的情况下增强社区的安全(或警察殴打)。
相关文章:

扩展学习|商业智能和大数据分析的研究前景(比对分析)
文献来源: Liang T P , Liu Y H .Research Landscape of Business Intelligence and Big Data analytics: A bibliometrics study[J].Expert Systems with Applications, 2018, 111(NOV.):2-10.DOI:10.1016/j.eswa.2018.05.018. 信息和通信技术的快速发展导致了数字…...

『Docker入门指南』- 详细安装与配置教程,助你起航容器化世界!
引言 在探索云计算和自动化部署的时代,Docker以其独特的容器化技术站在了风口浪尖。如果你期待着无缝地将你的应用从一个环境迁移到另一个环境,那么Docker无疑是你的得力助手。但首先,我们得学会如何正确地安装和配置Docker。这篇文章将详细…...
如何提高http连接成功率?
问题 丢包、错包、乱包 高延迟 响应数据回来时间长,甚至大于客户端等待时间 带宽小 每次能够通信的内容较少,数据包越大受影响可能越大 网络断续 网络经常断开又连接 优化处理 采用TCP协议、实现长连接,采用长连接池,节省…...
Elasticsearch 中使用MustNot等同于不等于遇到的坑
1、在写关键词推荐时,需要把当前文章过滤掉,不能再推荐自己的文章,所以再es中需要用到 MustNot属性查询 /// <summary> /// 服务中心es检索 /// </summary> /// <param name="input"></param> /// <returns></…...

嵌入式工程师day15(链表)
内存管理 一.内存管理: 1.malloc void *malloc(size_t size); 功能: 申请堆区空间 参数: size:申请堆区空间的大小 返回值: 返回获得的空间的首地址 失败返回NULL 2.free void free(void *ptr); 功能: 释放…...

Coppeliasim倒立摆demo
首先需要将使用Python远程控制的文件导入到文件夹,核心是深蓝色的三个文件。 本版本为4.70,其文件所在位置如下图所示,需要注意的是,目前不支持Ubuntu22的远程api: 双击Sphere这一行的灰色文件,可以看到远程…...

汽车燃油泵数据分析:全球市场的年复合增长率将达到10%左右
燃油泵是汽车配件行业的专业术语。是电喷汽车燃油喷射系统的基本组成之一,位于车辆油箱内部,燃油泵在启动和发动机运转时工作,如果发动机停止而点火开关仍处于ON时,HFM-SFI控制模块关闭燃油泵的电源,以避免意外点火。 …...
DC-磁盘管理(23国赛真题)
2023全国职业院校技能大赛网络系统管理赛项–模块B:服务部署(WindowServer2022) 文章目录 题目配置步骤组成RAID 5,磁盘分区命名为卷标H盘:Raid5。手动测试破坏一块磁盘,做RAID磁盘修复,确认RAID 5配置完毕。验证查看Raid5(打开磁盘管理器,查看raid信息)Raid5磁盘修复…...

216961-98-7,BODIPY 493/503 NHS 活化酯,可以应用于分子生物学等领域中
您好,欢迎来到新研之家 文章关键词:216961-98-7,BODIPY 493/503 NHS 活化酯,BODIPY 493/503 NHS ester,BODIPY 493/503 SE 一、基本信息 产品简介:BODIPY 493/503 NHS ester是一种特殊的染料,…...

Python采集学习笔记-读取excel数据
表格格式 方法一:使用xlrd import xlrd 1.读取Excel文件 workbook xlrd.open_workbook(plc.xlsx) 2.读取第一个表 sheet workbook.sheet_by_index(0) 3.获取表格总行数 total_rows sheet.nrows 4.创建列表,存储表格一行中每一列信息 plc_info [] for row in range(1…...

幻兽帕鲁服务器游戏怎么升级版本?
幻兽帕鲁服务器游戏怎么升级版本?自建幻兽帕鲁服务器进入Palworld游戏提示“您正尝试加入的比赛正在运行不兼容的游戏版本,请尝试升级游戏版本”什么原因?这是由于你的客户端和幻兽帕鲁服务器版本不匹配,如何解决?更新…...
【ASP.NET Core 基础知识】--身份验证和授权--授权和策略
一、授权和策略的概念及应用 在ASP.NET Core中,授权和策略是重要的安全概念,用于确定用户是否有权限执行特定的操作或访问特定的资源。以下是关于ASP.NET Core中授权和策略的概念及其应用的一些重要信息: 1.1 授权(Authorizatio…...

20240130在ubuntu20.04.6下卸载NVIDIA显卡的驱动
20240130在ubuntu20.04.6下卸载NVIDIA显卡的驱动 2024/1/30 12:58 缘起,为了在ubuntu20.4.6下使用whisper,以前用的是GTX1080M,装了535的驱动。 现在在PDD拼多多上了入手了一张二手的GTX1080,需要将安装最新的545的驱动程序&#…...

汽车标定技术(十七)--Bypass的前世今生
目录 1.Bypass的诞生 2.Bypass的发扬光大 2.1 基于XCP的Bypassing 2.2 基于Debug的Bypass 2.3 小结 3.Bypass的实际应用 1.Bypass的诞生 下图我相信只要用过INCA的朋友都非常熟悉。 这是远古时期(2000年左右?我猜)ETAS针对发动机控制参数标定设计的一种并行数据…...

【开源精选导航】GitHub-Chinese-Top-Charts:一榜在手,优质中文项目轻松找寻
各位热爱开源技术的朋友们,你们是否有过这样的困扰:面对浩瀚的GitHub海洋,想找寻那些具有高质量中文文档的优秀开源项目却无从下手?今天,我们就为大家揭晓一个宝藏般的开源项目——GitHub 中文项目集合(访问…...
C++ 11新特性之语法甜点1
概述 C 11中引入了许多简化编程工作的语法上的新特性,我们暂且美其名曰:“语法甜点”。下面,我们将对这些“语法甜点”一一进行介绍。 语法甜点1:序列for循环 序列for循环是一种简化的for循环,可用于遍历一组序列&…...

【智能家居】6、语音控制及网络控制代码实现
一、语音控制 1、指令结构体编写 这个结构体定义了一个命令输入的模型。在这个模型中,包含以下几个部分: cmdName:一个长度为128的字符串,用于存储命令名称。dvicesName:一个长度为128的字符串,用于存储设…...

Windows断开映射磁盘提示“此网络连接不存在”,并且该磁盘直在资源管理器中
1、打开注册表编辑器 快捷键winR 打开“运行”, 输入 regedit 2、 删除下列注册表中和无法移除的磁盘相关的选项 \HKEY_CURRENT_USER\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\MountPoints2\ 3、打开“任务管理器”,重新启动“Windows资源…...

Java项目要不要部署在Docker里?
部署Java项目有很多种方式,传统的方式是直接在物理机或虚拟机上部署应用,但为什么现在容器化部署变得越来越流行, 个人觉得原因有以下几个: 1、 环境一致性:使用Docker可以确保开发、测试和生产环境的一致性ÿ…...

Linux 入门基础知识(一)—— Linux的基本使用
Linux 入门基础知识 一、Linux的基本使用和配置1.1、终端1.2、消耗内存1.3、运行级别1.6、登录前欢迎语1.5、登录后欢迎语1.6、shell1.7、ps aux1.8、设置主机名1.9、whoami和who am i1.10、命令提示符 二、Linux执行命令的过程详解和命令类型2.1、命令执行2.2、hash缓存表2.3、…...
挑战杯推荐项目
“人工智能”创意赛 - 智能艺术创作助手:借助大模型技术,开发能根据用户输入的主题、风格等要求,生成绘画、音乐、文学作品等多种形式艺术创作灵感或初稿的应用,帮助艺术家和创意爱好者激发创意、提高创作效率。 - 个性化梦境…...

智慧医疗能源事业线深度画像分析(上)
引言 医疗行业作为现代社会的关键基础设施,其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入,智慧医疗能源事业线应运而生,致力于通过创新技术与管理方案,重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...
CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型
CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...
Spring Boot 实现流式响应(兼容 2.7.x)
在实际开发中,我们可能会遇到一些流式数据处理的场景,比如接收来自上游接口的 Server-Sent Events(SSE) 或 流式 JSON 内容,并将其原样中转给前端页面或客户端。这种情况下,传统的 RestTemplate 缓存机制会…...

中南大学无人机智能体的全面评估!BEDI:用于评估无人机上具身智能体的综合性基准测试
作者:Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位:中南大学地球科学与信息物理学院论文标题:BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接:https://arxiv.…...
Golang dig框架与GraphQL的完美结合
将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用,可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器,能够帮助开发者更好地管理复杂的依赖关系,而 GraphQL 则是一种用于 API 的查询语言,能够提…...
postgresql|数据库|只读用户的创建和删除(备忘)
CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...

【单片机期末】单片机系统设计
主要内容:系统状态机,系统时基,系统需求分析,系统构建,系统状态流图 一、题目要求 二、绘制系统状态流图 题目:根据上述描述绘制系统状态流图,注明状态转移条件及方向。 三、利用定时器产生时…...
VTK如何让部分单位不可见
最近遇到一个需求,需要让一个vtkDataSet中的部分单元不可见,查阅了一些资料大概有以下几种方式 1.通过颜色映射表来进行,是最正规的做法 vtkNew<vtkLookupTable> lut; //值为0不显示,主要是最后一个参数,透明度…...

ElasticSearch搜索引擎之倒排索引及其底层算法
文章目录 一、搜索引擎1、什么是搜索引擎?2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长,文件大。2.其次,树深,IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...