数据仓库项目启动与管理
数据仓库项目启动与管理
确定项目
评估项目就绪情况
项目就绪的三个条件
- 强力型高级业务管理发起人
- 对数据仓库解决方案的影响有先见之明
- 是所在组织内有影响的领导者
- 要求严格,但是又比较现实,会为其他成员提供强力支持
- 强制型业务动机
- 数据仓库系统和战略性业务动机紧密结合在一起
- 可行性
- 数据仓库准备过程中和数据本身相关的可行性,若缺失,脏造成预处理十分复杂,甚至没有收集到,就会面对比较重大的可行性问题.
- 评估可行性主要是使用数据探查技术,主要描述数据的内容 一致性 结构
弥补不足并确定下一步工作
- 低质量的数据: 项目不当继续进行,应当为业务发起人确定另一个业务价值高且数据可行性障碍比较少的需求,同时在项目延缓期间,解决数据方面的问题
- 能力弱的业务发起人和仅动IT的发起人: 需要再机构中物色新的业务发起人 最有效的方法是进行一次高层业务需求分析
- 理解业务管理部门的战略性商业计划
- 为他们监控和施加影响的每个核心业务过程确定主要的绩效度量或者成功标准
- 确定业务信息访问的改进对业务的潜在影响 进行概念验证不能成为放弃与功能性业务部门直接交互的理由,不应该单纯地进行概念验证
- 多个业务发起人提出过多要求: 借助促谈会进行一次协商 基于对业务价值和可行性的综合评估业务需求优先次序
- 过于冒进的业务发起人: 坚持在项目中立即继承多个重要的源系统 每引进一个新的主要数据源就将数据仓库的开发周期延长6个月,有助于将精力集中到正确的主题上
确定初步范围和章程
项目范围的确定应该由业务需求来驱动,在生命周期图中,这种关系是由"项目/项目群规划" "业务需求定义"两个方框之间的双向箭头来表示的
-
聚焦与一个单独的业务过程: 集中关注单个业务过程有助于为设计和开发迭代确定一个更易处理的范围,在项目缺的早期成型阶段 较为合理的做法是仅仅从单个源系统重提取和转换数据
- 在项目早期,每次迭代中都应当将数据的来源限定到单个业务过程中,当单个实现周期中多个业务过程的度量固定下来的时候,数据抽取,转换,装载方面的工作量都会成指数增长
- 补充原则
- 范围有意义且易于处理
- 需要IT代表与业务代表的共同努力
- 一旦范围确定下来就应当确立项目的成功标准
-
快速应用程序开发
- 精力集中于要交付业务价值的主要目标上
- 业务代表与开发团队之间的价值协作
- 同业务代表进行面对面沟通 反馈和确定优先级等熊东
- 尽快适应金华后的需求 变更是不可避免的
- 以迭代 怎两的方式处理可冲用软件的开发问题 多层任务并发重叠
- 一种开发模型并不能适用于所有项目群 BI团队成员在工作中要尽可能接近业务 另一方面 在显示世界中提取 转换 装载过程本来就比较复杂 而且还依赖于结构与顺序
- 不要凭空创建分析方法 或者报告方案 如果条件合适 鼓励使用敏捷开发方法 但是必须避免建立孤立的数据集
- 经常需要进行功能发布 也必须在整体架构 和总体规划的背景下实现
-
编制项目群范围 章程文档
- 背景
- 工程范围
- 工程之外的事项
- 工程成功的标准
- 风险和降低风险的行动方案
建立商业报告和合理性证明
- 确定财政投资和成本
- 确定财务效益和收益
- 利用投资和回报计算ROI
项目规划
-
确立项目标识
-
项目人员配备
- 决策人员
- 数据仓库主管
- 指导者,项目经理和项目领导者
- 核心项目团队
- 专门团队
-
指定项目计划 数据仓库项目需要一份详细的综合的项目计划 应当从项目任务和项目参加人员两个方面来考虑复杂性
-
细节跟踪
-
任务目标跟踪
-
人员
-
原来估算的工作量
-
原来估算的开始日期
-
原来估算的完成日期
-
状态
-
更新后的开始日期
-
更新后的完成日期
-
完成工作量
-
延迟天数
-
完成百分比
依赖关系
-
-
制定沟通计划
- 确定每个团队每个团队的沟通频率 形式 消息
- 需要和发起人和驱动者面对面的沟通
- 与业务用户us合区沟通
- 同其他有关方进行沟通
项目管理
-
交叉功能实施团队: 该团队所有成员在DW/BI项目中承担不同职责 紧密监控项目状态
-
迭代开发周期: 数据仓库环境的开发过程没有尽头 需要更多沟通来保证人员的同步 需要对问题/变化进行跟踪 确保今后系统功能的提升 需要详细的项目文档来支持团队各项工作的展开
-
不可避免的数据问题: 数据项目很容易受到各种未知数据问题的困扰 这会严重损害进行精心制定的项目计划 需要再设计各个候选数据源的数据管道之前 尽可能早地进行数据探查
-
高可见度: 业务机构对数据仓库的期望值都会很高 因此必须进行主动沟通来确保这些期望在掌控之中
召开项目团队启动会议
- 工程目标与目的
- 工程范围
- 团队角色与职责
- 团队工程管理
- 问题与解答
- 后续步骤
监控项目状态
- 项目状态会议
- 审查项目计划
- 审查问题和后续工作
- 审查变更请求
- 公告/一般性评论.问题和解答
- 项目状态报告: 项目状态报告提供了项目进度和高层快照,报告的提交和定期安排的状态会议应当同步
维护项目计划
整个项目计划应当每周更新一次 以便能够准确地反映项目的进展情况 随后还应当同核心团队共享更新后的计划.
项目计划应当反映事实 不论是好事 坏事 还是令人讨厌的事情 今早识别出项目计划中存在的问题 就可以使项目团队制定适当的策略 从而使下游连锁反应减少到最小
整理项目文档
数据仓库项目具有不断发展的特性 这就需要对项目文档进行整理 当时间压力不断增加 首先会考虑取消的事项通过长是编制正式的文档 一定要避免调入这样的陷阱
项目文档包括:
- 所有项目沟通的情况
- 需要提交的主要项目资料的副本
范围管理
数据仓库项目必然会发生变化,项目经理必须管理项目范围变更
- 鼓励关注业务用户和他们的需求
- 需要沿着系统开发的轨迹前进
对于未定义用户请求时:
- 对请求说"不"
- 保持工作量总体不变 对范围内外的内容进行调整
- 对项目范围进行扩展 随后强制性地延长项目期限 并适当增加项目预算
项目经理不应当凭空确定项目范围 在评价项目范围候选方案时 IT和业务的密切合作至关重要
问题跟踪
- 问题和问题描述
- 问题识别日期
- 呈报方
- 归属方
- 状态
- 优先级别
- 预定解决日期
- 结束日期
变更控制
- 变更请求控制和相关描述
- 请求日期
- 请求递交方
- 优先级别(按业务影响)
- 归属方
- 估计工作量
- 估计成本
- 状态
- 结束日期
范围管理
- 执行沟通计划
- 使用户参与生命周期的整个过程
辨识项目陷入困境的征兆
- 没有从高级业务机构引入有影响力的设计人员
- 认为参与项目的人员能够学习工作中所需的所有知识
- 一次性处理的任务过多
- 一心专注于技术层面而没有集中注意力于业务目标和需求
- 认为在整个项目生命周期中不需要业务机构参与就可以进行数据仓库项目的开发
- 在明知数据源质量较差甚至很糟的情况下 没有认真研究数据能否支持开发任务 就承诺向前推进项目的开发进程
- 低估了数据清洗和质量保证的工作量
- 过于关注ETL而葫芦哦了BI查询性能和是否易于使用
- 没有认识到数据仓库项目的成功与用户的验收息息相关 如果业务机构并没有认可数据仓库系统 也没有将其作为改进决策指定的基础 那么努力就白费了
项目群管理
- 确立管理职责和管理过程
- 将数据管理员的地位提升到企业层 建立企业级架构是项目群层应该关注的重要问题 与其让每个部门都建立独立的 以部门为中心的数据库 不如对公司的信息资源预先进行规划和管理 数据管理员应当为企业内部的所有交叉机构信息确立通用的定义和业务转换规则
- 机构的描述性主数据应当进行集中处理 随后分发给需要相关信息的项目
- 核心的绩效度量应当从源系统中一次性抽取和共享 而不是每个部门重复的抽取自己感兴趣的信息
- 利用高效的方法和架构最优方法
- 进行定期评估
- 沟通沟通沟通沟通
相关文章:
数据仓库项目启动与管理
数据仓库项目启动与管理 确定项目 评估项目就绪情况 项目就绪的三个条件 强力型高级业务管理发起人 对数据仓库解决方案的影响有先见之明是所在组织内有影响的领导者要求严格,但是又比较现实,会为其他成员提供强力支持 强制型业务动机 数据仓库系统和战略性业务动机紧密结合…...
并行治理机制对比:Polkadot、Ethereum 与 NEAR
治理是任何去中心化网络的基础。它塑造了社区如何发展、如何为创新提供资金、如何应对挑战以及如何随着时间的推移建立信任。随着 Web3 的不断发展,决定这些生态系统如何做出决策的治理模型也在不断发展。 在最近的一集的【The Decentralized Mic】中, Polkadot 汇…...
利用 PHP 爬虫按关键字搜索淘宝商品
在当今数字化时代,网络爬虫技术已成为获取网络数据的重要手段之一。淘宝作为国内最大的电商平台之一,拥有海量的商品信息。通过 PHP 爬虫技术,我们可以实现按关键字搜索并抓取淘宝商品信息。以下将详细介绍如何使用 PHP 实现这一功能。 一、…...
在未归一化的线性回归模型中,特征的尺度差异可能导致模型对特征重要性的误判
通过数学公式来更清晰地说明归一化对模型的影响,以及它如何改变特征的重要性评估。 1. 未归一化的情况 假设我们有一个线性回归模型: y β 0 β 1 x 1 β 2 x 2 ϵ y \beta_0 \beta_1 x_1 \beta_2 x_2 \epsilon yβ0β1x1β2x2ϵ 其…...
TDengine tar.gz和docker两种方式安装和卸载
下载地址 3.1.1.0 Linux版本 安装包 下载地址 3.1.1.0 docker 镜像 下载地址 3.1.1.0 Window客户端 1. 将文件上传至服务器后解压 tar -zxvf TDengine-server-3.1.1.0-Linux-x64.tar.gz 2. tar.gz安装 解压文件后,进入相应子目录,执行其中的 install.…...
【STM32设计】基于STM32的智能门禁管理系统(指纹+密码+刷卡+蜂鸣器报警)(代码+资料+论文)
本课题为基于单片机的智能门禁系统,整个系统由AS608指纹识别模块,矩阵键盘,STM32F103单片机,OLED液晶,RFID识别模块,继电器,蜂鸣器等构成,在使用时,用户可以录入新的指纹…...
贪心算法,其优缺点是什么?
什么是贪心算法? 贪心算法(Greedy Algorithm)是一种在每一步选择中都采取在当前状态下最优(局部最优)的选择,从而希望导致全局最优解的算法策略。 它不像动态规划那样考虑所有可能的子问题,而是做出局部最优选择,依赖这些选择来…...
java知识梳理(二)
一.lambda表达式 作用:Lambda 表达式在 Java 8 引入,主要用于简化匿名内部类的写法,特别是在函数式编程场景中,比如 函数式接口、流式 API(Streams)、并发编程等。它让 Java 代码更简洁、可读性更强&#x…...
鸿蒙Flutter实战:20. Flutter集成高德地图,同层渲染
本文以同层渲染为例,介绍如何集成高德地图 完整代码见 Flutter 鸿蒙版 Demo 概述 Dart 侧 核心代码如下,通过 OhosView 来承载原生视图 OhosView(viewType: com.shaohushuo.app/customView,onPlatformViewCreated: _onPlatformViewCreated,creation…...
c++中%符号使用的注意事项/易错点
在C中,% 是取模运算符(modulus operator),用于计算两个数相除后的余数。虽然它的用法看起来简单,但在实际编程中有一些需要注意的细节和易错点。以下是关键注意事项: 1. 操作数必须为整数类型 % 只能用于整…...
AI辅助下基于ArcGIS Pro的SWAT模型全流程高效建模实践与深度进阶应用
目前,流域水资源和水生态问题逐渐成为制约社会经济和环境可持续发展的重要因素。SWAT模型是一种基于物理机制的分布式流域水文与生态模拟模型,能够对流域的水循环过程、污染物迁移等过程进行精细模拟和量化分析。SWAT模型目前广泛应用于流域水文过程研究…...
Java 基础-30-单例设计模式:懒汉式与饿汉式
在软件开发中,单例设计模式(Singleton Design Pattern)是一种常用的设计模式,它确保一个类只有一个实例,并提供一个全局访问点。这种模式通常用于管理共享资源(如数据库连接池、线程池等)或需要…...
尚语翻译图册翻译|专业图册翻译|北京专业翻译公司推荐|专业文件翻译报价
内容概要 尚语翻译公司聚焦多语种产品图册翻译的竞价推广服务,通过行业垂直化运营构建差异化竞争力。其核心服务覆盖机械制造、医疗器械、电子元件三大领域,依托ISO 17100认证的翻译流程和Trados术语管理系统,实现技术文档的精准转化。为提升…...
杂篇-行业分类一二-2(通、专用设备制造,汽车制造)
接上篇, 本篇列举制造业中另外几个细分行业:通用设备制造,专用设备制造,汽车制造业。 一、通用设备制造 分类 序号 类别名称 说明 1 锅炉及原动设备制造 1 锅炉及辅助设备制造 指各种蒸汽锅炉、汽化锅炉,以及…...
[笔记.AI]大模型训练 与 向量值 的关系
(借助 DeepSeek-V3 辅助生成) 大模型在训练后是否会改变向量化的值,取决于模型的训练阶段和使用方式。以下是详细分析: 1. 预训练阶段:向量化值必然改变 动态调整过程: 在预训练阶段(如BERT、…...
LeetCode 解题思路 30(Hot 100)
解题思路: 递归参数: 生成括号的对数 n、结果集 result、当前路径 path、左括号数 open、右括号数 close。递归过程: 当当前路径 path 的长度等于 n * 2 时,说明已经生成有效括号,加入结果集。若左括号数小于 n&…...
Java EE(18)——网络原理——应用层HTTP协议
一.初识HTTP协议 HTTP(HyperText Transfer Protocol,超文本传输协议)是用于在客户端(如浏览器)和服务器之间传输超媒体文档(如HTML)的应用层协议。 HTTP协议发展至今发布了多个版本,其中1.0,1.…...
强大而易用的JSON在线处理工具
强大而易用的JSON在线处理工具:程序员的得力助手 在当今的软件开发世界中,JSON(JavaScript Object Notation)已经成为了数据交换的通用语言。无论是前端还是后端开发,我们都经常需要处理、验证和转换JSON数据。今天&a…...
Qt笔记----》不同环境程序打包
文章目录 概要1、windows环境下打包qt程序2、linux环境下打包qt程序2.1、程序目录2.2、创建一个空文件夹2.3、添加依赖脚本2.4、打包过程2.4.1、添加程序依赖库2.4.2、添加Qt相关依赖库 概要 qt不同运行环境下打包方式:windows/linux 1、windows环境下打包qt程序 …...
企业服务器备份软件,企业服务器备份的方法有哪些?
企业服务器备份需综合考虑数据量、业务连续性要求(RTO/RPO)、合规性及成本等因素。以下是分场景的工具和方法指南: 一、备份软件推荐 1. 80KM备份软件 80KM备份软件可以进行很复杂的备份方式,也可以内网对内网备份、还能内网的…...
Vue3 表单
Vue3 表单 随着前端技术的发展,Vue.js 作为一款流行的前端框架,不断更新迭代,以适应更高效、更便捷的开发需求。Vue3 作为 Vue.js 的第三个主要版本,引入了许多新特性和改进,其中包括对表单处理机制的优化。本文将深入探讨 Vue3 表单的使用方法、技巧以及注意事项。 1. …...
html5炫酷图片悬停效果实现详解
html5炫酷图片悬停效果实现详解 这里写目录标题 html5炫酷图片悬停效果实现详解项目介绍技术栈核心功能实现1. 页面布局2. 图片容器样式3. 炫酷悬停效果缩放效果倾斜效果模糊效果旋转效果 4. 悬停文字效果5. 性能优化6. 响应式设计 项目亮点总结 项目介绍 本文将详细介绍如何使…...
安徽京准:GPS北斗卫星校时服务器助力大数据云计算
安徽京准:GPS北斗卫星校时服务器助力大数据云计算 安徽京准:GPS北斗卫星校时服务器助力大数据云计算 GPS北斗卫星校时服务器在大数据与云计算系统中发挥着关键作用,其通过提供高精度、高可靠的时间同步服务,解决了分布式系统的核…...
【Linux】内核驱动学习笔记(二)
7、framebuffer驱动详解 7.1、什么是framebuffer (1)裸机中如何操作LCD (2)OS下操作LCD的难点 (3)framebuffer帧缓冲(简称fb)是linux内核中虚拟出的一个设备 (4)framebuffer向应用层提供一个统一标准接口的显示设备 (5)从驱动来看,fb是一个…...
机器学习的一百个概念(5)数据增强
前言 本文隶属于专栏《机器学习的一百个概念》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见[《机器学习的一百个概念》 ima 知识库 知识库广场搜索&…...
在MCU工程中优化CPU工作效率的几种方法
在嵌入式系统开发中,优化 CPU 工作效率对于提升系统性能、降低功耗、提高实时性至关重要。Keil 作为主流的嵌入式开发工具,提供了多种优化策略,包括 关键字使用、内存管理、字节对齐、算法优化 等。本文将从多个方面介绍如何在 Keil 工程中优…...
优化程序命名:提升专业感与用户体验
在软件开发的广阔天地中,程序命名这一环节常常被开发者们忽视。不少程序沿用着简单直白、缺乏雕琢的名字,如同素面朝天的璞玉,虽不影响其核心功能的发挥,但却在无形之中错失了许多提升用户印象与拓展应用场景的机会。今天…...
美团民宿 mtgsig 小程序 mtgsig1.2 分析
声明 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 逆向分析 cp execjs.compile(open(民…...
短视频团队架构工作流程---2025.3.30 李劭卓
短视频团队架构&工作流程—2025.3.30 李劭卓 文章目录 短视频团队架构&工作流程---2025.3.30 李劭卓1 工作职责1.1 编剧:1.2 主编:1.3 总编:1.4 导演:1.5 摄影:1.6 演员:1.7 后期:1.8 美…...
es 集群存储字典 json字段----python实现
本人的意思是value为json格式数据,而不是简单的如下这种:这种我就没有必要写个博文,肯定是复杂的情况啊。 from elasticsearch import Elasticsearch import json# 创建Elasticsearch客户端 es = Elasticsearch([{host: localhost, port: 9200}])# 定义要存储的字典 my_dic…...
