数据治理与管理
引入
上一篇我们聊了数仓架构设计,它是企业构建数据中台的基石。其本质就是构建一个可靠易用的架构,可以借此将原始数据汇聚、处理,最终转换成可消费使用的数据资源。
在拥有数据资源以后,我们就需要考虑如何利用它,为企业创造价值,让它变成企业的资产而不是负担。也就是要实现数据资产化,将数据资源变成质量可靠,安全合规,经济易用的数据资产。
而数据资产化,就需要通过本文主角数据治理与管理来实现。
数据治理与数据管理
数据治理概念是在20世纪90年代提出的,率先大规模开展数据治理工作的是强监管要求下的以银行为代表的金融业。DAMA对数据治理的定义是:数据治理(Data Governance,DG)是指对数据资产管理行使权力和控制的活动集合(规划、监督和执行)。
而中国信通院对数据资产管理的定义是:对数据资产进行规划、控制和提供的一组活动职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。
可以看到,数据治理的核心在于企业顶层设计和战略规划。它是数据管理活动的总纲和指导,强调组织模式、职责分工和标准规范,比如明确数据管理过程中有哪些决策要制定、由谁负责等。而数据管理是为实现数据资产价值的获取、控制、保护、交付及提升,对项目、政策和实践所做的计划、执行和监督。
下面我们梳理一下数据治理与管理在企业应该如何设计落地:
目标
首先,自然是要确定我们资产化的目标。其核心就是将企业的数据资源统一管理起来,实现数据的可见、可懂、可用。
可见(Visibility)
可见,是指企业能够清晰地了解和掌握其拥有的数据资产的全貌。
- 数据使用方可以快速、精确地查找到自己想要的数据;
- 数据管理者可以及时、准确地评估数据质量的现状。
可懂(Comprehensibility)
可懂,是指数据具有清晰、准确、易理解的描述和定义,包括数据的业务含义、使用场景、数据质量等信息。并且数据无论是业务定义还是加工处理口径,在整个企业层面都是统一、无歧义的。
可用(Usability)
可用,是指数据的可信度高,无论是数据质量,还是数据安全,都有相应规范和保障措施;并且数据使用便捷,有完善的数据服务和共享能力。
实现
具体实现要从两方面入手&#
相关文章:
数据治理与管理
引入 上一篇我们聊了数仓架构设计,它是企业构建数据中台的基石。其本质就是构建一个可靠易用的架构,可以借此将原始数据汇聚、处理,最终转换成可消费使用的数据资源。 在拥有数据资源以后,我们就需要考虑如何利用它,为企业创造价值,让它变成企业的资产而不是负担。也就…...
什么是HTTP/2协议?NGINX如何支持HTTP/2并提升网站性能?
HTTP/2是一种用于在Web浏览器和服务器之间进行通信的协议,旨在提高网站性能和加载速度。它是HTTP/1.1的继任者,引入了许多优化和改进,以适应现代Web应用的需求。HTTP/2的主要目标是减少延迟、提高效率,以及更好地支持并发请求。 …...
安全运维,等保测试常见解决问题。
1. 未配置口令复杂度策略。 # 配置密码安全策略 # vi /etc/pam.d/system-auth # local_users_only 只允许本机用户。 # retry 3 最多重复尝试3次。 # minlen12 最小长度为12个字符。 # dcredit-1 至少需要1个数字字符。 # ucredit-1 至少需要1个大…...
jmeter接口测试(二)
一、不同参数类型的接口测试 二、动态参数接口处理 随机数 工具——>函数助手对话框(Random 1000-10000之间的随机数 变量名为rdn)如下图所示 把上图生成的函数字符串复制到想要使用的地方如下图 三、断言 1、状态断言,200 不能证明…...
Keil ARM Complier Missing Compiler Version 5
使用Keil软件时出现了编译时报错,找不到对应的ARM版本,报错Target Target 1 uses ARM-Compiler Default Compiler Version 5 which is not available. *** Please review the installed ARM Compiler Versions: Manage Project Items - Folders/Extensions to manage ARM Compi…...
【僵尸进程】
【僵尸进程】 目录:知识点1. 僵尸进程的定义2. 僵尸进程产生的原因3. 僵尸进程的危害4. 如何避免僵尸进程 代码示例产生僵尸进程的代码示例避免僵尸进程的代码示例(父进程主动回收)避免僵尸进程的代码示例(信号处理) 运…...
【框架】参考 Spring Security 安全框架设计出,轻量化高可扩展的身份认证与授权架构
关键字:AOP、JWT、自定义注解、责任链模式 一、Spring Security Spring Security 想必大家并不陌生,是 Spring 家族里的一个安全框架,特别完善,但学习成本比较大,不少开发者都觉得,这个框架“很重” 他的…...
【Git 学习笔记_27】DIY 实战篇:利用 DeepSeek 实现 GitHub 的 GPG 密钥创建与配置
文章目录 1 前言2 准备工作3 具体配置过程3.1. 本地生成 GPG 密钥3.2. 导出 GPG 密钥3.3. 将密钥配置到 Git 中3.4. 测试提交 4 问题排查记录5 小结与复盘 1 前言 昨天在更新我的第二个 Vim 专栏《Mastering Vim (2nd Ed.)》时遇到一个经典的 Git 操作问题:如何在 …...
微信小程序地图map全方位解析
微信小程序地图map全方位解析 微信小程序的 <map> 组件是一个功能强大的工具,可以实现地图展示、定位、标注、路径规划等多种功能。以下是全方位解析微信小程序地图组件的知识点: 一、地图组件基础 1. 引入 <map> 组件 在页面的 .wxml 文…...
调试无痛入手
在调试过程中,Step In、Step Over 和 Step Out 是控制代码执行流程的常用操作,帮助开发者逐行或逐块检查代码行为。以下是它们的详细介绍及使用方法: 1. Step In 功能:进入当前行的函数或方法内部,逐行执行其代码。使…...
【蓝桥杯集训·每日一题2025】 AcWing 6135. 奶牛体检 python
6135. 奶牛体检 Week 1 2月21日 农夫约翰的 N N N 头奶牛站成一行,奶牛 1 1 1 在队伍的最前面,奶牛 N N N 在队伍的最后面。 农夫约翰的奶牛也有许多不同的品种。 他用从 1 1 1 到 N N N 的整数来表示每一品种。 队伍从前到后第 i i i 头奶牛的…...
AI发展迅速,是否还有学习前端的必要性?
今天有个小伙伴跟我讨论:“现在 AI 发展迅速,是否还有学习 JS 或者 TS 及前端知识的必要?” 我非常肯定地说: 是的,学习 JavaScript/TypeScript 以及前端知识仍然非常必要,而且在可预见的未来,…...
【数据标准】数据标准化是数据治理的基础
导读:数据标准化是数据治理的基石,它通过统一数据格式、编码、命名与语义等,全方位提升数据质量,确保准确性、完整性与一致性,从源头上杜绝错误与冲突。这不仅打破部门及系统间的数据壁垒,极大促进数据共享…...
VS2022配置FFMPEG库基础教程
1 简介 1.1 起源与发展历程 FFmpeg诞生于2000年,由法国工程师Fabrice Bellard主导开发,其名称源自"Fast Forward MPEG",初期定位为多媒体编解码工具。2004年后由Michael Niedermayer接任维护,逐步发展成为包含音视频采…...
three.js之特殊材质效果
*案例42 创建一个透明的立方体 <template><div ref"container" className"container"></div> </template><script setup> import * as THREE from three; import WebGL from three/examples/jsm/capabilities/WebGL.js // 引…...
Qt常用控件之日历QCalendarWidget
日历QCalendarWidget QCalendarWidget 是一个日历控件。 QCalendarWidget属性 属性说明selectDate当前选中日期。minimumDate最小日期。maximumDate最大日期。firstDayOfWeek设置每周的第一天是周几(影响日历的第一列是周几)。gridVisible是否显示日历…...
vxe-table 如何实现跟 Excel 一样的数值或金额的负数自动显示红色字体
vxe-table 如何实现跟 Excel 一样的数值或金额的负数自动显示红色字体,当输入的值为负数时,会自动显示红色字体,对于数值或者金额输入时该功能就非常有用了。 查看官网:https://vxetable.cn gitbub:https://github.co…...
DINOv2 + yolov8 + opencv 检测卡车的可拉拽雨覆是否完全覆盖
最近是接了一个需求咨询图像处理类的,甲方要在卡车过磅的地方装一个摄像头用检测卡车的车斗雨覆是否完全, 让我大致理了下需求并对技术核心做下预研究 开发一套图像处理软件,能够实时监控经过的卡车并判断其车斗的雨覆状态。 系统需具备以下…...
算法日记27:完全背包(DFS->记忆化搜索->倒叙DP->顺序DP->空间优化)
一、暴力搜索(DFS) O ( n 2 ) O(n^2) O(n2) 1.1)思路解析 1、注意和01背包的区别在于每个物品可以无限次选择 注意在完全背包中,当一个物品被选择过一次,我们仍然需要考虑是否继续选择这个物品 01背包: …...
Linux 命令大全完整版(14)
5. 文件管理命令 chgrp(change group) 功能说明:变更文件或目录的所属群组。语 法:chgrp [-cfhRv][–help][–version][所属群组][文件或目录…] 或 chgrp [-cfhRv][–help][–version][–reference<参考文件或目录>][文件或目录…]补充说明&…...
新建工程2
我们把stm32最小开发板和stlink链接好后,开始进入keil。 打开魔术棒按钮选择debug,这个调试器默认为ulink。所以我们改为stlink debug。 然后点击旁边的setting按钮,在flash Download里把reset and run这一项勾上。(勾上这项后&a…...
如何3分钟解决百度网盘提取码难题:baidupankey完全指南
如何3分钟解决百度网盘提取码难题:baidupankey完全指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾因找不到百度网盘提取码而错过重要资源?当朋友分享学习资料、同事发送工作文件ÿ…...
如何在 Vite + React 项目中禁用自动热更新(HMR)
本文详解如何在 vite 开发服务器中彻底禁用热模块替换(hmr),避免长时间操作(如大文件上传、复杂计算)因页面自动刷新而中断进度,同时提供配置示例与关键注意事项。 本文详解如何在 vite 开发服务器中彻…...
Karpathy 新作!nanochat:48 美元训练自己的 GPT-2,单GPU 节点即可运行
Karpathy 新作!nanochat:48 美元训练自己的 GPT-2,单 GPU 节点即可运行 Andrej Karpathy 再次带来惊喜!nanochat 让 LLM 训练变得前所未有的简单和便宜 项目简介 nanochat 是 AI 界传奇人物 Andrej Karpathy 最新开源的 LLM 训练框架,目前已在 GitHub 上获得 52.2k stars…...
锐捷AP远程管理实战:用SSH替代Telnet,并让AP自动分配IP(AP3320为例)
锐捷AP3320安全运维指南:从Telnet迁移到SSH与自动化IP分配 当你第一次接触企业级无线接入点设备时,可能会被各种管理协议和网络配置搞得晕头转向。作为网络管理员,我们常常需要在便利性和安全性之间寻找平衡点。以锐捷AP3320为例,…...
标题:深度探索:利用WeixinSogou爬取微信公众号文章的利器
标题:深度探索:利用WeixinSogou爬取微信公众号文章的利器 【免费下载链接】weixin_sogou 爬取微信公众号文章 项目地址: https://gitcode.com/gh_mirrors/we/weixin_sogou 在这个信息爆炸的时代,微信公众号已成为我们获取资讯的重要途…...
C语言手把手实现最小二乘法曲线拟合(附与Matlab对比测试)
C语言实战:从零构建最小二乘法曲线拟合引擎 在嵌入式系统和资源受限环境中,开发者常常面临一个棘手问题:如何在不依赖商业数学软件的情况下实现高精度曲线拟合?我曾在一个工业传感器项目中,因为无法使用Matlab而不得不…...
计算机网络习题及答案
仅供参考第一章 概述1、计算机网络可以向用户提供哪些服务?答:基于互联网的连通性和共享,计算机网络可以向用户提供:①信息交换服务,如电子邮件(收发信息)、文件传输(上传和下载大文…...
大模型分类全景图:文本、视觉、视频、多模态——区别在哪?怎么选?能跨界干活吗?
大模型不是“越大越好”,而是像不同工种的特种兵:文本模型是笔杆子秘书,视觉模型是火眼金睛质检员,视频模型是剪辑导演二合一,而多模态模型是能边看边说、边听边写的全能翻译官。下面用真实能力对比表 可运行代码示例…...
国密随机性检测实战:用Python复现GM/T 0005标准,对比NIST SP800-22r1a的11个相同测试项
国密随机性检测实战:用Python复现GM/T 0005标准,对比NIST SP800-22r1a的11个相同测试项 在密码学和安全工程领域,随机数的质量直接决定了加密系统的可靠性。一个看似微小的随机性缺陷,可能导致整个安全体系的崩塌。本文将带您深入…...
