数据中台是什么?:架构演进、业务整合、方向演进
文章目录
- 1. 引言
- 2. 数据中台的概念与沿革
- 2.1 概念定义
- 2.2 历史沿革
- 3. 数据中台的架构组成与关键技术要素解析
- 3.1 架构组成
- 3.2 关键技术要素
- 4. 数据中台与其他平台的对比
- 详细解析
- 5. 综合案例:金融行业数据中台落地实践
- 5.1 背景
- 5.2 解决方案
- 5.3 成果与价值
- 6. 方向演进
- 6.1 智能化与自动化
- 6.2 多云与混合架构
- 6.3 数据隐私与合规
- 6.4 服务生态化
- 7. 结语
1. 引言
在数字化转型的大背景下,企业面临数据孤岛、信息冗余与决策滞后的问题。数据中台作为整合企业数据资产、支持业务协同与敏捷决策的全新架构理念,逐渐受到业内广泛关注。本文旨在系统性地探讨数据中台的来龙去脉,从概念定义、架构要素到业务场景,全面剖析其价值与挑战,并提供企业实践中的前瞻性建议。
2. 数据中台的概念与沿革
2.1 概念定义
数据中台(Data Middle Platform)是指在企业数据治理和数据应用层面建立的一套统一数据管理、共享与服务的体系。其核心在于将企业内部各业务系统产生的数据进行整合、清洗、建模及标准化处理,形成统一的数据服务层,进而支持上层的业务决策、数据分析及应用创新。
2.2 历史沿革
数据中台的理念并非一蹴而就,而是伴随着企业数字化需求的不断升级而逐步演化:
- 初期阶段: 企业数据仓库和数据集市主要面向单一业务报表与决策支持。
- 演进阶段: 随着大数据、云计算和微服务架构的发展,企业逐渐意识到跨部门数据协同的必要性,数据湖和数据集成平台应运而生。
- 现阶段: 数据中台不仅涵盖数据集成和治理,更强调数据服务化、应用复用和业务敏捷响应,是企业数据资产管理和智能决策的重要中枢。
3. 数据中台的架构组成与关键技术要素解析
3.1 架构组成
数据中台通常由五个层级构成,每一层均承担着特定的功能,同时又彼此协同,共同支持企业数据驱动决策与业务创新。
-
数据采集层
- 功能定位:
该层负责从各个业务系统、传感设备、日志系统、外部数据源等多种渠道实时采集或定时批量提取数据,涵盖结构化、半结构化和非结构化数据。 - 关键技术与工具:
- 实时采集: 采用 Apache Kafka、RabbitMQ 作为消息队列;利用 Flink、Spark Streaming 处理实时数据流。
- 离线批处理: 利用 Apache NiFi、Sqoop 等工具,从传统数据库或文件系统中批量抽取数据,结合 Apache Spark 实现高效批处理。
- 全流程衔接:
数据经过初步清洗和预处理后,迅速进入下一层存储或治理流程,保证数据在进入核心系统前具备基本的准确性和一致性。
- 功能定位:
-
数据治理层
- 功能定位:
该层是数据中台的“质量守门员”,主要负责数据质量管理、元数据管理、数据血缘分析和标准化处理。它通过制定统一数据标准、数据词典和数据血缘关系,实现对数据全生命周期的管控。 - 关键技术与工具:
- 元数据管理: 利用 Apache Atlas、DataHub 等工具管理元数据,确保数据的溯源和透明性。
- 数据血缘与质量控制: 使用 Informatica、Talend Data Quality 或开源的 Deequ,实现数据血缘追踪、异常检测和数据质量校验。
- 主数据管理(MDM): 建立统一的主数据模型,确保各业务系统对同一数据实体采用统一标准,这正是 DAMA 数据治理理念中“数据一致性与标准化”的体现。
- 全流程衔接:
数据治理模块将清洗后的数据进行进一步标准化,并通过数据血缘和质量控制,将可信的数据送入存储层,同时为数据服务层提供权威的数据基础。
- 功能定位:
-
数据存储层
- 功能定位:
该层主要负责海量数据的持久化存储与高效计算,采用分布式、弹性扩展的技术架构,以支撑后续的数据服务和应用分析。 - 关键技术与工具:
- 分布式存储: Hadoop HDFS 用于存储海量文件;HBase、Cassandra 等 NoSQL 数据库支持快速读写;Elasticsearch 则用于分布式检索。
- 大数据计算: Spark、Flink 提供大规模数据计算能力;云存储(如 AWS S3、阿里云 OSS)结合弹性计算资源实现按需扩展。
- 全流程衔接:
数据在此层经过归档和高效索引后,为数据服务层的统一数据建模提供底层支撑,确保数据在规模和性能上的双重保障。
- 功能定位:
-
数据服务层
- 功能定位:
这一层将底层经过标准化的数据,通过统一建模后形成标准数据服务,利用 API 和数据接口将数据以服务化的方式向上层应用开放,支持实时数据查询和业务系统调用。 - 关键技术与工具:
- 数据建模与接口管理: 利用微服务架构(如 Spring Boot、Spring Cloud)构建数据接口;GraphQL 和 RESTful API 使得数据访问灵活高效。
- 服务治理: 采用 API 网关(如 Kong、Zuul 或 Apache APISIX)进行接口统一管理和流量控制,同时结合 Redis、Memcached 实现数据缓存加速。
- 全流程衔接:
该层不仅为上层应用提供标准化数据访问接口,还确保数据安全、权限控制和性能优化,形成了数据驱动业务应用的桥梁。
- 功能定位:
-
数据应用层
- 功能定位:
数据应用层主要面向企业内部的 BI 报表、数据挖掘、机器学习、业务智能和可视化等场景,是数据中台赋能业务创新的终端体现。 - 关键技术与工具:
- 数据分析与可视化: 工具如 Tableau、PowerBI、Looker,或基于 Python、R 的定制分析平台。
- 数据挖掘与机器学习: 利用 TensorFlow、PyTorch 进行模型训练和预测;借助 Spark MLlib 实现大规模机器学习。
- 全流程衔接:
经过数据服务层统一输出的数据为各类业务应用提供了实时、准确的数据支持,使得各业务部门能够基于数据驱动快速响应市场变化与业务需求。
- 功能定位:
下面是数据中台的架构示意图(纯文本展示),有助于直观理解各层间的数据流动和依赖关系:
+--------------------------------------------------------------+
| 数据应用层 |
| (BI、数据挖掘、AI、业务智能、可视化等应用场景) |
+--------------------------------------------------------------+▲│ 数据服务接口 (REST/GraphQL等)▼
+--------------------------------------------------------------+
| 数据服务层 |
| (数据建模、API管理、数据共享、标准数据服务) |
+--------------------------------------------------------------+ ▲│▼
+--------------------------------------------------------------+
| 数据治理层 |
| (数据质量管理、元数据管理、数据标准、数据血缘) |
+--------------------------------------------------------------+▲│▼
+--------------------------------------------------------------+
| 数据存储层 |
| (数据仓库、数据湖、NoSQL、分布式存储、弹性计算) |
+--------------------------------------------------------------+▲│▼
+--------------------------------------------------------------+
| 数据采集层 |
| (实时流、离线批处理、多源数据采集、日志采集、API接入) |
+--------------------------------------------------------------+
3.2 关键技术要素
在确保架构功能完整的同时,数据中台的成功落地还依赖于以下关键技术要素,这些技术不仅解决数据处理的效率和可靠性问题,还为企业数据治理提供了全生命周期的保障。
-
实时与离线处理融合
- 技术原理:
不同业务场景对数据时效性要求不一,采用 Spark、Flink 等技术实现实时流处理,同时结合 Spark Batch 或 MapReduce 实现离线数据加工。 - 应用价值:
实时处理确保数据的低延迟反馈;离线处理则适合批量数据深度计算,两者协同支持精准决策与业务监控。
- 技术原理:
-
分布式存储与计算
- 技术原理:
基于 Hadoop、HBase、Elasticsearch 等分布式系统,结合云计算与容器化技术,实现海量数据的高效存储和横向扩展计算。 - 应用价值:
实现数据存储弹性扩展,满足大数据时代数据量激增的挑战,同时保证高并发查询与数据安全。
- 技术原理:
-
数据治理与标准化
- 技术原理:
借助元数据管理、数据血缘追踪、数据质量控制和主数据管理(MDM)工具(如 Apache Atlas、Informatica、Talend 等),构建全流程数据治理体系。 - 应用价值:
数据治理不仅确保数据的一致性、准确性和可追溯性,也是实现合规管理的重要支撑。遵循 DAMA 数据治理理念,企业能够形成统一的数据资产管理体系,提升数据价值与决策质量。
- 技术原理:
-
服务化与 API 驱动
- 技术原理:
通过 RESTful API、GraphQL 或 gRPC 等服务化接口,将底层数据转换为标准化服务,同时利用 API 网关实现流量控制和安全认证。 - 应用价值:
这种架构设计使得数据中台能够灵活响应各类业务需求,快速集成新的数据源和应用场景,促进内部和外部系统的无缝对接,实现数据资产的高效复用。
- 技术原理:
4. 数据中台与其他平台的对比
下表是展示了数据仓库、数据湖与数据中台在多个关键指标上的差异:
| 指标 | 数据仓库 | 数据湖 | 数据中台 |
|---|---|---|---|
| 数据处理方式 | 主要依赖 ETL 批处理,数据处理周期长 | 原始数据存储为主,后期采用 ELT 或数据探索 | 实时与离线处理融合,兼顾低延迟与深度分析 |
| 数据标准化 | 高度结构化,数据预处理严格,遵循固定模型和数据字典 | 标准化较弱,数据自由度高,原始数据保存完整 | 强调全流程数据治理,构建统一数据模型和标准化管理 |
| 数据共享性 | 面向部分业务系统,数据共享受限于固定业务模型 | 多业务共享、探索性强,但缺乏统一治理 | 全企业共享、跨部门、跨系统的数据复用,支持动态协同 |
| 灵活性 | 业务场景固定,扩展性较差,更新周期较长 | 数据接入灵活,但后期加工和治理成本较高 | 既能保证数据一致性,又能满足业务敏捷需求,具备较高灵活性 |
| 服务能力 | 主要支撑报表与决策支持,服务能力较为单一 | 面向数据存储与探索,服务接口不统一 | 提供标准化数据服务、API 驱动,支持多种业务应用和实时查询 |
| 数据安全与权限 | 采用传统安全机制,权限管理相对静态 | 安全管理能力较弱,需额外配置安全策略和访问控制 | 内嵌数据治理与权限管理,支持精细化安全控制和合规管理 |
| 数据治理与血缘 | 基于固定模型的数据血缘和元数据管理能力有限 | 数据血缘难以理清,元数据管理较为松散 | 强调全生命周期治理,借助工具(如 Apache Atlas、Informatica)实现数据血缘、元数据管理和质量监控 |
| 可扩展性 | 受限于批处理架构和固定硬件配置,横向扩展能力有限 | 存储扩展性好,但计算与治理环节扩展需要额外成本 | 架构基于分布式和微服务设计,支持多云、容器化部署,具备良好的弹性和扩展性 |
| 成本效率 | 存储与计算成本较高,资源利用率较低 | 存储成本较低,但治理、数据清洗与后期加工成本较高 | 成本介于两者之间,通过标准化与自动化治理降低整体 TCO,同时提高数据价值 |
详细解析
-
数据处理方式
- 数据仓库: 主要采用传统的 ETL 批处理流程,数据需要经过严格的预处理和格式转换,适合生成定期报表和支持长期趋势分析。但这种方式往往存在数据更新滞后和处理时延高的问题。
- 数据湖: 直接存储原始数据,采用 ELT(Extract-Load-Transform)模式进行后期加工,便于保存数据完整性和多样性,但后续数据加工、清洗和治理的成本较高,容易形成“数据沼泽”。
- 数据中台: 在处理模式上融合了实时流处理(例如使用 Apache Flink、Spark Streaming)与离线批处理(借助 Spark Batch 或 MapReduce),既满足了业务实时响应需求,又能支持深度数据挖掘与历史趋势分析。
-
数据标准化与治理
- 数据仓库: 借助预定义的模型和数据字典,实现数据的高度结构化和标准化,但其刚性模型难以适应业务变化。
- 数据湖: 由于数据以原始格式存储,标准化较弱,虽然灵活性高,但数据一致性和质量难以保障。
- 数据中台: 强调数据治理理念,借助主数据管理(MDM)、元数据管理和数据血缘工具,实现数据全流程的标准化管理。这不仅符合 DAMA 数据治理要求,还能提升数据可信度和复用效率。
-
数据共享性与灵活性
- 数据仓库: 通常面向固定的报表和决策支持场景,数据共享范围有限,业务间难以灵活交互。
- 数据湖: 支持多业务共享,由于数据类型和格式多样,适合数据探索和创新应用,但缺乏统一的治理体系,跨部门协同较为困难。
- 数据中台: 通过标准化接口(RESTful、GraphQL 等)实现数据服务化输出,既能保证跨部门数据共享的高一致性,又能快速响应各业务单元的定制化需求。
-
服务能力与应用场景
- 数据仓库: 主要面向 BI 分析和报表制作,支持较为固定的业务场景,对数据服务的实时性和交互性要求较低。
- 数据湖: 适合数据存储、探索与实验性分析,但因缺乏统一服务接口,企业在数据驱动决策时需要额外的数据清洗和加工。
- 数据中台: 作为统一数据服务平台,不仅支撑传统报表和决策支持,还能支持实时查询、机器学习模型训练、数据挖掘和业务智能等多样化应用场景,实现业务创新与敏捷响应。
-
数据安全、权限与合规管理
- 数据仓库: 安全机制依赖于传统数据库管理系统和数据中心安全策略,权限管理较为固定。
- 数据湖: 由于数据量大、数据类型多,安全和权限管理挑战较大,需要额外的安全策略和工具。
- 数据中台: 在设计上就集成了数据治理、数据血缘和权限管理机制,通过 API 网关、细粒度权限控制等手段,实现统一安全管控,满足企业合规要求。
-
可扩展性与成本效率
- 数据仓库: 固定硬件和批处理架构限制了横向扩展能力,成本较高且难以应对海量数据增长。
- 数据湖: 存储层通常采用分布式方案(如 Hadoop HDFS),扩展性好,但数据治理和计算资源扩展需额外投入。
- 数据中台: 基于分布式架构和微服务设计,支持多云、容器化部署,实现资源的弹性扩展和高效利用,同时通过自动化治理降低总体拥有成本(TCO)。
5. 综合案例:金融行业数据中台落地实践
5.1 背景
在数字化转型浪潮中,某大型商业银行面临着以下挑战:
- 数据孤岛严重: 各业务系统(如零售、风险管理、营销、核心银行系统等)长期独立运作,数据格式、存储标准和业务口径不统一,导致数据共享和联动困难。
- 数据一致性与标准化不足: 不同部门对同一数据的定义存在偏差,影响了风险评估、客户分析与产品创新等关键业务决策。
- 实时决策需求增强: 随着市场竞争加剧和监管要求不断提升,银行亟需实现对交易、风险、客户行为的实时监控与预警。
- 业务流程创新压力: 在金融科技快速发展的背景下,银行需要借助数据驱动提升业务协同、优化服务体验并推动新产品落地。
基于此,银行决策层决定构建一套数据中台,以整合全行数据资产,实现数据标准化管理、跨部门协同和业务创新驱动,为战略决策提供高质量数据支撑。
5.2 解决方案
银行的数据中台落地实践从技术和业务两个维度进行整体规划,主要包括以下模块和关键措施:
-
数据采集与整合
- 多源数据采集:
- 利用 ETL 工具(如 Informatica、DataStage)和实时流处理平台(例如 Apache Kafka 与 Flink)将核心业务系统(交易、风险管理、CRM、互联网渠道)的数据统一接入。
- 针对结构化数据采用批量抽取,而对日志数据、交易流水等则实现实时抓取,保证数据时效性与完整性。
- 数据整合与预处理:
- 在数据采集层对各系统数据进行初步清洗和格式转换,为后续标准化处理奠定基础;
- 同时,利用数据湖技术(基于 Hadoop HDFS 或云存储如 AWS S3)存储原始数据,以便支持后续深度挖掘和历史回溯。
- 多源数据采集:
-
数据治理与标准化
- 元数据与数据血缘管理:
- 引入 Apache Atlas、DataHub 等元数据管理平台,构建全行统一数据词典,确保各部门使用统一的数据定义和标准。
- 通过数据血缘追踪工具对数据流向、加工过程进行全程监控,确保数据的透明度和可溯性。
- 数据质量控制与主数据管理(MDM):
- 应用 Talend Data Quality、Deequ 等数据质量控制工具,对数据进行清洗、校验、异常检测及修复。
- 建立统一的主数据管理机制,保证客户、账户、交易等核心数据在各系统中的一致性,符合 DAMA 数据治理理念。
- 元数据与数据血缘管理:
-
数据服务化与应用支持
- 标准化数据服务:
- 通过微服务架构(例如基于 Spring Boot 和 Spring Cloud 构建)将标准化数据模型封装成 API 服务,利用 API 网关(如 Kong、Zuul)统一管理和调用。
- 实现数据服务层与前端 BI 系统、风险预警平台及客户分析系统的无缝对接,确保实时数据调用与多维度数据查询。
- 业务应用与智能分析:
- 借助 BI 工具(如 Tableau、PowerBI)和自定义分析平台支持营销决策、风险预警、客户洞察等业务场景。
- 利用机器学习(采用 Spark MLlib、TensorFlow)对海量数据进行建模,开展欺诈检测、信用评分等智能风控应用。
- 标准化数据服务:
-
安全与合规保障
- 权限管理与访问控制:
- 内嵌精细化数据权限管理机制,结合 API 安全网关和身份认证(如 OAuth2、JWT),确保数据访问符合严格的金融合规要求。
- 敏感数据脱敏与审计:
- 对涉及个人隐私和商业敏感数据实施脱敏处理,通过日志监控和审计系统实现访问追踪,满足监管和内部合规审查需求。
- 权限管理与访问控制:
-
业务流程优化与创新驱动
- 跨部门协同:
- 数据中台打通零售、风险、营销等部门信息流,通过统一数据接口实现数据共享,支持协同业务决策和产品创新。
- 实时风控与客户洞察:
- 建立实时监控与预警系统,将实时数据与历史数据融合,为风险管理和市场营销提供精准洞察,助力个性化产品推荐和风险事件快速响应。
- 持续数据赋能:
- 数据中台不仅为当前业务场景提供支持,还预留扩展接口,为未来金融科技创新(如区块链支付、智能投顾)提供数据基础,提升整体竞争力。
- 跨部门协同:
5.3 成果与价值
经过全面落地实践,银行数据中台建设取得了显著成效,从技术和业务两个层面均带来了深远影响:
-
业务协同与决策效率提升:
- 通过数据标准化和跨部门数据共享,各业务单元实现了信息互联互通,打破部门壁垒,大幅提升决策响应速度与协同效率。
-
数据质量与风险控制显著改善:
- 数据治理与主数据管理的实施确保了数据一致性和高质量,帮助银行建立起实时风险监控和预警机制,有效降低欺诈、违约等风险。
-
创新驱动与业务增长:
- 通过智能数据分析和机器学习模型,银行能够更精准地进行客户细分与产品推荐,推动营销创新与客户体验提升,增强市场竞争力。
-
合规与安全保障到位:
- 内嵌的数据权限管理、敏感数据脱敏和日志审计等安全措施,使得数据平台符合监管要求,为业务扩展提供了坚实保障。
-
成本效益与运营优化:
- 数据中台通过标准化、自动化的数据治理和服务化架构,降低了数据运营成本,提升了 IT 资源利用率,为后续的技术迭代和业务扩展留足空间。
6. 方向演进
随着企业数字化转型的不断深入,数据中台作为核心数据治理与应用平台,其未来发展正向以下几个关键方向演进:
6.1 智能化与自动化
- 智能数据治理:
随着 AI 技术的不断成熟,未来数据中台将引入机器学习、深度学习等智能算法,对数据质量进行实时监控与自适应调控。- 异常检测与自动修正: 通过构建智能规则引擎,自动识别数据异常、缺失或偏差,并触发预警及修正机制,提升数据治理的效率和准确性。
- 自动化流程管理: 利用自动化调度与自愈机制,实现 ETL 流程、数据清洗及元数据管理的全流程自动化,降低人工干预风险,提升系统稳定性。
6.2 多云与混合架构
- 云原生技术驱动:
在云计算和容器技术的推动下,数据中台将采用多云或混合部署模式,实现资源的灵活调度与弹性扩展。- 高可用与弹性扩展: 通过 Kubernetes、Docker 等容器编排工具,实现服务的动态扩容和自动容错,确保系统在高并发场景下依然稳定可靠。
- 成本优化: 多云部署模式允许企业根据数据处理需求选择最合适的云服务,实现按需付费,降低整体 TCO(总拥有成本),同时避免单一云服务提供商的锁定风险。
6.3 数据隐私与合规
- 嵌入式隐私保护:
全球数据隐私法规日趋严格,未来数据中台必须内嵌数据脱敏、加密和访问控制等隐私保护机制。- 细粒度权限控制: 利用基于角色的访问控制(RBAC)和属性访问控制(ABAC)策略,实现对敏感数据的精细化管理,确保不同层级用户仅能访问授权数据。
- 审计与合规监控: 通过日志记录与实时审计机制,对数据访问和变更行为进行全程跟踪,满足各类监管要求,保障企业数据安全与合规性。
6.4 服务生态化
- 开放 API 与生态协同:
数据中台不仅是内部数据整合与治理平台,更将成为企业对外数据服务和生态合作的重要支撑。- 数据服务化输出: 通过标准化 API、GraphQL 或 gRPC 等技术,将数据中台打造成企业内部与外部合作的共享数据平台,支持多方数据交互与协同创新。
- 跨企业数据生态: 借助数据中台开放的数据服务接口,企业能够与合作伙伴、第三方开发者构建开放生态,推动产业链上下游数据协同,实现共赢发展。
7. 结语
数据中台作为企业数字化转型的核心战略之一,通过构建统一的数据治理体系和数据服务平台,不仅解决了数据孤岛问题,更推动了业务协同与创新应用。企业在落地数据中台时,需注重技术与治理的平衡,结合实际业务需求进行定制化设计。未来,随着人工智能、云计算等技术的不断演进,数据中台将迎来更多创新机遇,助力企业实现全方位数据驱动的转型升级。
标题图:

相关文章:
数据中台是什么?:架构演进、业务整合、方向演进
文章目录 1. 引言2. 数据中台的概念与沿革2.1 概念定义2.2 历史沿革 3. 数据中台的架构组成与关键技术要素解析3.1 架构组成3.2 关键技术要素 4. 数据中台与其他平台的对比详细解析 5. 综合案例:金融行业数据中台落地实践5.1 背景5.2 解决方案5.3 成果与价值 6. 方向…...
Android FCM推送及通知栏展示
需求: 实现FIrebase Cloud Message推送功能,用户收到通知后,可以悬浮通知,自定义的大/小通知展示在通知栏,判断前台/后台,点击后进行跳转。 步骤: 一、配置及接入依赖库 1.下载 google-serv…...
【Matlab优化算法-第14期】基于智能优化算法的VMD信号去噪项目实践
基于智能优化算法的VMD信号去噪项目实践 一、前言 在信号处理领域,噪声去除是一个关键问题,尤其是在处理含有高斯白噪声的复杂信号时。变分模态分解(VMD)作为一种新兴的信号分解方法,因其能够自适应地分解信号而受到…...
4. Go结构体使用
1、结构体的简介 结构体(Struct)是编程语言中常见的一种复合数据类型,它将不同类型的数据元素(成员)组合成一个单一的实体。通过结构体,程序员可以将具有不同类型和性质的信息绑定到一个对象中,…...
ubuntu20使用tigervnc远程桌面配置记录
一、安装tigervnc sudo apt install tigervnc-common sudo apt install tigervnc-standalone-server二、增加配置文件 安装完后新增配置文件:vim ~/.vnc/xstartup #!/bin/sh #Uncomment the following two lines for normal desktop: #unset SESSION_MANAGER #ex…...
【WB 深度学习实验管理】使用 PyTorch Lightning 实现高效的图像分类实验跟踪
本文使用到的 Jupyter Notebook 可在GitHub仓库002文件夹找到,别忘了给仓库点个小心心~~~ https://github.com/LFF8888/FF-Studio-Resources 在机器学习项目中,实验跟踪和结果可视化是至关重要的环节。无论是调整超参数、优化模型架构,还是监…...
编译spring 6.2.2
如何编译Spring 6.2.2 下载spring 6.2.2 首先,下载spring 6.2.2,地址:下载 解压到你的目录下。 下载gradle 下载gradle,这是spring项目的依赖管理工具,本文下载的是8.12.1。 gradle idea配置如下:在你的…...
【centOS】搭建公司内网git环境-GitLab 社区版(GitLab CE)
1. 安装必要的依赖 以 CentOS 7 系统为例,安装必要的依赖包: sudo yum install -y curl policycoreutils openssh-server openssh-clients postfix sudo systemctl start postfix sudo systemctl enable postfix2. 添加 GitLab 仓库 curl -sS https:/…...
MHTML文件如何在前端页面展示
MHTML文件如何在前端页面展示 需求背景: 目前在给证券公司做项目,但是在使用新系统的过程中,甲方还希望之前之前系统的历史记录可以看到。 最初制定的计划是项目组里面做数据的把原系统页面爬取下来,转成图片,直接给…...
Spring Boot的常用注解
Spring Boot 常用注解 主要分为以下几类: Spring 核心注解Spring Boot 相关注解Spring MVC 相关注解Spring Data JPA 相关注解Spring 事务管理Spring Security 相关注解Spring AOP 相关注解Spring 其他常用注解 下面是详细分类和表格展示👇:…...
【R语言】plyr包和dplyr包
一、plyr包 plyr扩展包主要是实现数据处理中的“分割-应用-组合”(split-apply-combine)策略。此策略是指将一个问题分割成更容易操作的部分,再对每一部分进行独立的操作,最后将各部分的操作结果组合起来。 plyr扩展包中的主要函…...
《XSS跨站脚本攻击》
一、XSS简介 XSS全称(Cross Site Scripting)跨站脚本攻击,为了避免和CSS层叠样式表名称冲突,所以改为了XSS,是最常见的Web应用程序安全漏洞之一,位于OWASP top 10 2013/2017年度分别为第三名和第七名&…...
Golang:精通sync/atomic 包的Atomic 操作
在本指南中,我们将探索sync/atomic包的细节,展示如何编写更安全、更高效的并发代码。无论你是经验丰富的Gopher还是刚刚起步,你都会发现有价值的见解来提升Go编程技能。让我们一起开启原子运算的力量吧! 理解Go中的原子操作 在快…...
代码随想录_二叉树
二叉树 二叉树的递归遍历 144.二叉树的前序遍历145.二叉树的后序遍历94.二叉树的中序遍历 // 前序遍历递归LC144_二叉树的前序遍历 class Solution {public List<Integer> preorderTraversal(TreeNode root) {List<Integer> result new ArrayList<Integer&g…...
详解Swift中 Sendable AnyActor Actor GlobalActor MainActor Task、await、async
详解Swift中 Sendable AnyActor Actor GlobalActor MainActor 的关联或者关系 及其 各自的作用 和 用法 以及与 Task、await、async: Sendable 协议 作用: Sendable 是一个协议,它用于标记可以安全地跨线程或异步任务传递的数据类型。符合 S…...
【C语言标准库函数】浮点数分解与构造: frexp() 和 ldexp()
目录 一、头文件 二、函数简介 2.1. frexp(double x, int *exp) 2.2. ldexp(double x, int exp) 三、函数实现(概念性) 3.1. frexp 的概念性实现 3.2. ldexp 的概念性实现 四、注意事项 五、示例代码 在C语言标准库中,frexp() 和 ld…...
【Git】tortoisegit使用配置
1. 安装 首先下载小乌龟,下载地址:https://tortoisegit.org/download/, 可以顺便下载语言包! 安装时,默认安装就可以,一路next。也可以安装到指定目录中 目前已完成本地安装,接下来就需要与远程仓库建立连接&…...
Spring基于文心一言API使用的大模型
有时做项目我们可能会遇到要在项目中对接AI大模型 本篇文章是对使用文心一言大模型的使用总结 前置任务 在百度智能云开放平台中注册成为开发者 百度智能云开放平台 进入百度智能云官网进行登录,点击立即体验 点击千帆大模型平台 向下滑动,进入到模型…...
运维_Mac环境单体服务Docker部署实战手册
Docker部署 本小节,讲解如何将前端 后端项目,使用 Docker 容器,部署到 dev 开发环境下的一台 Mac 电脑上。 1 环境准备 需要安装如下环境: Docker:容器MySQL:数据库Redis:缓存Nginx&#x…...
[论文笔记] Deepseek-R1R1-zero技术报告阅读
启发: 1、SFT&RL的训练数据使用CoT输出的格式,先思考再回答,大大提升模型的数学与推理能力。 2、RL训练使用群体相对策略优化(GRPO),奖励模型是规则驱动,准确性奖励和格式化奖励。 1. 总体概述 背景与目标 报告聚焦于利用强化学习(RL)提升大型语言模型(LLMs)…...
Centos Ollama + Deepseek-r1+Chatbox运行环境搭建
Centos Ollama Deepseek-r1Chatbox运行环境搭建 内容介绍下载ollama在Ollama运行DeepSeek-r1模型使用chatbox连接ollama api 内容介绍 你好! 这篇文章简单讲述一下如何在linux环境搭建 Ollama Deepseek-r1。并在本地安装的Chatbox中进行远程调用 下载ollama 登…...
一文读懂:TCP网络拥塞的应对策略与方案
TCP(传输控制协议)是互联网中广泛使用的可靠传输协议,它通过序列号、确认应答、重发控制、连接管理以及窗口控制等机制确保数据的可靠传输。然而,在网络环境中,由于多个主机共享网络资源,网络拥塞成为了一个…...
SpringSecurity:授权服务器与客户端应用(入门案例)
文章目录 一、需求概述二、开发授权服务器1、pom依赖2、yml配置3、启动服务端 三、开发客户端应用1、pom依赖2、yml配置3、SecurityConfig4、接口5、测试 一、需求概述 maven需要3.6.0以上版本 二、开发授权服务器 1、pom依赖 <dependency><groupId>org.springfr…...
Python与java的区别
一开始接触Python的时候,哔哩视频铺天盖地,看了很多人主讲的,要找适合自己口味的,各种培训机构喜欢在各种平台引流打广告,看了很多家,要么就是一个视频几个小时,长篇大论不讲原理只讲应用&#…...
doris:MySQL 兼容性
Doris 高度兼容 MySQL 语法,支持标准 SQL。但是 Doris 与 MySQL 还是有很多不同的地方,下面给出了它们的差异点介绍。 数据类型 数字类型 类型MySQLDorisBoolean- 支持 - 范围:0 代表 false,1 代表 true- 支持 - 关键字&am…...
SQL中 的exists用法
EXISTS 是 SQL 中的一个子查询条件,用于检查子查询是否返回任何行。如果子查询返回至少一行,则 EXISTS 返回 TRUE。 例如,查询有订单的客户列表: SELECT * FROM customers c WHERE EXISTS (SELECT 1 FROM orders o WHERE o.cust…...
案例1.spark和flink分别实现作业配置动态更新案例
目录 目录 一、背景 二、解决 1.方法1:spark broadcast广播变量 a. 思路 b. 案例 ① 需求 ② 数据 ③ 代码 2.方法2:flink RichSourceFunction a. 思路 b. 案例 ① 需求 ② 数据 ③ 代码 ④ 测试验证 测试1 测试2 测试3 一、背景 在实时作业(如 Spark Str…...
大数据学习之SparkSql
95.SPARKSQL_简介 网址: https://spark.apache.org/sql/ Spark SQL 是 Spark 的一个模块,用于处理 结构化的数据 。 SparkSQL 特点 1 易整合 无缝的整合了 SQL 查询和 Spark 编程,随时用 SQL 或 DataFrame API 处理结构化数据。并且支…...
鸿蒙UI(ArkUI-方舟UI框架)- 使用文本
返回主章节 → 鸿蒙UI(ArkUI-方舟UI框架) 文本使用 文本显示 (Text/Span) Text是文本组件,通常用于展示用户视图,如显示文章的文字内容。Span则用于呈现显示行内文本。 创建文本 string字符串 Text("我是一段文本"…...
Spider 数据集上实现nlp2sql训练任务
NLP2SQL(自然语言处理到 SQL 查询的转换)是一个重要的自然语言处理(NLP)任务,其目标是将用户的自然语言问题转换为相应的 SQL 查询。这一任务在许多场景下具有广泛的应用,尤其是在与数据库交互的场景中&…...
