海量数据融合互通丨TiDB 在安徽省住房公积金监管服务平台的应用实践
导读
安徽省住房公积金监管服务平台通过整合全省 17 家公积金中心的数据,致力于实现数据共享、规范化管理与高效数据分析。为了应对海量数据处理需求,安徽省选择 TiDB 作为底层数据库,利用其分布式架构和 HTAP 能力,实现了快速的数据分析与治理。TiDB 的高效性能提升了平台的数据处理能力和查询效率,为全省公积金数据的统一管理与共享提供了有力支持。
本文将详细介绍 TiDB 在平台中的应用与实际效果,以及 TiDB 如何帮助安徽省提升数据分析和治理能力。
安徽省住房公积金监管服务平台是一个集成了全省 17 家公积金中心数据的监管服务平台,此平台主要目标是构建一个省级住房数据平台,以满足国家数据标准,规范并统一省内住房公积金数据的应用。此外,它还需要与住建部的全国公积金数据共享平台以及省大数据局对接,以便实现省级数据的共享,并且能够为省数据共享提供可靠的数据支撑。
为实现全省公积金数据统一数据服务,提升公积金数据标准化、规范化、数据共享和服务能力能力,安徽公积金将 TiDB 作为安徽省住房公积金监管服务平台底层数据库。经过上线实践证明,TiDB 为安徽省住房公积金在海量数据融合互通、数据核查治理、数据分析时效性等方面带来了显著价值。
海量数据融合互通,基础架构面临挑战
平台功能介绍
目前安徽省住房公积金监管服务平台已具备一系列功能模块,包括首页、运营分析、统计报表、智慧大屏、数据治理、风险检查和系统管理。
其中,运营分析主要用于从不同维度分析公积金业务指标,统计报表则负责生成、填报和查询住建部规定的报表,同时也支持省级用户的报表导入、核对和更新。智慧大屏提供了综合和业务两大类可视化展示,而数据治理模块则涵盖了传数统计、数据检核和人工数据核对等功能,以确保数据的质量。风险检查方面,平台不仅支持公积金中心的自我检查,也支持省厅的检查,并可以根据需要添加新的检查模型。在系统管理上,平台提供了机构、岗位、角色和用户管理,以及数据字典和菜单管理等工具。另外,平台还具有年报功能,允许各公积金中心编辑和导出年度报告,并支持中心上传自定义的年报。
安徽省住房公积金监管服务平台需要提供以下功能:
- 数据采集:从安徽省各市和安徽省公积金业务系统采集数据,包含公积金交易、转账等明细信息。
- 数据分析:基于各市公积金上报业务明细数据进行统计分析,如根据根据公积金交易明细数据计算公积金核心经验业务指标,基于业务数据进行报表可视化展示等。
- 数据加工治理:需要对各市级公积金上报数据进行统计、校对,并对上报数据进行统一建模加工形成统一的数据标准,确保数据规范和统一标准,以便提供与各市、外省以及全国公积金交换和共享数据。
- 数据共享上报:安徽公积金数据规范之后需要再往全国公积金共享平台上报数据。
数据库技术选型要求
为了实现安徽省住房公积金监管服务平台上述功能要求,解决全省 17 个公积金系统海量数据融合互通能力,提升数据分析效性和数据加工治理等生产环境面对的痛点,安徽省住房公积金监管服务平台启动了原生分布式数据库的测试选型,具体的要求包括:
- 数据扩展:需要数据库具备海量数据存储、汇聚和计算能力,实现多市海量数据汇聚和全省数据融合互通
- 数据分析:需要数据库具备高性能数据分析能力,实现高性能经营指标分析、报表可视化展示和智慧大屏等业务
- 数据加工治理:需要数据库具备高效数据加工能力,实现高效数据治理、统一建模等业务
- 高可用:需要数据库具备多副本数据存储能力,提高关键海量数据完整性和高可用能力
- 自主可控:需要数据库具备自主可控能力,确保业务连续性和自主可控
经过多轮对比测试和业务场景的验证,TiDB 满足了本次技术选型的所有指标。安徽省住房公积选择将 TiDB 作为国家免疫规划信息系统的底层数据库。
HTAP 架构赋能,TiDB 助力高效数据治理
经过多轮对比测试和业务场景的验证,TiDB 满足了本次技术选型的所有指标。安徽省住房公积金选择将 TiDB 作为安徽省住房公积金监管服务平台的底层数据库。
当前使用了 7 台 16vc/64G 服务器,其中 3 台服务器做 TiFlash 节点,使用 TiDB HTAP 能力一栈式支持数据分析、高并发数据汇聚和高效数据加工等能力。
目前所有应用模块已成功迁移到 TiDB 集群上,目前该系统已正式上线运行,全省 16 个市加安徽省公积金业务系统均与安徽省住房公积金监管服务平台的正式环境实现了对接,目前数据量接近 1 TB,经营指标、报表展示、智慧大屏等查询业务均在秒级别完成,显著提升了数据分析和查询效率。
总结与展望
结合系统的实际运行效果,总结 TiDB 为安徽省住房公积金带来的收益如下:
- 海量数据处理:TiDB 使用存算分离架构,计算和存储节点都可以按需扩展。目前已经存储接近 1 TB 数据。
- 高效数据分析:TiDB HTAP 能力单个 SQL 可以在多台服务器上并行计算,并且可以使用 TiFlash 列存做列存分析计算。经营指标、报表展示、智慧大屏等查询业务均在秒级别完成,提升了数据分析效率。
- 数据加工治理:利用 TiDB 分布式和 HTAP 能力,结合应用数据治理模块拆批能力,实现超大数据量高效数据治理能力,统一全省数据标准。
- 高可用:利用 TiDB 多副本和 Raft 金融级数据强一致性性,提升了数据高可用能力。
- 自主可控:TiDB 为自主可控的开源数据库产品,满足自主可控需求。
安徽省住房公积金监管服务平台的成功实践证明了 TiDB 在处理海量数据、提升数据分析效率以及保障数据高可用性方面的卓越能力。
通过整合全省 17 家公积金中心的数据,平台实现了数据的统一管理和高效共享,为省级数据治理和全国公积金数据交换提供了坚实的技术支撑。TiDB 的分布式架构和 HTAP 能力不仅满足了平台当前的业务需求,还为未来的数据扩展和功能升级奠定了基础。
相关文章:

海量数据融合互通丨TiDB 在安徽省住房公积金监管服务平台的应用实践
导读 安徽省住房公积金监管服务平台通过整合全省 17 家公积金中心的数据,致力于实现数据共享、规范化管理与高效数据分析。为了应对海量数据处理需求,安徽省选择 TiDB 作为底层数据库,利用其分布式架构和 HTAP 能力,实现了快速的…...
深入解析 supervision 库:功能、用法与应用案例
1. 引言 在计算机视觉任务中,数据的后处理和可视化是至关重要的环节,尤其是在目标检测、分割、跟踪等任务中。supervision 是一个专门为这些任务提供高效数据处理和可视化支持的 Python 库。本文将深入介绍 supervision 的功能、使用方法,并…...
【DeepSeek问答】访问QStandardItemModel::index(r,c)获取的空索引导致程序崩溃
好的,我现在来仔细思考一下用户的问题。用户在使用QStandardItemModel的setItem方法时,调用了setItem(4,6,item),也就是在第4行第6列的位置设置了一个item。然后他们尝试通过index(3,6)来获取这个位置的项目,想知道会有什么后果。…...

从开源大模型工具Ollama存在安全隐患思考企业级大模型应用如何严守安全红线
近日,国家网络安全通报中心通报大模型工具Ollama默认配置存在未授权访问与模型窃取等安全隐患,引发了广泛关注。Ollama作为一款开源的大模型管理工具,在为用户提供便捷的同时,却因缺乏有效的安全管控机制,存在数据泄露…...

Aws batch task 无法拉取ECR 镜像unable to pull secrets or registry auth 问题排查
AWS batch task使用了自定义镜像,在提作业后出现错误 具体错误是ResourceInitializationError: unable to pull secrets or registry auth: The task cannot pull registry auth from Amazon ECR: There is a connection issue between the task and Amazon ECR. C…...

通用信息抽取大模型PP-UIE开源发布,强化零样本学习与长文本抽取能力,全面适配多场景任务
背景与简介 信息抽取(information extraction)是指,从非结构化或半结构化数据(如自然语言文本)中自动识别、提取并组织出结构化信息。通常包含多个子任务,例如:命名实体识别(NER&am…...
基于uniapp的蓝牙打印功能(佳博打印机已测试)
相关步骤 1.蓝牙打印与低功耗打印的区别2.蓝牙打印流程2.1 搜索蓝牙2.2 连接蓝牙 3.连接蓝牙设备4.获取服务5.写入命令源码gbk.jsglobalindex.ts 1.蓝牙打印与低功耗打印的区别 低功耗蓝牙是一种无线、低功耗个人局域网,运行在 2.4 GHz ISM 频段 1、低功耗蓝牙能够…...

【Azure 架构师学习笔记】- Azure Databricks (15) --Delta Lake 和Data Lake
本文属于【Azure 架构师学习笔记】系列。 本文属于【Azure Databricks】系列。 接上文 【Azure 架构师学习笔记】- Azure Databricks (14) – 搭建Medallion Architecture part 2 前言 ADB 除了UC 这个概念之外,前面【Azure 架构师学习笔记】- Azure Databricks (1…...

WPF高级 | WPF 应用程序部署与发布:确保顺利交付到用户手中
WPF高级 | WPF 应用程序部署与发布:确保顺利交付到用户手中 一、前言二、部署与发布基础概念2.1 部署的定义与目的2.2 发布的方式与渠道2.3 部署与发布的关键要素 三、WPF 应用程序打包3.1 使用 Visual Studio 自带的打包工具3.2 使用第三方打包工具 四、发布到不同…...

在 IntelliJ IDEA(2024) 中创建 JAR 包步骤
下是在 IntelliJ IDEA 中创建 JAR 包的详细的步骤: 1. 选择File -> Project Structure->Artifacts, (1)点击➕新建,如下图所示: (2)选择JAR->Empty (3)输入jar包名称,确定输出路径 (4&#…...
【C++】5.4.3 范围for语句
范围for语句基本形式: for(声明变量:序列容器) {循环执行语句; } 其中,“序列容器”是指花括号括起来的初始值列表、数组、vector或者string等类型的对象,主要特点是拥有能返回迭代器的 begin() 和 end() 成员; “声明变量”是一个类似声明…...
达梦数据库备份
达梦数据库联机在线备份操作指南 一、基础条件与准备 开启归档模式: 联机备份必须处于归档模式下,否则无法执行。需通过disql工具执行以下操作: alter database mount; alter database ARCHIVELOG; 例子: [dmdbaserver ~]$ cd /op…...

Linux系统基于ARM平台的LVGL移植
软硬件介绍:Ubuntu 20.04 ARM 和(Cortex-A53架构)开发板 基本原理 LVGL图形库是支持使用Linux系统的Framebuffer帧缓冲设备实现的,如果想要实现在ARM开发板上运行LVGL图形库,那么就需要把LVGL图形库提供的关于帧缓冲设…...
C++ 二叉搜索树代码
C 二叉搜索树代码 #include <iostream> using namespace std;template<typename T> struct TreeNode{T val;TreeNode *left;TreeNode *right;TreeNode():val(0), left(NULL), right(NULL){}TreeNode(T x):val(x), left(NULL), right(NULL){} };template<typena…...

DeepSeek+知识库+鸿蒙,助力鸿蒙高效开发
不知道你们发现没有,就是鸿蒙开发官网,文档也太多太多了,对于新手来说确实头疼,开发者大多是极客,程序的目的是让世界更高效!看文档,挺头疼的,毕竟都是理科生。 遇到问题不要慌&…...

蓝桥杯牛客1-10重点(自用)
1 import mathdef lcm(a,b):return a * b // math.gcd(a, b) # math.gcd(a, b)最小公倍数 a,b map(int,input().split()) # a int(input()) # 只读取一个整数 # print(a) print(lcm(a,b)) 2 import os import sysdef fly(lists,n):count 0flag Falsefor i in range(1,n…...

Kafka - 高吞吐量的七项核心设计解析
文章目录 概述一、顺序磁盘I/O (分区顺序追加)1.1 存储架构设计1.2 性能对比实验1.3 存储优化策略 二、零拷贝技术:颠覆传统的数据传输革命2.1 传统模式痛点2.2 Kafka优化方案 三、页缓存机制:操作系统的隐藏加速器3.1 实现原理3.2 优势对比 四、日志索引…...

Towards Precise and Explainable Hardware Trojan Localization at LUT Level
文章 《Towards Precise and Explainable Hardware Trojan Localization at LUT Level》 TCAD’2025 《LUT层次的精细可解释木马定位》 期刊介绍 《IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems》(TCAD)是集成电路…...

Python实现鼠标点击获取窗口进程信息
最近遇到挺无解的一个问题:电脑上莫名其妙出现一个白色小方块,点击没有反应,关也关不掉,想知道它和哪个软件有关还是显卡出了问题,也找不到思路,就想着要不获取一下它的进程号看看。 于是写了一个Python脚本…...
Mac安装jdk教程
在Mac上安装JDK(Java Development Kit)的步骤如下: 一、下载JDK安装包 访问Oracle官网: 打开浏览器,访问Oracle JDK下载页面。 选择JDK版本: 根据你的开发需求选择合适的JDK版本。例如,JDK 11…...
树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频
使用rpicam-app通过网络流式传输视频 使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 使用 rpicam-app 通过网络流式传输视频 本节介绍来自 rpica…...
逻辑回归:给不确定性划界的分类大师
想象你是一名医生。面对患者的检查报告(肿瘤大小、血液指标),你需要做出一个**决定性判断**:恶性还是良性?这种“非黑即白”的抉择,正是**逻辑回归(Logistic Regression)** 的战场&a…...
day52 ResNet18 CBAM
在深度学习的旅程中,我们不断探索如何提升模型的性能。今天,我将分享我在 ResNet18 模型中插入 CBAM(Convolutional Block Attention Module)模块,并采用分阶段微调策略的实践过程。通过这个过程,我不仅提升…...

MFC内存泄露
1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

Day131 | 灵神 | 回溯算法 | 子集型 子集
Day131 | 灵神 | 回溯算法 | 子集型 子集 78.子集 78. 子集 - 力扣(LeetCode) 思路: 笔者写过很多次这道题了,不想写题解了,大家看灵神讲解吧 回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八
现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet,点击确认后如下提示 最终上报fail 解决方法 内核升级导致,需要在新内核下重新下载编译安装 查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...

(二)TensorRT-LLM | 模型导出(v0.20.0rc3)
0. 概述 上一节 对安装和使用有个基本介绍。根据这个 issue 的描述,后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作,其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

CentOS下的分布式内存计算Spark环境部署
一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架,相比 MapReduce 具有以下核心优势: 内存计算:数据可常驻内存,迭代计算性能提升 10-100 倍(文档段落:3-79…...
大语言模型如何处理长文本?常用文本分割技术详解
为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

现代密码学 | 椭圆曲线密码学—附py代码
Elliptic Curve Cryptography 椭圆曲线密码学(ECC)是一种基于有限域上椭圆曲线数学特性的公钥加密技术。其核心原理涉及椭圆曲线的代数性质、离散对数问题以及有限域上的运算。 椭圆曲线密码学是多种数字签名算法的基础,例如椭圆曲线数字签…...