科技云报道:两会热议的数据要素,如何拥抱新技术?
科技云报道原创。
今年全国两会上,“数字经济”再次成为的热点话题。
2024年政府工作报告提到:要健全数据基础制度,大力推动数据开发开放和流通使用;适度超前建设数字基础设施,加快形成全国一体化算力体系;推动解决数据跨境流动等问题。
这为我国数据要素市场的进一步发展指出了方向。
与此同时,如何进一步推动数据要素市场化配置,也成为代表委员们热议的话题。
目前,数据的价值已经成为业界共识。然而,从产业视角来看,数据要素的供给和流通使用、数据资源的联动和配置等课题的探索才刚刚开始;从企业视角来看,数据质量保障、合规化使用路径、高价值场景挖掘等难点仍然普遍存在。

那么,围绕数据要素相关议题,2024年两会代表们给出了哪些提案?在实践中,又有哪些技术能够助力数据要素的价值进一步释放?
“数据要素”两会提案逐步细化
为激活数据要素的价值和潜能,今年初国家数据局等17部门联合印发了《“数据要素×”三年行动计划(2024—2026 年)》。
近日,国家数据局又联合多部门下发通知,宣布开展全国数据资源情况调查,全面调研国内数据资源生产存储、流通交易、开发利用、安全等情况。
这标志着我国数据要素市场建设正在从“顶层设计”走向“实践探索”阶段。
面对如何推动数据要素市场化配置、产业数字化转型等现实问题,今年两会期间,多位人大代表和政协委员也积极建言献策。
全国政协委员、南方科技大学副校长金李指出,当前数据要素市场建设仍存在一些问题,例如国家级数据交易所建设滞后、“用数”的环境与氛围尚未形成、数据跨境流通探索力度有待增强、国家级算力基础设施建设力度有待加强等。
全国政协委员、北京国家会计学院教授秦荣生指出,当前我国数据交易市场处于初始发展阶段,面临数据交易市场分割、交易规模不大、数据安全合规难以保障、数据交易质量参差不齐、数据交易监管薄弱等难点问题,围绕数据交易产生的争议也日渐增多。
全国政协委员、京东集团技术委员会主席、京东云事业部总裁曹鹏带来了国产化数字基础设施发展相关的建议。
他认为,构建国产化数字基础设施迫在眉睫,软硬协同才能最大化发挥算力底座的作用。
同时,应推动采用云原生、容器化、分布式的新型国产算力底座,通过发展先进算力实现技术革新升级。
全国政协常委、中国工程院院士、中国科学院大连化学物理研究所所长刘中民建议,通过推进数据确权、推动数据定价、规范交易场所、增设算力枢纽、统筹宏观布局等,进一步做好数据要素市场化配置改革工作。
作为数学家、统计学家,全国政协委员、中国科学院院士陈松蹊指出,中国目前尤为缺乏高质量的再分析科学数据集,建议组建由领域与数据科学家组成的数据融合团队,实现科学数据自立自强。
同时,企业构建数据文化需要有数据科学团队,必须从加强数据分析人才培养入手。
从多份数据要素相关提案来看,今年的议题依然重点聚焦在数据立法、数据要素市场化、数据确权和定价、数据安全和监管等方面。
但随着数据数据要素市场培育进展加速,今年提案在各个方向上进一步细化,例如,针对如何统筹数据交易所,如何开展数字基础设施建设、保障数据质量,如何通过技术手段保障数据确权,如何进行数据人才培养等,都有了更为具体的方案建议。
事实上,数据要素市场培育是一个宏大的课题,涉及体制机制、市场流通、产品研发、标准规范等多层次的深度探索,而在探索过程中无疑会不断涌现出新模式、新业态,而这些全新的实践背后,都有政策、市场、技术、资源等多项因素的共同推动。
数据要素创新成果落地
数据要素作为我国战略布局与发力的重要领域,全国各地各市场主体都在积极寻找数据要素发展中的定位和角色,寻找新的业务增长点。尽管目前尚未形成成熟的方法论和推广模式,但数据要素市场建设已有一些创新成果落地。
例如,人工智能发展驱动数据要素市场需求爆发。伴随着大模型时代的到来,通用人工智能(AGI)产业正迎来爆发期,更加需要大规模、高质量、多样化的数据集提升模型效果和泛化能力。
然而,我国人工智能领域高质量数据集缺乏、数据供给的产业生态不健全、企业数据资源获取成本高等问题依然严峻。
2023年5月,我国达成了首笔基于大模型训练数据集的数据交易。
北京国际大数据交易所与北京市科学技术研究院进行科学数据专区建设运营合作签约,打造了全国首个专门针对科技领域数据交易流通的专题数据区域。
同期,北京市发布的《促进通用人工智能创新发展的若干措施(2023-2025年)》提出,针对当下大模型训练高质量中文语料不足导致的中文语境应用落地问题,要归集高质量基础训练数据集,并通过北京国际大数据交易所开放多模态语料库。
不仅如此,人工智能的发展使高性能算力资源存在巨大缺口,亟需统一规划建设算力交易中心,协调优质算力资源,实现统一调度和最优匹配。
以运营商中国电信为例,在网络基础设施方面,中国电信建设了5G共享基站超过120万站,发布“灵泽2.0数据要素平台”,汇集高质量数据资源构建基础积累,打造“2+3+2”产品体系赋能千行万业,构建“数据要素交易+可信流通计算与共享+运营管理支撑”三大模块,提供全流程数据交易服务。
在算力基础设施方面,中国电信形成“2+4+31+X+O”梯次分布、云边协同的泛在算力基础设施体系。
“一城一池”覆盖超过240个城市,边缘算力节点超过800个,天翼云算力总规模达3.8EFLOPS。
2023年2月24日,宁夏联合中国电信、北京国际大数据交易所、中科曙光等机构,打造的国内首个一体化算力交易调度平台——东数西算一体化算力服务平台正式上线。
在推进数据安全共享和发挥数据价值方面,隐私计算技术持续推动政务数据的合规安全流通,支撑公共数据在小微普惠服务场景的应用。
例如,深圳福田区的公共数据隐私计算平台,是广东省首个基于全信创架构融合了可信执行环境(TEE)、多方安全计算(MPC)两种隐私计算技术路线的平台,构建了一个多方数据安全融合计算环境。
基于该隐私计算平台,5家金融机构与福田区政务服务数据管理局,签约达成公共数据开发利用合作关系。
在保障各参与方数据安全的前提下,促进“政政”“政企”之间的数据价值共享互惠,打破原有的高价值数据因敏感度高而形成的数据壁垒,实现有条件共享的数据基于“原始数据不出域、数据可用不可见”的流通新范式。
数据要素发展推动技术变革
事实上,在数据要素赋能行业场景的实践中,技术发展支撑着产业进步,而业务需求也对技术提出新的要求。随着数据规模爆炸式增长、数据类型日渐丰富,传统大数据处理技术面临着诸多挑战,数据技术体系也在不断变革创新。
中国信通院《数据要素白皮书(2023年)》指出,数据要素在强调通过大数据处理投入生产的同时,进一步突出了数据在交易流通过程中产生经济价值。
可控、可计量、可流通是数据要素对数据技术提出的新要求,新技术不断涌现为数据要素价值释放保驾护航。
例如,以云原生、软硬协同以及湖仓一体等技术为代表的数据处理技术,持续助力用户降本增效。
云原生技术通过存储计算分离架构,实现资源池化和极致弹性,具备高扩展性、高可用性、跨地域规模、低成本等优势,可为用户提供真正具备秒级智能弹性扩容能力、随需而动。
软硬协同技术为软件技术带来了新的机遇。一些企业陆续发布GPU数据库、数据库一体机等产品,以满足业务规模不断扩张的需求。
硬件技术的发展一方面促进了数据处理技术性能提升,另一方面也推动了数据处理技术与其他新兴技术的融合,使得技术体系的安全性和智 能性得到提升。
在湖仓一体方面,数据仓库(Data Warehouse)和数据湖(Data Lake)两项技术在不断演进过程中逐渐融合形成湖仓一体(Data Lakehouse)技术架构。
湖仓一体集数据湖的灵活性、可扩展性优势以及数据仓库的数据结构和数据管理功能于一体,能够降低数据冗余、减少存储成本,提升数据处理时效性。
当前,湖仓一体技术落地应用速度持续加快,应用领域主要集中在互联网、电信运营商以及金融等国内数字化程度较高行业。
由于数据要素具有规模经济性,企业将趋向于持续积累数据,能够助力企业降本增效的技术将会进一步受到关注。
此外,以人工智能、隐私计算、区块链、图技术等为代表的新兴技术,持续护航数据要素安全流通,例如:
向量数据库能够支撑AI技术赋能数据要素价值释放。
一些非结构化数据需要通过机器学习算法从中提取出以向量为表示形式的“特征”,向量数据库的兴起便是为了解决对这些向量进行存储与计算的问题。
图分析技术助力洞察数据连接新价值。
数据要素时代,数据规模将会不断增大,数据量及数据自身丰富度不断增加,图分析技术能够有效分析数据之间的关联性以及处理数据之间的复杂关系。
隐私计算与区块链相结合,能够实现数据密态流转。
在控制面以区块链为核心构建数据流通管控层;在数据面以隐私计算为核心构建密态数联网。
数据流转过程中以密态形式流通,保障其流转、计算、融合直到销毁的全链路安全可控,同时将数据要素持有权和使用权分离,实现数据可用不可见、使用可控可计量、以及使用权跨域管控。
图联邦技术能够打破数据孤岛。
图联邦技术是为了解决数据孤岛、隐私保护和数据安全问题提出的概念,在保护用户隐私和公司数据的前提下,更好地发挥数据价值。
时空大数据平台或时空数据库实现海量时空数据管理、查询、统计与分析。
在现实世界中有超过80%的数据都和地理位置(空间)相关,而所有数据均含有时间属性。因此,实际业务场景中许多数据需要通过时空大数据平台或时空数据库来处理。
近年来,时空大数据平台以及时空数据库等技术的发展,有效应对北斗时空大数据服务、数字孪生、智慧城市等新兴数据应用业务场景下对于时空数据处理的需求。
未来,新兴技术还将在应用过程中不断融合以适应不同场景下的技术需求,向着更加高效、安全的方向不断发展。
可以预见,围绕数据的采集、存储、计算、管理、流通、安全各个环节,技术体系将不断革新。
结语
我国正从“数据大国”向“数字中国”全速前进,数据要素与新兴技术交织融合,数据价值与行业发展相互交错,数据引擎正在被注入巨大动能。面向未来,在落实数据基础制度和建设数字中国的新篇章中,数据要素的价值将被更加充分的挖掘,我国数据要素的发展也将迎来新的突破。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:
科技云报道:两会热议的数据要素,如何拥抱新技术?
科技云报道原创。 今年全国两会上,“数字经济”再次成为的热点话题。 2024年政府工作报告提到:要健全数据基础制度,大力推动数据开发开放和流通使用;适度超前建设数字基础设施,加快形成全国一体化算力体系࿱…...
【linux】进程管理:进程控制块、进程号、fork创建进程、特殊进程及exec函数族解析
一、进程的概述 可执行程序运行起来后(没有结束之前),它就成为了一个进程。程序是存放在存储介质上的一个可执行文件,而进程是程序执行的过程。进程的状态是变化的,其包括进程的创建、调度和消亡。程序是静态的,进程是…...
【DL经典回顾】激活函数大汇总(八)(Maxout Softmin附代码和详细公式)
激活函数大汇总(八)(Maxout & Softmin附代码和详细公式) 更多激活函数见激活函数大汇总列表 一、引言 欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里,激活函数扮演着不…...
Docker进阶:深入了解 Dockerfile
Docker进阶:深入了解 Dockerfile 一、Dockerfile 概述二、Dockerfile 优点三、Dockerfile 编写规则四、Dockerfile 中常用的指令1、FROM2、LABEL3、RUN4、CMD5、ENTRYPOINT6、COPY7、ADD8、WORKDIR9、 ENV10、EXPOSE11、VOLUME12、USER13、注释14、ONBUILD 命令15、…...
【LeetCode热题100】206. 反转链表(链表)
一.题目要求 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 二.题目难度 简单 三.输入样例 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1] 示例 2: 输入:head [1,2…...
电玩城游戏大厅计时软件怎么用,佳易王计时计费管理系统软件定时语音提醒操作教程
电玩城游戏大厅计时软件怎么用,佳易王计时计费管理系统软件定时语音提醒操作教程 一、前言 以下软件操作教程以 佳易王电玩计时计费软件V18.0为例 说明 软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 1、软件计时计费,只需点击开…...
selenium也能过某数、5s盾..
文章转载于:selenium也能过某数、5s盾… 直接安装: pip install undetected_chromedriver运行代码: import undetected_chromedriver as uc import timedriver uc.Chrome(executable_pathrC:\Users\chromedriver.exe,version_main111) driver.get(网…...
mysql笔记:8. 视图
文章目录 创建视图修改视图删除视图通过视图更新数据1. 插入数据2. 更新数据3. 删除数据 查看视图信息1. DESCRIBE2. SHOW TABLE STATUS3. SHOW CREATE VIEW4. 在views表中查看 数据库中的视图是一个虚拟表。同真实的表一样,视图包含一系列带有名称的列和行数据。行…...
指针的基本概念和用法
指针的基本概念 每个变量都被存放在从某个内存地址(以字节为单位)开始的若干字节中 “指针”也被称作“指针变量”,大小为4个字节(在64位编译器中,也优肯为8个字节)的变量,其内容代表一个内存地…...
工作随记:oracle重建一张1T数据量的大表
文章目录 一、删除测试表二、重命名旧表:三、验证:四、检查alert日志和昨天到今天的统计信息任务收集是否正常 一、删除测试表 #xshell登录用户hthis用户连接登录处理: sqlplus ht/"123456" sqlplus ht/"123456"10.8.5.…...
使用timm库的一些知识点
timm(Torch Image Models)是一个在PyTorch上构建的图像模型库,它提供了一系列预训练的深度学习模型,使得研究人员和开发者可以方便地进行图像分类、目标检测等任务。 使用timm库创建模型时,如何确定模型的名字 使用…...
一种基于宏和serde_json实现的rust web中统一返回类
本人rust萌新,写web碰到了这个,基于ChatGPT和文心一言学了宏,强行把这玩意实现出来了,做个学习记录,如果有更好的方法,勿喷。 先看效果,注意不支持嵌套,且kv映射要用>(因为它这个…...
每周一算法:A*(A Star)算法
八数码难题 题目描述 在 3 3 3\times 3 33 的棋盘上,摆有八个棋子,每个棋子上标有 1 1 1 至 8 8 8 的某一数字。棋盘中留有一个空格,空格用 0 0 0 来表示。空格周围的棋子可以移到空格中。要求解的问题是:给出一种初始布局…...
爬虫练习:获取某网站的房价信息
一、相关网站 二、相关代码 import requests from lxml import etree import csv with open(房天下数据.csv, w, newline, encodingutf-8) as csvfile:fieldnames [名称, 地点,价格,总价,联系电话]writer csv.DictWriter(csvfile, fieldnamesfieldnames)writer.writeheader…...
第一个C语言hello world
#include <stdio.h> int main() {printf("hello world ! \n");//打印函数return 0; } "#" : 预处理标志 include <> : 表示预处理的文件在<>内 stdio.h : 标准的io头文件 // io : 输入输出 // printf()…...
【Python】新手入门学习:详细介绍依赖倒置原则(DIP)及其作用、代码示例
【Python】新手入门学习:详细介绍依赖倒置原则(DIP)及其作用、代码示例 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、Py…...
嵌入式驱动学习目录索引(更新中)
前言 这是一篇索引博客,用来作为索引记录学习嵌入式Linux的过程,可以用来给自己以及需要的读者作为一个目录索引,每次更新完博客都会添加进该目录中。 嵌入式驱动学习专栏将详细记录博主学习驱动的详细过程,未来预计四个月将高强度…...
ruoyi-vue插件集成websocket
链接:插件集成 | RuoYi WebSocketServer.java:补充代码 /*** 此为广播消息* param message 消息内容*/public void sendAllMessage(String message) {LOGGER.info("【websocket.sendAllMessage】广播消息:"message);try {for(String sessionI…...
华为ce12800交换机m-lag(V-STP模式)配置举例
配置## 标题思路 采用如下的思路配置M-LAG双归接入IP网络: 1.在Switch上配置上行接口绑定在一个Eth-Trunk中。 2.分别在SwitchA和SwitchB上配置V-STP、DFS Group、peer-link和M-LAG接口。 3.分别在SwitchA和SwitchB上配置LACP M-LAG的系统优先级、系统ID。 4.分别在…...
STM32第九节(中级篇):RCC——时钟树讲解(第一节)
目录 前言 STM32第九节(中级篇):RCC——时钟树讲解 时钟树主系统时钟讲解 HSE时钟 HSI时钟 锁相环时钟 系统时钟 SW位控制 HCLK时钟 PCLKI时钟 PCLK2时钟 RTC时钟 MCO时钟输出 6.2.7时钟安全系统(CSS) 小结 前言 从…...
postgresql|数据库|只读用户的创建和删除(备忘)
CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...
全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比
目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...
AI病理诊断七剑下天山,医疗未来触手可及
一、病理诊断困局:刀尖上的医学艺术 1.1 金标准背后的隐痛 病理诊断被誉为"诊断的诊断",医生需通过显微镜观察组织切片,在细胞迷宫中捕捉癌变信号。某省病理质控报告显示,基层医院误诊率达12%-15%,专家会诊…...
Vite中定义@软链接
在webpack中可以直接通过符号表示src路径,但是vite中默认不可以。 如何实现: vite中提供了resolve.alias:通过别名在指向一个具体的路径 在vite.config.js中 import { join } from pathexport default defineConfig({plugins: [vue()],//…...
WebRTC从入门到实践 - 零基础教程
WebRTC从入门到实践 - 零基础教程 目录 WebRTC简介 基础概念 工作原理 开发环境搭建 基础实践 三个实战案例 常见问题解答 1. WebRTC简介 1.1 什么是WebRTC? WebRTC(Web Real-Time Communication)是一个支持网页浏览器进行实时语音…...
nnUNet V2修改网络——暴力替换网络为UNet++
更换前,要用nnUNet V2跑通所用数据集,证明nnUNet V2、数据集、运行环境等没有问题 阅读nnU-Net V2 的 U-Net结构,初步了解要修改的网络,知己知彼,修改起来才能游刃有余。 U-Net存在两个局限,一是网络的最佳深度因应用场景而异,这取决于任务的难度和可用于训练的标注数…...
LCTF液晶可调谐滤波器在多光谱相机捕捉无人机目标检测中的作用
中达瑞和自2005年成立以来,一直在光谱成像领域深度钻研和发展,始终致力于研发高性能、高可靠性的光谱成像相机,为科研院校提供更优的产品和服务。在《低空背景下无人机目标的光谱特征研究及目标检测应用》这篇论文中提到中达瑞和 LCTF 作为多…...
背包问题双雄:01 背包与完全背包详解(Java 实现)
一、背包问题概述 背包问题是动态规划领域的经典问题,其核心在于如何在有限容量的背包中选择物品,使得总价值最大化。根据物品选择规则的不同,主要分为两类: 01 背包:每件物品最多选 1 次(选或不选&#…...
英国云服务器上安装宝塔面板(BT Panel)
在英国云服务器上安装宝塔面板(BT Panel) 是完全可行的,尤其适合需要远程管理Linux服务器、快速部署网站、数据库、FTP、SSL证书等服务的用户。宝塔面板以其可视化操作界面和强大的功能广受国内用户欢迎,虽然官方主要面向中国大陆…...
【2D与3D SLAM中的扫描匹配算法全面解析】
引言 扫描匹配(Scan Matching)是同步定位与地图构建(SLAM)系统中的核心组件,它通过对齐连续的传感器观测数据来估计机器人的运动。本文将深入探讨2D和3D SLAM中的各种扫描匹配算法,包括数学原理、实现细节以及实际应用中的性能对比,特别关注…...
