数据如何才能供得出、流得动、用得好、还安全
众所周知,数据要素已经列入基本生产要素,同时成立国家数据局进行工作统筹。目前数据要素如何发挥其价值,全国掀起了一浪一浪的热潮。
随着国外大语言模型的袭来,国内在大语言模型领域的应用也大放异彩,与此同时,数据价值在大模型中如何度量也成为了难题。一直以来,区块链被诟病为诈骗工具,在数据要素时代,区块链作为数据流通的权益证据链,可以较好的支撑。得到蔡钰·商业参考3《AIGC会让区块链重焕生机吗?》中提到:
但到了今天,普通人创作的普通内容在预训练AI模型的过程中也可以有了价值,以及各类生成式模型又极大降低了平民创作的门槛,我的观点也开始有了一些改变。未来三年,区块链技术可能会以超乎我们想象的速度成为主流应用。在那之前,你作为普通人,记得好好留言、好好创作,保护好自己的数字版权。
由此可以看出,数据供得出、流得动、用得好需要一种安全机制来保证。对于UGC、PGC而言,因为内容本是公开的,那么通过公开的区块链是可以较好的记录引用、转载的链接,并实现价值链条。
然而,对于政府和企业数据,则问题要复杂得多!且不论复杂情况下的数据如何流动,对于有价值的数据如何发挥价值,也是比较困难的。对于数据提供方而言,首先需要考虑的问题是,是不是真的有价值。这里的价值其实是对收获的价值和所承担的风险+投入成本。
数据“流得动”效用公式
数据收益之和 > 数据供出成本 + 数据交易成本 数据收益之和 > 数据供出成本+数据交易成本 数据收益之和>数据供出成本+数据交易成本

要想数据流动,需要整体流通效益大于成本。数据收益之和大于数据供出成本和数据交易成本之和,数据才能流得动。
数据收益来源于采用数据流通模式获得的价值减去现有旧模式的价值和替换新模式所需成本。要么做大新模式价值,要么探索全新领域。
交易成本由维护市场和基础设施成本构成,只能通过交易量来摊薄成本。一是通过增加供给和需求,二是拓展应用场景,三是拓展服务边界。通过增加数据收益,降低供出成本和交易成本,实现数据流得动。
供得出
数据供得出的条件:
预期收益>预期损失 预期收益>预期损失 预期收益>预期损失
供出成本需要满足数据收益减去投入成本和风险成本。投入成本确定性比较高,风险如果不加分类分级,趋于无穷大。例如:公共数据运营的投入成本不可控,风险成本难估算,需要重点解决。
解决方案:一是通过建设运营移交(BOT)模式减少投入成本,二是通过分类分级压低潜在风险。
供出成本
V 数据 = V 收益 − C 投入 − C 风险 > 0 V_{数据}=V_{收益} - C_{投入}-C_{风险}>0 V数据=V收益−C投入−C风险>0
收益价值
● 确定性收益
● 未来潜在收益
投入成本
● 数据采购成本
● 数据供出的服务器成本
● 数据加工成本
风险成本
● 数据泄露风险()
● 数据安全风险
● 数据隐私风险
交易成本
C 交易 = C 维护市场 + C 基础设施 C_{交易}=C_{维护市场}+C_{基础设施} C交易=C维护市场+C基础设施
交易成本中基础设施成本和维护市场成本属于硬性成本,只能通过交易量来摊薄。
通过增加供给和需求用户数量,提高数据交易频次;拓展应用场景,扩大交易体量;拓展服务边界,增大交易规模
维护市场成本
● 交易所上架费用
● 广告成本
● 人员成本和管理成本
基础设施成本
数据交易机构需要提供承载数据交易发布的建筑和线上交易场所,这些都属于基础设施投入。相对固定,且边际效用递减。
流得动
数据流得动的条件:
V 数据流动收益压差 = ∑ D ∈ P V C i − V D P = V D P → D C > 0 V C i 表示从第 i 位消费者获得的收益 ∑ D ∈ P V C i 则表示所有从生产者 P 的数据 D 获得的所有收益之和 V D P 表示为提供数据 D ,生产者 P 需要付出的成本 \begin{align} V_{数据流动收益压差} & =\sum_{D \in P} V_{C_i} - V_{D_P}=V_{D_P \to D_C}>0 \\ \\ & V_{C_i} 表示从第i位消费者获得的收益 \\ & \sum_{D \in P} V_{C_i} 则表示所有从生产者P的数据D获得的所有收益之和 \\ & V_{D_P} 表示为提供数据D,生产者P需要付出的成本 \end{align} V数据流动收益压差=D∈P∑VCi−VDP=VDP→DC>0VCi表示从第i位消费者获得的收益D∈P∑VCi则表示所有从生产者P的数据D获得的所有收益之和VDP表示为提供数据D,生产者P需要付出的成本
基于上述公式,可以做大消费者的数量,使得总的数据消费收益变大,而生产者付出的成本相对固定,使得数据流通收益压差大于0,这样才能实现数据流得动。
用得好
V 数据价值 = V 新体验 – V 旧体验 – C 替换成本 > 0 V_{数据价值}=V_{新体验}–V_{旧体验}–C_{替换成本}>0 V数据价值=V新体验–V旧体验–C替换成本>0
按照俞军产品体验公式, 用户价值 = 新体验 − 旧体验 − 替换成本,或者效应 − 成本> 0 用户价值 = 新体验 - 旧体验 - 替换成本,或者 效应 - 成本 > 0 用户价值=新体验−旧体验−替换成本,或者效应−成本>0
成本包括:直接成本和间接成本。
(1)直接成本,包括付出的金钱成本、时间成本、隐私数据、态度等;
(2)交易成本,即为了促成交易,付出的搜寻成本(比如为了找到哪个音乐软件最适合自己,甚至尝试用几个付出的时间)、议价成本(为了买到更便宜的西红柿和摊贩讨价还价付出的时间和口舌)、学习使用的成本、保障成本等。
数据能否用得好,关键在于新体验的增量是否足够。数据要素的交易模式,典型属于新体验模式,旧体验模式可能是目前已经构建的数据使用模式。例如通过爬虫获取数据、通过合同方式购买第三方数据或者模型。新体验主要在效率、实时性、准确性等方面好于就体验模式。
另一方面,如何使得替换成本尽可能的低,也是确保用得好的一个重要方面。例如,通过提升工具能力,降低用户替换成本。
总之,数据要想流得动,需要从供给、流通和消费来思考成本效益最低的解决方案。从数据交易流通的情况分析,是否流得动是关键。只有聚集足够的需求,才能撬动足够的供给,是一个典型的平台交易结果。20年前的淘宝,10年前的美团,都是需要通过补贴使得供需匹配,并提高效率。在数据交易场景中,不同时刻,对供需两方的场景要求不同。现阶段,各大数据交易所还是属于上架供给数据为主,消费者还很难使用目前的数据。
笔者认为,如果有足够的数据供给,应该会有消费者出现。不过基于上述从消费者角度来看,数据收益需要客户旧模式的价值,以及投入替换成本,这个过程往往比较困难。除非,应用场景的新模式具有压倒性的优势。
以上是笔者对于数据如何交易的一些思考,欢迎大家讨论,不妥之处,欢迎拍砖。
相关文章:
数据如何才能供得出、流得动、用得好、还安全
众所周知,数据要素已经列入基本生产要素,同时成立国家数据局进行工作统筹。目前数据要素如何发挥其价值,全国掀起了一浪一浪的热潮。 随着国外大语言模型的袭来,国内在大语言模型领域的应用也大放异彩,与此同时&#x…...
idea开发 java web 酒店推荐系统bootstrap框架开发协同过滤算法web结构java编程计算机网页
一、源码特点 java 酒店推荐推荐系统是一套完善的完整信息系统,结合java web开发和bootstrap UI框架完成本系统 采用协同过滤算法进行推荐 ,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式…...
Linux——线程控制
目录 前言 一、线程创建 1.创建线程 2.线程传递结构体 3.创建多线程 4.收到信号的线程 二、线程终止 三、线程等待 四、线程分离 五、取消线程 六、线程库管理的原理 七、站在语言角度理解pthread库 八、线程的局部存储 前言 前面我们学习了线程概念和线程创建&…...
【Leetcode 347】,前k个高频元素,小根堆的调整
参考题解 题目:给定一个数组,输出 前k个高频元素。 思路: 遍历数组,建立小根堆(小根堆的元素是元组(num,freq),排序规则是每个元素的频率)。 下面使用数组‘heap’&…...
【图论】【分类讨论】LeetCode3017按距离统计房屋对数目
本文涉及的知识点 图论 分类讨论 本题同解 【差分数组】【图论】【分类讨论】【整除以2】3017按距离统计房屋对数目 LeetCode3017按距离统计房屋对数目 给你三个 正整数 n 、x 和 y 。 在城市中,存在编号从 1 到 n 的房屋,由 n 条街道相连。对所有 …...
浅谈Yum 安装和 源码安装
浅谈Yum 安装和 源码安装 本文所叙述的Linux系统是基于RedHat发行版的CentOS7 yum安装 1. 前言 我们知道在Windows上下载的安装包后缀是 .exe ,与之对应的 在 Linux下的安装包的后缀是 .rpm rpm (Red Hat Package Manager) 是红帽软件包管理器 我们在Windows电脑…...
JavaEE初阶Day 3:多线程(1)
目录 Day 3:多线程(1)1. 线程1.1 引入线程的原因1.2 线程的定义1.3 为何线程更轻量1.4 问题 2. 多线程代码2.1 继承Thread重写run2.2 通过实现Runnable接口创建线程2.3 针对2.1的变形使用匿名内部类2.4 针对Runnable创建匿名内部类2.5 使用la…...
gutil140.dll是什么?gutil140.dll无法继续执行的解决方法
gutil140.dll文件是一个动态链接库(DLL)文件,通常与Microsoft Visual Studio 2015相关联。 gutil140.dll是开发过程中使用的工具函数集合,它辅助开发人员执行常见的编程任务,如文件操作、内存分配和字符串处理等。这个…...
在CentOS 7上安装Python 3.7.7
文章目录 一、实战步骤1. 安装编译工具2. 下载Python 3.7.7安装包3. 上传Python 3.7.7安装包4. 解压缩安装包5. 切换目录并编译安装6. 配置Python环境变量7. 使配置生效8. 验证安装是否成功 二、实战总结 一、实战步骤 1. 安装编译工具 在终端中执行以下命令 yum -y groupin…...
基于SpringBoot Vue宠物领养系统
一、📝功能介绍 基于SpringBoot Vue宠物领养系统 角色:管理员、用户 当游客打开系统的网址后,首先看到的就是首页界面。在这里,游客能够看到宠物领养救助平台的导航条显示首页、宠物招领、宠物认领、 宠物论坛、宠物资讯、后台管…...
ip命令
ip a 也是ip addr简写 [rootlocalhost ~]# ip a 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00inet 127.0.0.1/8 scope host lovalid_lft forever preferred_lft…...
【Kaggle】练习赛《鲍鱼年龄预测》(上)
前言 上一篇文章,讲解了《肥胖风险的多类别预测》机器学习方面的文章,主要是多分类算法的运用,本文是一个回归的算法,本期是2024年4月份的题目《Regression with an Abalone Dataset》即《鲍鱼年龄预测》,在此分享高手…...
Ruby 之交租阶段信息生成
题目 我看了一下,这个题目应该不是什么机密,所以先放上来了。大概意思是根据合同信息生成交租阶段信息。 解答 要求是要使用 Ruby 生成交租阶段信息,由于时间比较仓促,变量名那些就用得随意了些。要点主要有下面这些:…...
RUST语言值所有权之内存复制与移动
1.RUST中每个值都有一个所有者,每次只能有一个所有者 String::from函数会为字符串hello分配一块内存 内存示例如下: 在内存分配前调用s1正常输出 在分配s1给s2后调用报错 因为s1分配给s2后,s1的指向自动失效 s1被move到s2 s1自动释放 字符串克隆使用...
【Django学习笔记(三)】BootStrap介绍
BootStrap介绍 前言正文1、BootStrap 快速了解2、初识BootStrap2.1 下载地址2.2 创建目录2.3 引入BootStrap2.4 使用BootStrap 3、BootStrap 组件&样式3.1 导航条3.2 栅格系统3.3 container3.3.1 container3.3.2 container-fluid 3.4 面板3.5 媒体对象3.6 分页3.7 图标3.7.…...
ClickHouse开发相关(UDAF)
ClickHouse开发相关(UDAF) ClickHouse介绍 ClickHouse是一个开源、高性能的列式 OLAP 数据库管理系统,用于使用 SQL 进行实时分析。 为什么需要ClickHouse UDAF? ClickHouse中已存在了许多聚合函数,绝大多数情况下已经覆盖我们的需求,但是有时候我们仍然需要自定义函数…...
MySql并发事务问题
事务 事务概念: 事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。 事务的特性:ACID: 小…...
Windows下Docker创建Mysql5.7
安装 下载镜像,注意,要带版本号 docker pull mysql:5.7 等下载完成执行命令: 错误命令1,直接Windows下路径: docker run --name mysql57 --restartalways -p 3306:3306 -v F:/mysqldata/data57/log:/var/log/mysql…...
Redis(性能管理、主从复制、哨兵模式)概述及部署
目录 一、性能管理 1、查看Redis内存使用 2、内存碎片率 3、跟踪内存碎片率 4、内存使用率 5、内回收key 二、Redis集群有三种模式 三、Redis主从复制 1、主从复制的概念 2、主从复制的作用 3、主从复制的流程 4、搭建Redis主从复制 1.环境准备 2.安装Redis&#…...
LabVIEW挖坑指南
一、挖坑指南 1.1、输出变量放在条件框内 错误写法: 现象:如果没进入对应的分支,输出为默认值 正常写法: 让每个分支输出的值都在预料之内。 1.2、统计耗时不准 错误写法 现象:统计出来的耗时是2000ms 正常写法&a…...
这次终于选对了!高效论文写作全流程一键生成论文工具推荐(2026 最新)
论文写作全流程可拆解为文献调研→选题/开题→大纲/初稿→文献综述→降重/去AI味→润色/格式→查重/投稿七大环节,以下工具按环节精准匹配,兼顾中文适配、降重能力、去AI痕迹、学术合规四大核心需求,覆盖免费/付费、通用/垂直场景。2026年&am…...
如何选择最适合的开源付费墙绕过工具?5款热门方案深度测评
如何选择最适合的开源付费墙绕过工具?5款热门方案深度测评 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在数字内容付费阅读日益普及的今天,开源工具为用户提…...
狗狗6种行为识别检测数据集(近3000张图片已标注)| YOLO训练数据集 AI视觉检测
狗狗6种行为识别检测数据集(近3000张图片已标注)| YOLO训练数据集 AI视觉检测 摘要 在AI视觉落地宠物经济的浪潮中,狗狗行为识别一直是一个非常有商业价值和趣味性的方向。为了帮助大家更高效地训练模型,我整理并开源了一套高质…...
从‘Hello World’到视频监控:用QT+海康SDK开发你的第一个安防应用
从‘Hello World’到视频监控:用QT海康SDK开发你的第一个安防应用 第一次看到海康威视摄像头的实时画面在自己的程序里跳出来时,那种成就感比写一百个"Hello World"都来得强烈。作为一位刚接触QT的开发者,你可能已经厌倦了按钮和文…...
sklearn分类指标实战:如何用precision_recall_curve优化你的模型效果
sklearn分类指标实战:如何用precision_recall_curve优化模型效果 在机器学习项目中,分类模型的评估往往比训练过程更考验数据科学家的专业素养。当你的模型在测试集上达到95%的准确率时,是否就意味着可以高枕无忧?现实情况往往复杂…...
别再踩坑PX4Flow了!实测优象LC-302光流模块,手把手教你搞定PX4无人机室内悬停
无人机室内悬停实战指南:优象LC-302光流模块深度评测与PX4调参技巧 当无人机从开阔的室外飞入复杂的室内环境,GPS信号的突然消失往往让飞手们手忙脚乱。这时,一套可靠的光流定位系统就成了"空中救生绳"。本文将带您深入评测市面上主…...
怎样快速管理Windows预览版:离线注册工具完整使用手册
怎样快速管理Windows预览版:离线注册工具完整使用手册 【免费下载链接】offlineinsiderenroll 项目地址: https://gitcode.com/gh_mirrors/of/offlineinsiderenroll 想要体验Windows最新功能但又不想绑定微软账户?OfflineInsiderEnroll为你提供了…...
Python服务内存持续增长?5个被忽略的__del__陷阱+3种RAII式资源封装模板,今天必须修复!
第一章:Python服务内存持续增长的智能体诊断全景图Python服务在长期运行中出现内存持续增长,是生产环境中高频且隐蔽的稳定性风险。传统人工排查依赖经验与断点调试,难以覆盖异步任务、闭包引用、第三方库缓存等复杂场景。本章构建一个面向可…...
Windows音频捕获终极革命:告别系统混音器,实现进程级精准录音
Windows音频捕获终极革命:告别系统混音器,实现进程级精准录音 【免费下载链接】win-capture-audio An OBS plugin that allows capture of independant application audio streams on Windows, in a similar fashion to OBSs game capture and Discords …...
公开信息整理|2026年3月26日:科学进展、词元活动、食品安全、护理保险与部分国际动态速览
🔥个人主页:杨利杰YJlio❄️个人专栏:《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》 《Python》 《Kali Linux》 《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更…...
