【大数据综合试验区1008】揭秘企业数字化转型:大数据试验区政策数据集大公开!
今天给大家分享的是国内顶级期刊中国工业经济2023年发布的最新期刊《政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验》文章中所使用到的数据集——国家大数据综合试验区政策数据集以及工具变量数据,该文章基于2009-2019年中国上市企业面板数据,以国家大数据综合试验区为准自然实验,从数字生态视角考察国家大数据综合试验区政策对企业数字化转型升级的影响。研究发现大数据试验区对企业的数字化转型起着促进作用,特别是对企业底层数字技术运用的促进作用更加明显,并且从政府数字补贴、数字发展环境以及数字化企业和人力资本集聚的数字知识溢出三个方面探讨了大数据试验区政策对企业数字化转型的传导机制,并进行了一系列异质性分析,最终得出结论,并给出相应的政策建议。该文章在分析的过程中使用到了国家大数据综合试验区政策以及工具变量数据,我们对这两部分数据进行了整理,并进行了适当的拓展,数据获取请关注公众号“明天科技屋”,打开公众号文章获取文末数字关键词并回复,在该数据发布24小时之内可以通过分享获得。
一、论文讲解

该文章是以中国上市企业为研究对象,以国家大数据综合试验区开展准自然实验,采用双重差分模型考察了大数据试验区设立对企业数字化转型发展的影响,并且从不同层次企业数字化技术分析了大数据政策对企业不同层次数字化水平的影响效应,同时采用多种稳健性检验方法对基准结果结论进行检验,结果依然可靠,并且以数字生态视角从政府数字补贴、数字发展环境以及数字知识溢出三个方面进行了传到极致检验,在异质性分析方面,从所有制性质、企业规模、行业数字化程度、行业要素密集程度以及企业初始数字化水平多角度进行异质性分析,同时金融发展水平、数字基础条件以及制度环境三个方面进行调节效应检验,最终得出结论,给出相应的建议。
(一)模型设定
本文使用了双重差分法考察了大数据试验区设立对企业数字化转型发展的影响,具体模型设定如下:
其中,下标i、j、t分别表示企业、城市和年份。被解释变量表示企业i在t年的数字化水平。
为城市j是否属于大数据试验区的虚拟变量,取值为1表示是,取值为0代表否;
为大数据试验区政策实施前后的虚拟变量,2016年之前为0,2016年之后为1。
表示可能影响企业数字化水平的企业层面随时间变化的控制变量,包括净资产收益率、企业收入、企业总资产、企业年龄、董事长和总经理是否兼任、会计师事务所审计意见、资本密集度、第一大股东持股比例、现金流强度、账面市值比和资产负债率。
表示城市层面的控制变量,包括人均GDP、人口规模、高校数量、外商直接投资额和产业结构(第二产业增加值比重和第三产业增加值比重)。
为企业固定效应,
为时间固定效应,
为随机扰动项。
(二)数据来源与处理
国家大数据综合试验区数据来源于中国政府网,企业数据来自国泰安数据库,样本为2009-2019年沪深A股上市企业数据。
(三)实证分析
1.基准回归
2.不同层次数字化水平检验
将企业数字化水平划分为“底层技术运用”水平和“数字技术应用”水平,考察大数据综合试验区政策对不同层次数字化水平影响
3.机制分析
从政府数字补贴、数字发展环境以及数字知识溢出三个方面考察了大数据综合试验区对企业数字化水平的传导机制。
(四)进一步分析
1.异质性分析
从所有制性质、企业规模、行业数字化程度、行业要素密集度以及企业初始化数字水平多角度考察了大数据综合试验区政策对企业数字化水平的影响。
2.调节效应检验
从金融发展水平、数字基础条件以及制度环境三个方面今天了调节效应分析
(五)结论与启示
期刊征文部分没有提到稳健性检验内容,这部分内容在附录里面,主要也是正常的稳健性检验内容,大家感兴趣可以自行查看,接下来给大家分享我们收集整理的数据集。
二、重要数据
改文章是以企业为研究对象,样本区间为2009-2019年,我们收集整理了国家大数据综合试验区名单,并且在样本区间进来了拓展,得到了2008年-2022年国家大数据综合试验区地级市实施数据,同时论文在进行稳健性检验事使用到了工具变量数据,我们也进行了收集整理,方便大家研究。
(一)国家大数据综合试验区地级市面板数据
国家大数据综合试验区在8个地区不同时间实施,包括城市群、省份以及地级市等地区,我们收集整理了不同地区实施的相关信息,并且将数据保存在“原始数据表”中,大家可以直观了解原始数据,充分相信数据的准确性,其中,京津冀地区包括北京、天津和湖北,珠江三角洲参考论文的处理方式,将整个广东省划分为处理组,我们对原始数据进行了转换,最终得到了2008年到2022年的国家大数据综合试验区200个地级市实施的面板数据,政策实施虚拟变量保存在DID列中,数据保存在“面板数据”表中,数据展示如下:

(二)工具变量数据
论文中选用了地质条件作为政策的工具变量,具体到实际数据为2004-2015年各省7级以上地震次数,该变量能够很好地满足工具变量的有效性,指标越大说明该地区的地质稳定性越差,设立大数据试验区的概率也越低,数据来源于中国统计年鉴,我们对该数据进行了收集整理,并保存在“工具变量”表中,具体数据展示如下:

在实际使用过程中,作者使用了地质稳定性指标与上面提到的post指标乘积作为bigdata*post的工具变量,我们将原始数据按照作者的使用方法进行了转换,并将工具变量数据和政策实施面板数据进行了拼接,这样大家使用起来非常方便,数据保存在“面板数据”表中的工具变量列中,数据展示如下:

以上就是本次分享的全部内容,大家可以看到我们对分享的数据是十分认真和用心的,并且站在使用者的角度考虑,所以大家完全可以相信数据的质量,最后,数据在发布时间起24小时内通过关键词指示操作即可免费获取,关注公众号“明天科技屋”并回复数字关键词了解数据获取方式,该数据由明天科技屋一手整理,版权归明天科技屋所有,未经允许,不得用于商业盈利,否则将追随法律责任!!!
文章关键词为:“1008”
相关文章:
【大数据综合试验区1008】揭秘企业数字化转型:大数据试验区政策数据集大公开!
今天给大家分享的是国内顶级期刊中国工业经济2023年发布的最新期刊《政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验》文章中所使用到的数据集——国家大数据综合试验区政策数据集以及工具变量数据,该文章基于2009-2019年中国上市企业…...
在 WebGPU 与 Vulkan 之间做出正确的选择(Making the Right Choice between WebGPU vs Vulkan)
在 WebGPU 与 Vulkan 之间做出正确的选择(Making the Right Choice between WebGPU vs Vulkan) WebGPU 和 Vulkan 之间的主要区别WebGPU 是什么?它适合谁使用?Vulkan 是什么?它适合谁使用?WebGPU 和 Vulkan…...
亚马逊云服务器的价格真的那么贵吗?一年要花多少钱?
亚马逊Web服务(AWS)作为全球领先的云计算平台,其定价策略常常引起用户的关注。很多人可能会问:"AWS真的那么贵吗?"实际上,这个问题的答案并不是简单的"是"或"否",…...
Python学习篇:Python基础知识(三)
目录 1 Python保留字 2 注释 3 行与缩进 编辑4 多行语句 5 输入和输出 6 变量 7 数据类型 8 类型转换 9 表达式 10 运算符 1 Python保留字 Python保留字(也称为关键字)是Python编程语言中预定义的、具有特殊含义的标识符。这些保留字不能用作…...
C++字体库开发之字体回退三
代码片段 class FontCoverage { public: using SP std::shared_ptr<FontCoverage>; virtual ~FontCoverage() default; virtual void set(int index, FontTypes::CoverageLevel level) 0; virtual FontTypes::Coverag…...
python vtk lod 设置
在Python中使用VTK库设置Level of Detail (LOD)可以通过vtkLODProp3D类来实现。这个类允许你为一个模型指定不同级别的细节表示,从而在渲染时根据模型与摄像机的距离自动切换到更适合的表示。 以下是一个简单的例子,展示如何使用vtkLODProp3D来设置LOD&…...
Rhino 犀牛三维建模工具下载安装,Rhino 适用于机械设计广泛领域
Rhinoceros,这款软件小巧而强大,无论是机械设计、科学工业还是三维动画等多元化领域,它都能展现出其惊人的建模能力。 Rhinoceros所包含的NURBS建模功能,堪称业界翘楚。NURBS,即非均匀有理B样条,是计算机图…...
Unleashing Text-to-Image Diffusion Models for Visual Perception
mmcv的环境不好满足,不建议复现...
[2024]docker-compose实战 (1)前言
前言 本文用来记录使用docker-compose来实战搭建一个多项目的测试环境. 环境中包含nodejs, php, html, redis, MongoDB, mysql. 在本次部署流程中, 尽量保证原镜像的"干净简洁", 尽量不会往镜像中加入各种软件和插件, 所有的配置尽可能的在宿主机映射进去. 项目…...
并发编程面试题3
一、CountDownLatch,Semaphore的高频问题: 1.1 CountDownLatch是啥?有啥用?底层咋实现的? CountDownLatch 本质上是一个计数器,用于协调多个线程之间的同步。主要应用场景是在多线程并行处理业务时,需要等待其他线程处理完再进行后续操作,例如合并结果或响应用户请求…...
Movable antenna 早期研究
原英文论文名字Historical Review of Fluid Antenna and Movable Antenna 最近,无线通信研究界对“流体天线”和“可移动天线”两种新兴天线技术的发展引起了极大的关注,这两种技术因其前所未有的灵活性和可重构性而极大地提高了无线应用中的系统性能。…...
Polkadot 安全机制揭秘:保障多链生态的互操作性与安全性
作者:Filippo Franchini,Web3 Foundation 原文:https://x.com/filippoweb3/status/1806318265536242146 编译:OneBlock Polkadot 是一个创新的多链区块链平台,旨在实现不同区块链之间的互操作性和共享安全性。本文将详…...
python将多个文件夹里面的文件拷贝到一个文件夹中
网上可以搜到很多方式,有的好使,有的不好使,亲测如下脚本可用,并可达到我想要的效果,只将多个文件夹里的文件拷贝到一个文件夹中,不拷贝文件夹本身,如果需要文件夹也拷贝打开注释行即可 import…...
docker私有仓库harbor部署
docker私有仓库harbor部署 概述 Docker 官方镜像源被中国大陆政府封锁,导致无法在中国大陆的计算机上直接使用 Docker 拉取镜像,导致使用者一下子手足无措了,的确一开始会有很大的影响,为了应对这种影响我们可以自己构建私有仓库&…...
如何在Java中实现函数式编程
如何在Java中实现函数式编程 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在Java中,函数式编程是一种编程范式,它将计算视为数学函数…...
二叉树与堆相关的时间复杂度问题
目录 满二叉树与完全二叉树高度h和树中节点个数N的关系 向上调整算法: 介绍: 复杂度推导: 向下调整算法: 介绍: 复杂度推导: 向上调整建堆: 介绍: 复杂度推导:…...
goLang小案例-获取从控制台输入的信息
goLang小案例-获取从控制台输入的信息 1. 案例代码展示 package mainimport ("bufio""fmt""log""os" )var pl fmt.Printlnfunc main() {//控制台输出欢迎提示pl("Hello Go")fmt.Print("what is your name? ")…...
1-5题查询 - 高频 SQL 50 题基础版
目录 1. 相关知识点2. 例题2.1.可回收且低脂的产品2.2.寻找用户推荐人2.3.大的国家2.4. 文章浏览 I2.5. 无效的推文 1. 相关知识点 sql判断,不包含null,判断不出来distinct是通过查询的结果来去除重复记录ASC升序计算字符长度 CHAR_LENGTH() 或 LENGTH(…...
Modbus协议转Profinet协议网关模块连智能仪表与PLC通讯
一、现场需求:PLC作为控制器,仪表设备做为执行设备,执行设备能够实时响应PLC传来的指令,并且向PLC回馈数据,从而达到PLC对仪表设备进行控制和监测,实现对生产过程的精准控制。 二、解决方案:通过…...
新手必学:TikTok视频标签的使用方法
想让你的TikTok视频火起来,就得用对标签。标签能帮你的作品被更多人看到,也更有利于推广,可以为品牌增加曝光度、吸引更多观众、提高转化率和借势热门话题。那么应该如何选择标签并使用标签呢,看完这篇分享你或许会有所启发&#…...
Sora全面下线,AI界背后的商业逻辑是什么?
你敢相信吗?那个曾以一己之力震撼全球影视圈、让无数视频创作者彻夜难眠、被视为AI视频生成之王的Sora,被它的亲生父母OpenAI,亲手按下了停止键。一觉醒来,没有降级,没有合并,Sora独立App的API接口直接下线…...
利润中心(Profit Center)和段(Segment)在 SAP 中关系非常紧密,但它们的设计目的和应用场景有本质区别
利润中心(Profit Center)和段(Segment)在 SAP 中关系非常紧密,但它们的设计目的和应用场景有本质区别。简单来说,段(Segment)是利润中心的一个上级归类。它们之间通常是“一对多”的…...
FPGA新手避雷指南:你的第一个呼吸灯项目可能卡在这几个Vivado仿真和引脚分配问题上
FPGA新手避雷指南:从仿真到引脚分配的完整呼吸灯实战 第一次在FPGA上实现呼吸灯效果,本该是充满成就感的时刻。但当你按照教程一步步操作,点击"Generate Bitstream"后,板子上的LED却毫无反应——这种挫败感我太熟悉了。…...
手把手教你用SAM2和LoRA:基于CVPR25新思路的开放词汇分割实战(附代码)
手把手教你用SAM2和LoRA:基于CVPR25新思路的开放词汇分割实战(附代码) 开放词汇语义分割(Open-Vocabulary Semantic Segmentation)正成为计算机视觉领域的热点方向。传统语义分割模型受限于预定义的封闭类别ÿ…...
深入解析cufftPlanMany:从参数配置到高效FFT实现
1. 为什么需要cufftPlanMany? 第一次接触CUDA FFT时,很多人都是从cufftPlan1d、cufftPlan2d这些基础接口开始的。但当你真正处理实际工程问题时,会发现这些简单接口远远不够用。比如要处理批量信号、非连续内存数据、子区域FFT计算等场景时&a…...
ICLR 2025论文解读│PointOBB-v2:单点监督下的高效有向目标检测新突破
1. PointOBB-v2:单点监督的革命性突破 有向目标检测一直是计算机视觉领域的重要研究方向,特别是在遥感图像分析、自动驾驶和工业检测等实际应用中。传统的有向边界框(OBB)标注需要人工精确标注目标的旋转角度和四个顶点坐标&…...
【AI+实战】零基础部署私人ChatGPT网站:从NextChat到功能定制
1. 为什么你需要一个私人ChatGPT网站? 最近两年AI对话机器人的火爆程度,相信大家都有目共睹。但你是否遇到过这些问题:公共平台经常排队、担心隐私泄露、或者想要定制专属功能?这就是为什么越来越多的个人和小团队开始搭建自己的C…...
好写作AI:利用多轮人机交互迭代实现深度降AIGC的方法论
改一遍不够?那就改三遍——但每遍都要改对地方很多同学用AI辅助写论文,流程是这样的:用AI生成一段文字 → 觉得“AI味儿”有点重 → 手动改几个词 → 提交。然后被检测系统打回来。于是困惑:我都改了,怎么还是不行&…...
Cursor Pro免费激活终极指南:如何突破试用限制重新获得AI编程体验
Cursor Pro免费激活终极指南:如何突破试用限制重新获得AI编程体验 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reach…...
Phi-4-reasoning-vision-15B部署教程:开源大模型镜像适配国产GPU方案
Phi-4-reasoning-vision-15B部署教程:开源大模型镜像适配国产GPU方案 1. 模型介绍 Phi-4-reasoning-vision-15B是微软推出的视觉多模态推理模型,具备强大的图像理解和分析能力。这个15B参数规模的模型特别擅长处理需要结合视觉和语言理解的复杂任务。 …...
