当前位置: 首页 > news >正文

【大数据综合试验区1008】揭秘企业数字化转型:大数据试验区政策数据集大公开!

今天给大家分享的是国内顶级期刊中国工业经济2023年发布的最新期刊《政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验》文章中所使用到的数据集——国家大数据综合试验区政策数据集以及工具变量数据,该文章基于2009-2019年中国上市企业面板数据,以国家大数据综合试验区为准自然实验,从数字生态视角考察国家大数据综合试验区政策对企业数字化转型升级的影响。研究发现大数据试验区对企业的数字化转型起着促进作用,特别是对企业底层数字技术运用的促进作用更加明显,并且从政府数字补贴、数字发展环境以及数字化企业和人力资本集聚的数字知识溢出三个方面探讨了大数据试验区政策对企业数字化转型的传导机制,并进行了一系列异质性分析,最终得出结论,并给出相应的政策建议。该文章在分析的过程中使用到了国家大数据综合试验区政策以及工具变量数据,我们对这两部分数据进行了整理,并进行了适当的拓展,数据获取请关注公众号“明天科技屋”,打开公众号文章获取文末数字关键词并回复,在该数据发布24小时之内可以通过分享获得。

一、论文讲解

 

 该文章是以中国上市企业为研究对象,以国家大数据综合试验区开展准自然实验,采用双重差分模型考察了大数据试验区设立对企业数字化转型发展的影响,并且从不同层次企业数字化技术分析了大数据政策对企业不同层次数字化水平的影响效应,同时采用多种稳健性检验方法对基准结果结论进行检验,结果依然可靠,并且以数字生态视角从政府数字补贴、数字发展环境以及数字知识溢出三个方面进行了传到极致检验,在异质性分析方面,从所有制性质、企业规模、行业数字化程度、行业要素密集程度以及企业初始数字化水平多角度进行异质性分析,同时金融发展水平、数字基础条件以及制度环境三个方面进行调节效应检验,最终得出结论,给出相应的建议。

(一)模型设定

 本文使用了双重差分法考察了大数据试验区设立对企业数字化转型发展的影响,具体模型设定如下:

digitallevel_{ijt}=\alpha +\beta bigdata_{j}\ast post_{t}+X_{it}+Z_{jt}+\rho _{i}+\tau _{i}+\varepsilon _{ijt}

其中,下标i、j、t分别表示企业、城市和年份。被解释变量digitallevel_{ijt}表示企业i在t年的数字化水平。bigdata_{j}为城市j是否属于大数据试验区的虚拟变量,取值为1表示是,取值为0代表否;post_{t} 为大数据试验区政策实施前后的虚拟变量,2016年之前为0,2016年之后为1。X_{it}表示可能影响企业数字化水平的企业层面随时间变化的控制变量,包括净资产收益率、企业收入、企业总资产、企业年龄、董事长和总经理是否兼任、会计师事务所审计意见、资本密集度、第一大股东持股比例、现金流强度、账面市值比和资产负债率。Z_{jt}表示城市层面的控制变量,包括人均GDP、人口规模、高校数量、外商直接投资额和产业结构(第二产业增加值比重和第三产业增加值比重)。\rho _{i}为企业固定效应,\tau _{t}为时间固定效应,\varepsilon _{ijt}为随机扰动项。

(二)数据来源与处理

国家大数据综合试验区数据来源于中国政府网,企业数据来自国泰安数据库,样本为2009-2019年沪深A股上市企业数据。

(三)实证分析 

        1.基准回归

        2.不同层次数字化水平检验 

将企业数字化水平划分为“底层技术运用”水平和“数字技术应用”水平,考察大数据综合试验区政策对不同层次数字化水平影响

        3.机制分析 

从政府数字补贴、数字发展环境以及数字知识溢出三个方面考察了大数据综合试验区对企业数字化水平的传导机制。

(四)进一步分析 

        1.异质性分析 

从所有制性质、企业规模、行业数字化程度、行业要素密集度以及企业初始化数字水平多角度考察了大数据综合试验区政策对企业数字化水平的影响。

        2.调节效应检验 

从金融发展水平、数字基础条件以及制度环境三个方面今天了调节效应分析

(五)结论与启示

期刊征文部分没有提到稳健性检验内容,这部分内容在附录里面,主要也是正常的稳健性检验内容,大家感兴趣可以自行查看,接下来给大家分享我们收集整理的数据集。

 二、重要数据

改文章是以企业为研究对象,样本区间为2009-2019年,我们收集整理了国家大数据综合试验区名单,并且在样本区间进来了拓展,得到了2008年-2022年国家大数据综合试验区地级市实施数据,同时论文在进行稳健性检验事使用到了工具变量数据,我们也进行了收集整理,方便大家研究。

(一)国家大数据综合试验区地级市面板数据

国家大数据综合试验区在8个地区不同时间实施,包括城市群、省份以及地级市等地区,我们收集整理了不同地区实施的相关信息,并且将数据保存在“原始数据表”中,大家可以直观了解原始数据,充分相信数据的准确性,其中,京津冀地区包括北京、天津和湖北,珠江三角洲参考论文的处理方式,将整个广东省划分为处理组,我们对原始数据进行了转换,最终得到了2008年到2022年的国家大数据综合试验区200个地级市实施的面板数据,政策实施虚拟变量保存在DID列中,数据保存在“面板数据”表中,数据展示如下:

(二)工具变量数据 

论文中选用了地质条件作为政策的工具变量,具体到实际数据为2004-2015年各省7级以上地震次数,该变量能够很好地满足工具变量的有效性,指标越大说明该地区的地质稳定性越差,设立大数据试验区的概率也越低,数据来源于中国统计年鉴,我们对该数据进行了收集整理,并保存在“工具变量”表中,具体数据展示如下:

在实际使用过程中,作者使用了地质稳定性指标与上面提到的post指标乘积作为bigdata*post的工具变量,我们将原始数据按照作者的使用方法进行了转换,并将工具变量数据和政策实施面板数据进行了拼接,这样大家使用起来非常方便,数据保存在“面板数据”表中的工具变量列中,数据展示如下:

以上就是本次分享的全部内容,大家可以看到我们对分享的数据是十分认真和用心的,并且站在使用者的角度考虑,所以大家完全可以相信数据的质量,最后,数据在发布时间起24小时内通过关键词指示操作即可免费获取,关注公众号“明天科技屋”并回复数字关键词了解数据获取方式,该数据由明天科技屋一手整理,版权归明天科技屋所有,未经允许,不得用于商业盈利,否则将追随法律责任!!!    

文章关键词为:“1008” 

相关文章:

【大数据综合试验区1008】揭秘企业数字化转型:大数据试验区政策数据集大公开!

今天给大家分享的是国内顶级期刊中国工业经济2023年发布的最新期刊《政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验》文章中所使用到的数据集——国家大数据综合试验区政策数据集以及工具变量数据,该文章基于2009-2019年中国上市企业…...

在 WebGPU 与 Vulkan 之间做出正确的选择(Making the Right Choice between WebGPU vs Vulkan)

在 WebGPU 与 Vulkan 之间做出正确的选择(Making the Right Choice between WebGPU vs Vulkan) WebGPU 和 Vulkan 之间的主要区别WebGPU 是什么?它适合谁使用?Vulkan 是什么?它适合谁使用?WebGPU 和 Vulkan…...

亚马逊云服务器的价格真的那么贵吗?一年要花多少钱?

亚马逊Web服务(AWS)作为全球领先的云计算平台,其定价策略常常引起用户的关注。很多人可能会问:"AWS真的那么贵吗?"实际上,这个问题的答案并不是简单的"是"或"否"&#xff0c…...

Python学习篇:Python基础知识(三)

目录 1 Python保留字 2 注释 3 行与缩进 ​编辑4 多行语句 5 输入和输出 6 变量 7 数据类型 8 类型转换 9 表达式 10 运算符 1 Python保留字 Python保留字(也称为关键字)是Python编程语言中预定义的、具有特殊含义的标识符。这些保留字不能用作…...

C++字体库开发之字体回退三

代码片段 class FontCoverage { public: using SP std::shared_ptr<FontCoverage>; virtual ~FontCoverage() default; virtual void set(int index, FontTypes::CoverageLevel level) 0; virtual FontTypes::Coverag…...

python vtk lod 设置

在Python中使用VTK库设置Level of Detail (LOD)可以通过vtkLODProp3D类来实现。这个类允许你为一个模型指定不同级别的细节表示&#xff0c;从而在渲染时根据模型与摄像机的距离自动切换到更适合的表示。 以下是一个简单的例子&#xff0c;展示如何使用vtkLODProp3D来设置LOD&…...

Rhino 犀牛三维建模工具下载安装,Rhino 适用于机械设计广泛领域

Rhinoceros&#xff0c;这款软件小巧而强大&#xff0c;无论是机械设计、科学工业还是三维动画等多元化领域&#xff0c;它都能展现出其惊人的建模能力。 Rhinoceros所包含的NURBS建模功能&#xff0c;堪称业界翘楚。NURBS&#xff0c;即非均匀有理B样条&#xff0c;是计算机图…...

Unleashing Text-to-Image Diffusion Models for Visual Perception

mmcv的环境不好满足&#xff0c;不建议复现...

[2024]docker-compose实战 (1)前言

前言 本文用来记录使用docker-compose来实战搭建一个多项目的测试环境. 环境中包含nodejs, php, html, redis, MongoDB, mysql. 在本次部署流程中, 尽量保证原镜像的"干净简洁", 尽量不会往镜像中加入各种软件和插件, 所有的配置尽可能的在宿主机映射进去. 项目…...

并发编程面试题3

一、CountDownLatch,Semaphore的高频问题: 1.1 CountDownLatch是啥?有啥用?底层咋实现的? CountDownLatch 本质上是一个计数器,用于协调多个线程之间的同步。主要应用场景是在多线程并行处理业务时,需要等待其他线程处理完再进行后续操作,例如合并结果或响应用户请求…...

Movable antenna 早期研究

原英文论文名字Historical Review of Fluid Antenna and Movable Antenna 最近&#xff0c;无线通信研究界对“流体天线”和“可移动天线”两种新兴天线技术的发展引起了极大的关注&#xff0c;这两种技术因其前所未有的灵活性和可重构性而极大地提高了无线应用中的系统性能。…...

Polkadot 安全机制揭秘:保障多链生态的互操作性与安全性

作者&#xff1a;Filippo Franchini&#xff0c;Web3 Foundation 原文&#xff1a;https://x.com/filippoweb3/status/1806318265536242146 编译&#xff1a;OneBlock Polkadot 是一个创新的多链区块链平台&#xff0c;旨在实现不同区块链之间的互操作性和共享安全性。本文将详…...

python将多个文件夹里面的文件拷贝到一个文件夹中

网上可以搜到很多方式&#xff0c;有的好使&#xff0c;有的不好使&#xff0c;亲测如下脚本可用&#xff0c;并可达到我想要的效果&#xff0c;只将多个文件夹里的文件拷贝到一个文件夹中&#xff0c;不拷贝文件夹本身&#xff0c;如果需要文件夹也拷贝打开注释行即可 import…...

docker私有仓库harbor部署

docker私有仓库harbor部署 概述 Docker 官方镜像源被中国大陆政府封锁&#xff0c;导致无法在中国大陆的计算机上直接使用 Docker 拉取镜像&#xff0c;导致使用者一下子手足无措了&#xff0c;的确一开始会有很大的影响&#xff0c;为了应对这种影响我们可以自己构建私有仓库&…...

如何在Java中实现函数式编程

如何在Java中实现函数式编程 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 在Java中&#xff0c;函数式编程是一种编程范式&#xff0c;它将计算视为数学函数…...

二叉树与堆相关的时间复杂度问题

目录 满二叉树与完全二叉树高度h和树中节点个数N的关系 向上调整算法&#xff1a; 介绍&#xff1a; 复杂度推导&#xff1a; 向下调整算法&#xff1a; 介绍&#xff1a; 复杂度推导&#xff1a; 向上调整建堆&#xff1a; 介绍&#xff1a; 复杂度推导&#xff1a;…...

goLang小案例-获取从控制台输入的信息

goLang小案例-获取从控制台输入的信息 1. 案例代码展示 package mainimport ("bufio""fmt""log""os" )var pl fmt.Printlnfunc main() {//控制台输出欢迎提示pl("Hello Go")fmt.Print("what is your name? ")…...

1-5题查询 - 高频 SQL 50 题基础版

目录 1. 相关知识点2. 例题2.1.可回收且低脂的产品2.2.寻找用户推荐人2.3.大的国家2.4. 文章浏览 I2.5. 无效的推文 1. 相关知识点 sql判断&#xff0c;不包含null&#xff0c;判断不出来distinct是通过查询的结果来去除重复记录ASC升序计算字符长度 CHAR_LENGTH() 或 LENGTH(…...

Modbus协议转Profinet协议网关模块连智能仪表与PLC通讯

一、现场需求&#xff1a;PLC作为控制器&#xff0c;仪表设备做为执行设备&#xff0c;执行设备能够实时响应PLC传来的指令&#xff0c;并且向PLC回馈数据&#xff0c;从而达到PLC对仪表设备进行控制和监测&#xff0c;实现对生产过程的精准控制。 二、解决方案&#xff1a;通过…...

新手必学:TikTok视频标签的使用方法

想让你的TikTok视频火起来&#xff0c;就得用对标签。标签能帮你的作品被更多人看到&#xff0c;也更有利于推广&#xff0c;可以为品牌增加曝光度、吸引更多观众、提高转化率和借势热门话题。那么应该如何选择标签并使用标签呢&#xff0c;看完这篇分享你或许会有所启发&#…...

MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例

一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...

智能在线客服平台:数字化时代企业连接用户的 AI 中枢

随着互联网技术的飞速发展&#xff0c;消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁&#xff0c;不仅优化了客户体验&#xff0c;还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用&#xff0c;并…...

算法岗面试经验分享-大模型篇

文章目录 A 基础语言模型A.1 TransformerA.2 Bert B 大语言模型结构B.1 GPTB.2 LLamaB.3 ChatGLMB.4 Qwen C 大语言模型微调C.1 Fine-tuningC.2 Adapter-tuningC.3 Prefix-tuningC.4 P-tuningC.5 LoRA A 基础语言模型 A.1 Transformer &#xff08;1&#xff09;资源 论文&a…...

JVM虚拟机:内存结构、垃圾回收、性能优化

1、JVM虚拟机的简介 Java 虚拟机(Java Virtual Machine 简称:JVM)是运行所有 Java 程序的抽象计算机,是 Java 语言的运行环境,实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 JVM 上运行的目标代码(字节码),就可以…...

Git常用命令完全指南:从入门到精通

Git常用命令完全指南&#xff1a;从入门到精通 一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...

BLEU评分:机器翻译质量评估的黄金标准

BLEU评分&#xff1a;机器翻译质量评估的黄金标准 1. 引言 在自然语言处理(NLP)领域&#xff0c;衡量一个机器翻译模型的性能至关重要。BLEU (Bilingual Evaluation Understudy) 作为一种自动化评估指标&#xff0c;自2002年由IBM的Kishore Papineni等人提出以来&#xff0c;…...

【Linux手册】探秘系统世界:从用户交互到硬件底层的全链路工作之旅

目录 前言 操作系统与驱动程序 是什么&#xff0c;为什么 怎么做 system call 用户操作接口 总结 前言 日常生活中&#xff0c;我们在使用电子设备时&#xff0c;我们所输入执行的每一条指令最终大多都会作用到硬件上&#xff0c;比如下载一款软件最终会下载到硬盘上&am…...

解析两阶段提交与三阶段提交的核心差异及MySQL实现方案

引言 在分布式系统的事务处理中&#xff0c;如何保障跨节点数据操作的一致性始终是核心挑战。经典的两阶段提交协议&#xff08;2PC&#xff09;通过准备阶段与提交阶段的协调机制&#xff0c;以同步决策模式确保事务原子性。其改进版本三阶段提交协议&#xff08;3PC&#xf…...

拟合问题处理

在机器学习中&#xff0c;核心任务通常围绕模型训练和性能提升展开&#xff0c;但你提到的 “优化训练数据解决过拟合” 和 “提升泛化性能解决欠拟合” 需要结合更准确的概念进行梳理。以下是对机器学习核心任务的系统复习和修正&#xff1a; 一、机器学习的核心任务框架 机…...

统计学(第8版)——统计抽样学习笔记(考试用)

一、统计抽样的核心内容与问题 研究内容 从总体中科学抽取样本的方法利用样本数据推断总体特征&#xff08;均值、比率、总量&#xff09;控制抽样误差与非抽样误差 解决的核心问题 在成本约束下&#xff0c;用少量样本准确推断总体特征量化估计结果的可靠性&#xff08;置…...