当前位置: 首页 > article >正文

经管科研数据使用指南:一站式数据资源推荐清单

经管科研数据使用指南一站式数据资源推荐清单写在前面本文整理了经管领域常用的科研数据资源涵盖上市公司、地级市、省级、县域等多个层面以及微观调查、文本分析等多种数据类型。无论你是研究企业创新、ESG表现还是区域经济发展都能在这里找到适用的数据推荐。建议收藏备用目录导航​​​​​​一、上市公司数据资源上市公司数据是经管实证研究的核心素材主要来源包括CSMAR、Wind等数据库以及学者们整理的特色数据集。1.1 财务与治理基础数据数据类型主要变量适用场景上市公司数据大全1372个变量覆盖财务报表、公司治理、股票交易等各类企业研究的基础面板常用控制变量企业规模、资产负债率、盈利能力、成立年限等回归分析的标配控制变量集内部控制指数内部控制质量评分、缺陷数量等公司治理、风险管理研究盈余管理数据应计盈余管理、真实盈余管理指标财务报告质量研究审计费用审计费用金额、审计意见类型审计市场、代理成本研究审计时滞审计报告披露时间信息披露及时性研究财务舞弊数据舞弊案例标记、造假类型等财务违规、审计失败研究1.2 创新与专利数据数据类型主要变量适用场景专利明细数据专利申请量、授权量、专利类型发明/实用新型/外观设计企业创新能力基础指标绿色专利绿色创新专利数量、IPC分类环境创新、ESG研究数字经济专利人工智能、云计算、区块链等数字技术专利数字化转型、企业创新专利引用数据施引/被引次数、引用网络知识溢出、创新质量评估1.3 ESG与可持续发展数据数据类型主要变量适用场景华证ESG评级ESG综合评分、环境(E)、社会(S)、治理(G)分项评分ESG投资、企业社会责任研究环境信息披露环境信息披露质量评分、环保投入环境信息透明度研究绿色投资绿色投资支出、节能环保支出绿色转型、财务绩效研究碳排放数据碳排放量、碳强度碳减排、气候变化研究污染物排放SO2、废水、固废排放量环境规制效果研究1.4 数字化转型数据数字化转型是近年研究热点学者们提供了多个版本的测算数据数据版本主要变量特点吴非版数字化转型关键词词频统计应用最广泛跨期长袁淳版数字化转型综合指标覆盖面广张永坤版多维度数字化转型指标指标体系完善年报文本数据MDA中数字化相关词汇频率可自行补充测算1.5 公司治理与高管数据数据类型主要变量适用场景董监高特征性别、年龄、学历、专业背景、任期高管团队异质性研究政治关联高管政府背景、政治身份政治关联与企业行为研究高管薪酬薪酬总额、薪酬差距、股权激励薪酬激励、代理问题高管团队稳定性团队成员变动频率、任期波动高管更替研究断裂带数据团队断裂带指标团队异质性与决策质量1.6 供应链数据数据类型主要变量适用场景供应商客户明细前五大供应商/客户占比、关系稳定性供应链依赖、议价能力供应链韧性供应链多元化、风险暴露程度供应链安全研究供应链金融供应链融资规模、应付账款周转融资约束、供应链金融1.7 投资者与市场数据数据类型主要变量适用场景投资者情绪情绪指数、资金流向市场预期、资产定价机构投资者持股机构持股比例、持股结构投资者保护、公司治理分析师关注度分析师跟踪人数、预测分歧度信息环境、盈余管理1.8 风险相关数据数据类型主要变量适用场景股价崩盘风险负收益偏态系数、收益上下波动比率股价崩盘风险研究违约风险KMV模型违约概率、信用利差信用风险研究经营风险经营现金流波动、盈利波动性企业风险承担研究二、地级市面板数据地级市层面数据是研究区域经济、城市发展、产业政策的重要支撑。2.1 经济发展数据数据类型主要变量适用场景城市统计年鉴面板GDP、人口、固定资产投资、社会消费品零售城市经济增长研究GDP与增速人均GDP、GDP增长率区域经济发展评估财政收入与支出一般预算收入、支出、收支缺口财政健康、转移支付研究进出口数据进出口总额、外资利用对外开放、外商投资研究2.2 数字经济发展数据数据类型主要变量适用场景数字经济指数数字经济综合发展水平数字经济发展评估数字基础设施互联网普及率、移动电话普及率数字基础设施研究数字政府建设指数政务服务数字化水平数字政府、政策效果研究2.3 环境与绿色发展数据数据类型主要变量适用场景环境规制强度污染治理投资、排污费征收环境政策效果研究PM2.5数据年均PM2.5浓度、空气质量指数环境污染、健康经济研究碳排放数据碳排放总量、碳排放强度低碳城市、碳减排政策绿色金融指数绿色信贷、绿色债券发展水平绿色金融政策研究2.4 社会发展数据数据类型主要变量适用场景人口流动数据流动人口规模、人口净流入人口迁移、城镇化研究城镇化率城镇人口比重、常住人口城镇化率城镇化进程评估城乡居民收入城镇居民可支配收入、农民纯收入、城乡收入差距收入分配、共同富裕研究2.5 政策DID数据准自然实验是因果识别的利器地级市层面的政策试点数据包括政策类型处理组设定适用研究高铁开通高铁开通城市/年份交通基础设施的经济效应低碳城市低碳城市试点环境政策效果自贸区自贸区设立城市贸易便利化政策评估创新政策创新城市、高新区等创新政策效果评估三、省级面板数据省级数据适用于宏观政策研究和区域比较分析。3.1 市场化指数数据类型主要变量适用场景樊纲指数市场化总指数及五大分项指数政府与市场关系、非国有经济发展、产品市场发展、要素市场发展、市场中介组织和法律制度环境制度环境、市场化进程研究市场化总指数综合市场化水平跨省制度比较研究3.2 产业结构数据数据类型主要变量适用场景产业结构合理化产业结构合理化指数产业结构调整效果产业结构高级化产业结构高级化指数产业结构升级研究3.3 经济政策数据数据类型主要变量适用场景经济政策不确定性(EPU)Baker et al.编制的EPU指数政策不确定性对企业行为影响贸易政策不确定性(TPU)贸易政策不确定性指数贸易摩擦、关税政策研究3.4 创新与生产率数据数据类型主要变量适用场景专利数据省域专利申请/授权量区域创新能力比较RD投入RD经费支出、研发人员数创新投入研究全要素生产率(TFP)TFP及其分解经济增长质量研究四、县域及农村数据县域数据适用于县域经济、农业农村现代化等研究主题。数据类型主要变量适用场景县域统计年鉴面板县域GDP、人口、农业产值、财政收支县域经济发展研究农村相关数据农村居民收入、农业现代化指标乡村振兴、农业现代化五、微观调查数据库微观调查数据是研究个体和家庭行为的重要数据源四大数据库各有侧重数据库全称调查内容适用研究CFPS中国家庭追踪调查家庭经济、健康、社会参与家庭经济决策、社会流动CGSS中国综合社会调查社会态度、价值观、社会结构社会分层、社会资本CHFS中国家庭金融调查家庭金融资产、负债、保险配置家庭金融、财富管理CLDS中国劳动力动态调查劳动力就业、工作流动、健康劳动力市场、人口质量使用提示微观调查数据通常需要申请获取建议提前了解各数据库的抽样设计选取适合研究需要的样本。六、文本数据资源文本数据为非结构化数据分析提供了丰富的素材。数据来源数据内容主要应用人民日报1946年至今的报纸全文政策导向、舆论环境研究光明日报重要历史时期的报纸全文文化政策、意识形态研究财经新闻财经媒体报道文本投资者情绪、媒体效应研究政府工作报告各省市县历年政府工作报告政策重点、文本分析年报MDA文本上市公司年报管理层讨论与分析企业战略、信息披露研究七、常用研究主题数据推荐7.1 研究企业数字化转型数据层级推荐数据核心变量微观吴非/袁淳/张永坤数字化转型数据数字化转型关键词词频微观数字经济专利数据数字技术专利数量微观年报MDA文本数据可自行提取数字化相关内容宏观城市数字经济指数地区数字经济发展水平宏观数字基础设施数据互联网普及率等7.2 研究企业创新数据层级推荐数据核心变量微观专利明细数据专利申请/授权数量微观专利引用数据专利质量、影响力微观研发投入数据RD支出、研发强度微观高管特征数据CEO/董事长创新背景宏观省级创新指数地区创新氛围7.3 研究ESG与绿色发展数据层级推荐数据核心变量微观华证ESG评级ESG综合及分项评分微观环境信息披露数据环境信息披露质量微观绿色专利数据绿色创新产出微观碳排放/污染物数据企业碳排放量宏观PM2.5数据地区空气污染程度宏观环境规制强度地区环境政策力度宏观绿色金融指数地区绿色金融发展7.4 研究企业风险数据层级推荐数据核心变量微观股价崩盘风险负收益偏态系数(NCSKEW)微观违约风险KMV违约概率微观经营风险盈利波动性、现金流波动微观审计相关审计意见类型、审计费用7.5 研究公司治理数据层级推荐数据核心变量微观内部控制指数内控质量评分微观董监高特征年龄、学历、任期等微观高管薪酬薪酬水平、薪酬差距微观股权结构股权集中度、机构持股宏观市场化指数地区制度环境7.6 研究供应链与企业关系数据层级推荐数据核心变量微观供应商客户明细前五大供应商/客户占比微观供应链韧性数据供应链多元化程度微观供应链金融数据应付账款周转天数7.7 研究投资者行为与市场数据层级推荐数据核心变量微观投资者情绪指数市场情绪度量微观机构投资者持股机构持股比例、类型微观分析师关注度分析师跟踪人数宏观经济政策不确定性EPU指数7.8 研究区域经济数据层级推荐数据核心变量地级市城市面板数据GDP、人口、投资地级市城镇化率城镇化发展水平地级市人口流动数据人口净流入/流出省级樊纲市场化指数市场化制度环境省级产业结构指数产业结构合理化/高级化7.9 研究政策效果DID设计政策类型推荐数据处理组设置交通基础设施高铁开通数据高铁开通城市环境政策低碳城市试点低碳城市贸易政策自贸区设立自贸区城市产业政策高新区/经开区开发区城市金融政策绿色金融改革创新试验区试点城市7.10 研究家庭与个体行为数据库推荐数据适用研究CFPS家庭追踪调查家庭金融决策、社会流动CGSS综合社会调查社会态度、社会分层CHFS家庭金融调查家庭资产配置、财富不平等CLDS劳动力调查就业流动、人力资本数据获取与使用建议常用数据库推荐CSMAR国泰安最全面的中国上市公司数据库Wind金融数据终端含宏观、行业数据CNRDS中国研究数据服务平台学术友好的微观数据锐思数据库股票、债券、基金数据中国工业企业数据库工业企业层面数据海关数据库进出口微观数据国家统计局 宏观数据官方来源数据使用注意事项变量匹配不同数据库的股票代码、公司名称可能有差异需做好数据清洗和匹配缺失值处理注意数据的缺失模式和原因区分真缺失与数据不可得样本选择明确研究样本的纳入标准如是否包含金融业、ST公司等极端值处理连续变量建议进行winsorize处理面板平衡性检查面板数据的平衡性避免非平衡面板带来的估计偏误数据更新部分数据存在滞后发布注意使用最新版本稳健性检验建议更换核心解释变量的衡量方式如用授权专利替代申请专利改变样本范围如剔除特殊行业、特殊年份更换控制变量集使用不同的模型设定结语数据是实证研究的基石选择合适的数据对于研究的成功至关重要。本文尽可能全面地整理了经管领域常用的科研数据资源希望能为各位研究者提供参考。实际研究中建议明确研究问题先确定研究主题和假设再选择对应的数据多源验证重要变量可尝试多个数据来源交叉验证关注数据质量在使用前仔细检查数据的完整性和准确性如有任何数据使用方面的问题欢迎在交流讨论

相关文章:

经管科研数据使用指南:一站式数据资源推荐清单

经管科研数据使用指南:一站式数据资源推荐清单写在前面:本文整理了经管领域常用的科研数据资源,涵盖上市公司、地级市、省级、县域等多个层面,以及微观调查、文本分析等多种数据类型。无论你是研究企业创新、ESG表现,还…...

GLM-4.1V-9B-Base作品集:面向开发者的技术文档截图理解与要点提炼

GLM-4.1V-9B-Base作品集:面向开发者的技术文档截图理解与要点提炼 1. 视觉多模态理解新利器 在技术文档处理领域,开发者经常面临大量包含截图、图表和示意图的文档。传统方式需要人工阅读和理解这些视觉内容,效率低下且容易出错。GLM-4.1V-…...

【新手必备】2026年OpenClaw/Hermes Agent京东云10分钟保姆级集成流程

【新手必备】2026年OpenClaw/Hermes Agent京东云10分钟保姆级集成流程。OpenClaw(前身为Clawdbot/Moltbot)作为开源、本地优先的AI助理框架,凭借724小时在线响应、多任务自动化执行、跨平台协同等核心能力,成为个人办公与轻量团队…...

【超全步骤】2026年Hermes Agent/OpenClaw阿里云7分钟简易集成指南

【超全步骤】2026年Hermes Agent/OpenClaw阿里云7分钟简易集成指南。OpenClaw(前身为Clawdbot/Moltbot)作为开源、本地优先的AI助理框架,凭借724小时在线响应、多任务自动化执行、跨平台协同等核心能力,成为个人办公与轻量团队协作…...

【新手攻略】2026年OpenClaw/Hermes Agent京东云4分钟快速集成方法

【新手攻略】2026年OpenClaw/Hermes Agent京东云4分钟快速集成方法。OpenClaw(前身为Clawdbot/Moltbot)作为开源、本地优先的AI助理框架,凭借724小时在线响应、多任务自动化执行、跨平台协同等核心能力,成为个人办公与轻量团队协作…...

安卓手机C4DROID编辑器:从零配置SDL库到显示第一张图片(避坑指南)

安卓手机C4DROID编辑器:从零配置SDL库到显示第一张图片(避坑指南) 在移动端进行C/C开发一直是个充满挑战的领域,而C4DROID的出现为安卓平台上的原生代码爱好者打开了一扇窗。作为一款功能强大的移动端IDE,它不仅支持标…...

微积分基础:极限与连续性的直观理解与计算方法

1. 极限与连续性的直观理解微积分中最基础也最重要的两个概念莫过于极限和连续性了。作为数学分析的核心内容,它们不仅是理解导数、积分等高等概念的基石,更是机器学习中梯度下降、优化算法等技术的理论基础。让我们从一个简单的例子开始,逐步…...

别再只用来抓密码了!Mimikatz的Token操纵与Chrome凭证提取实战详解

从密码提取到权限操控:Mimikatz高阶攻防技术深度解析 当大多数人提起Mimikatz时,第一反应往往是"那个抓密码的工具"。这种刻板印象严重低估了这款传奇安全工具的战术价值。作为Windows安全领域的瑞士军刀,Mimikatz在权限操控方面的…...

Arduino U8g2库:从零构建精简中文字库的完整指南

1. 为什么需要定制中文字库? 很多开发者第一次接触Arduino的OLED显示时,会发现U8g2库已经内置了中文支持,直接调用现成的字体库就能显示汉字。但当你把代码烧录到ESP8266或ESP32这类资源受限的开发板上时,可能会遇到内存不足的报错…...

从Kaggle竞赛到业务落地:XGBoost分类实战中的5个关键参数陷阱与解决方案

从Kaggle竞赛到业务落地:XGBoost分类实战中的5个关键参数陷阱与解决方案 当你在Kaggle排行榜上看到XGBoost模型大杀四方,信心满满地将它部署到业务系统中时,是否遇到过这样的困惑:为什么同样的参数设置,在实际业务中的…...

Pearcleaner:重新定义macOS应用卸载的智能系统

Pearcleaner:重新定义macOS应用卸载的智能系统 【免费下载链接】Pearcleaner A free, source-available and fair-code licensed mac app cleaner 项目地址: https://gitcode.com/gh_mirrors/pe/Pearcleaner 你是否曾经思考过,当我们"删除&q…...

NCM文件解密架构:跨平台音频格式转换的技术实现方案

NCM文件解密架构:跨平台音频格式转换的技术实现方案 【免费下载链接】ncmdump 转换网易云音乐 ncm 到 mp3 / flac. Convert Netease Cloud Music ncm files to mp3/flac files. 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdump NCM文件解密架构为网易云…...

蓝桥杯嵌入式备赛:用STM32和LCD玩转界面切换,别再只会if-else了

蓝桥杯嵌入式竞赛进阶:状态机驱动LCD界面切换实战 在嵌入式系统开发中,界面管理一直是初学者最容易陷入"if-else地狱"的重灾区。特别是参加蓝桥杯这类竞赛时,面对Data/Para界面切换与自动/手动模式组合的场景,传统标志位…...

5分钟学会:ModOrganizer2模组管理器的完整使用指南

5分钟学会:ModOrganizer2模组管理器的完整使用指南 【免费下载链接】modorganizer Mod manager for various PC games. Discord Server: https://discord.gg/ewUVAqyrQX if you would like to be more involved 项目地址: https://gitcode.com/gh_mirrors/mo/mod…...

Spring Boot项目里Jackson的@JsonFormat注解突然不灵了?排查后发现是Gson在‘搞鬼’

Spring Boot项目中Jackson的JsonFormat注解失效:Gson冲突的深度排查指南 问题现象:当日期格式化突然"罢工" 上周三凌晨两点,我被一通紧急电话吵醒。团队里的小王在电话那头焦急地说:"线上订单系统的创建时间全部变…...

Linux内核 命名空间机制

Linux Namespace 是内核提供的轻量级资源隔离机制,核心是让不同进程组看到独立的系统资源视图,是容器(Docker、K8s)的底层基石。它隔离的是进程对资源的可见性,而非物理资源本身,因此比虚拟机更轻量化本质&…...

PRBS(伪随机码)如何驱动现代通信与测试?

1. 为什么PRBS是现代通信的"黄金测试信号"? 第一次接触PRBS时,我和大多数工程师一样疑惑:为什么不用真正的随机信号做测试?直到在25G光模块测试现场看到PRBS31的测试报告才恍然大悟。想象你正在检查高速公路的承重能力—…...

MIPI存储

MIPI 存储核心是基于 MIPI M‑PHY UniPro 协议栈,为 UFS(通用闪存存储) 提供高速、低功耗的物理与链路层,是移动 / 嵌入式主流高速存储接口;同时 MIPI 也定义了 MIPI RAW 紧凑打包格式用于图像数据存储 / 传输。MIPI …...

【架构实战】六边形架构与整洁架构实战

一、架构演进概述 随着业务复杂度增加,软件架构也在不断演进: 架构演进历程: 分层架构 → 六边形架构 → 整洁架构 → 微服务架构核心目标:实现高内聚、低耦合 架构质量评估: 独立性:框架、数据库、UI的可替…...

神经机器翻译数据集构建:Europarl语料处理与优化

1. 神经机器翻译数据集构建实战:从Europarl语料到模型训练在自然语言处理领域,机器翻译一直是最具挑战性的任务之一。2014年,随着神经机器翻译(Neural Machine Translation, NMT)技术的突破,基于编码器-解码…...

电话号码精确定位:免费开源工具的实用指南与深度解析

电话号码精确定位:免费开源工具的实用指南与深度解析 【免费下载链接】location-to-phone-number This a project to search a location of a specified phone number, and locate the map to the phone number location. 项目地址: https://gitcode.com/gh_mirro…...

AI 英语教学智能体开发

AI 英语教学智能体开发已进入“认知模拟”与“超低延迟交互”的深水区。技术栈的构建不再仅仅是调用 API,而是涉及从底层推理到上层教学法编排的整套国产化生态。以下是国内开发 AI 英语教学智能体的核心技术维度:1. 基座模型与国产化适配国内开发者目前…...

Elasticsearch架构核心:Node节点详解与角色功能全解析

Elasticsearch架构核心:Node节点详解与角色功能全解析一、前言二、什么是 Elasticsearch Node(节点)?1. 官方定义2. 通俗理解3. 节点核心特点三、节点角色与功能流程图四、Elasticsearch 节点的 5 种核心角色与功能1. 主节点&…...

保姆级教程:在Gazebo 11中为WAM-V无人艇模型添加AprilTag(Ubuntu 20.04环境)

深度解析:在Gazebo 11中为WAM-V无人艇集成AprilTag的完整实践指南(Ubuntu 20.04环境) 当你在ROS/Gazebo仿真环境中需要对现有机器人模型进行功能扩展时,往往会遇到模型文件嵌套复杂、修改位置不明确的困扰。本文将以WAM-V无人艇为…...

批量给文件改名的方法有哪些?这5个实用技巧新手也能秒会

在日常办公和学习中,我们常常需要处理大量文件,杂乱的文件名不仅影响工作效率,还可能导致文件查找困难。无论是学生整理作业、职场人士归档资料,还是摄影爱好者管理照片,批量给文件改名都是必备技能。本文将详细介绍5种…...

别再只跑Demo了!手把手教你用DINOv2的Patch特征做简单的图像前景分割

解锁DINOv2的实战潜力:用Patch特征实现零样本图像分割 在计算机视觉领域,我们常常陷入一个怪圈:花费大量时间跑通各种模型的Demo,却很少思考这些预训练特征在实际任务中的真正价值。DINOv2作为Meta开源的视觉大模型,其…...

从市场调研到用户画像:因子分析如何帮你发现隐藏的‘消费者因子’?

解码消费者心智:如何用因子分析从海量问卷中提炼黄金洞察 当市场部同事将一份包含87个问题的用户满意度问卷扔到你桌上时,那些密密麻麻的评分数据就像未经处理的矿石——价值连城却难以直接利用。这正是因子分析大显身手的时刻。想象一下,你不…...

从编码原理到实战:彻底搞懂QT中文乱码,让你的应用告别“火星文”(UTF-8/GBK转换详解)

从编码原理到实战:彻底搞懂QT中文乱码,让你的应用告别“火星文”(UTF-8/GBK转换详解) 在QT开发中,中文乱码问题就像一位不请自来的“老朋友”,总会在你最意想不到的时候出现。无论是控件显示、文件读写还是…...

2025年MLOps必备的10个Python库解析

1. 为什么2025年的MLOps需要这10个Python库?三年前部署一个机器学习模型还需要手动编写数百行部署脚本,现在MLOps工具链的成熟度已经让模型部署变得像调用API一样简单。作为经历过完整MLOps演进周期的从业者,我亲历了从手工运维到自动化管道的…...

用E4A中文编程,30分钟搞定一个能远程控制STM32的安卓APP(基于OneNET MQTT)

用E4A中文编程30分钟构建OneNET物联网控制APP全指南 当第一次听说能用中文编写安卓APP控制硬件设备时,我的反应和多数嵌入式开发者一样——这要么是夸大其词,要么功能极其有限。直到在某个智能家居项目截止日前48小时,因Java界面卡死而被迫尝…...