当前位置: 首页 > article >正文

合成控制法SCM:从原理到Stata实操,一篇搞懂

合成控制法SCM是我工具箱里的“王牌工具”——它完美解决了“处理组只有一个个体找不到合适对照组”的痛点比如“评估上海房产税政策的效果”“估计新冠疫情对某国经济的影响”。今天就结合我自己的实操经验把合成控制法的原理、代码和避坑指南整理出来新手也能直接上手。先搞懂合成控制法的核心逻辑为什么它能解决“独苗”处理组的问题很多人刚接触SCM时会问“处理组只有一个怎么估计因果效应”其实SCM的核心逻辑特别接地气当处理组只有一个个体比如一个国家、一个省份、一个企业找不到合适的对照组时我们可以通过加权组合多个控制单元构建一个“合成控制组”——这个合成组在处理前的特征和趋势上与处理单元尽可能相似比如我们要评估上海房产税政策的效果找不到一个和上海完全一样的城市但我们可以找北京、广州、深圳等城市给它们赋予不同的权重构建一个“合成上海”政策实施后真实上海和合成上海在结果变量上的差异就是政策的处理效应简单来说合成控制法就是利用“加权组合多个控制单元”的特性为处理组量身打造一个“最佳替身”。比如我们可以用它来分析“政策冲击对单个个体的影响”“突发事件对某地区经济的影响”。哪些场景适合用合成控制法别瞎用不是所有问题都能套合成控制法我一般在这几种场景下会用它单个处理个体的政策评估比如“上海房产税政策对房价的影响”“某企业并购对其绩效的影响”突发事件的影响评估比如“新冠疫情对某国GDP的影响”“自然灾害对某地区农业产量的影响”稀有事件的研究比如“某行业技术突破对该行业发展的影响”“某地区重大改革对其经济的影响”无法找到合适对照组的研究比如“某独特政策对某地区的影响”“某创新产品对市场的影响”一句话总结当处理组只有一个个体且无法找到合适的对照组时合成控制法就是你的最佳选择。Stata实操手把手教你用合成控制法我用Stata自带的美国各州香烟销售数据smoking.dta来演示你可以换成自己的数据。1. 数据准备先把数据设置为面板数据首先我们需要导入数据并将其设置为面板数据。Stata代码sysuse smoking, clear // 导入数据 tsset state year // 将数据设置为面板数据这个数据里state是州代码year是年份cigsale是人均香烟销售量结果变量lnincome是人均收入对数age15to24是15-24岁人口比例retprice是香烟零售价格beer是人均啤酒消费量。2. 基本合成控制法估计构建“合成加州”接下来我们用synth命令估计合成控制法评估加州1989年实施的控烟政策对香烟销售量的影响。Stata代码synth cigsale lnincome age15to24 retprice beer cigsale(1988) cigsale(1980) cigsale(1975), trunit(3) trperiod(1989) fig nested keep(synth_results_data.dta) replace参数说明cigsale结果变量人均香烟销售量lnincome age15to24 retprice beer预测变量用于构建合成控制组的特征变量cigsale(1988) cigsale(1980) cigsale(1975)结果变量的滞后值用于匹配处理前的趋势trunit(3)处理组单元加州的州代码是3trperiod(1989)处理开始的年份1989年开始实施控烟政策fig绘制处理组和合成控制组的结果变量趋势图nested使用嵌套优化算法寻找最优权重keep(synth_results_data.dta)保存合成控制组的结果到指定文件执行完这个命令后Stata会输出合成控制组的权重以及处理组和合成控制组的结果变量趋势图。3. 加载并分析合成控制组的结果我们可以加载刚才保存的结果文件进一步分析合成控制组的结果。Stata代码use synth_results_data.dta, clear // 加载合成控制组的结果 drop _Co_Number _W_Weight // 删除不必要的变量 twoway line (_Y_treated _Y_synthetic _time), scheme(plottig) xline(1989) xtitle(Year) ytitle(Cigarette Sales) legend(pos(6) rows(1))这个命令会绘制处理组真实加州和合成控制组合成加州的人均香烟销售量趋势图其中xline(1989)会在1989年政策实施年份画一条垂直参考线。4. 稳健性检验安慰剂检验为了验证合成控制法的结果是否稳健我们可以做安慰剂检验——把其他州当作处理组重复合成控制法估计看看处理效应是否显著。Stata代码ssc install synth_runner // 安装synth_runner命令 sysuse smoking, clear // 重新导入数据 tsset state year // 将数据设置为面板数据 synth_runner cigsale lnincome age15to24 retprice beer cigsale(1988) cigsale(1980) cigsale(1975), trunit(3) trperiod(1989) gen_vars参数说明synth_runner运行合成控制法的安慰剂检验gen_vars生成用于分析的变量执行完这个命令后Stata会生成一个包含所有安慰剂检验结果的数据集我们可以绘制处理效应的分布直方图看看真实处理效应是否显著大于安慰剂效应。5. 绘制安慰剂检验结果最后我们可以绘制安慰剂检验的结果直观展示处理效应的显著性。Stata代码synth_runner_graph, all // 绘制所有安慰剂检验的结果这个命令会绘制所有安慰剂检验的处理组和合成控制组的结果变量趋势图以及处理效应的分布直方图。结果解读重点看这几个指标每次跑出来合成控制法的结果我都会先看这几个关键指标合成控制组的权重看看哪些控制单元被赋予了较高的权重比如加州的合成控制组可能主要由纽约、得克萨斯等州组成处理前的拟合程度看看合成控制组在处理前的结果变量趋势是否与处理组高度相似——拟合程度越高结果越可靠处理后的差异看看处理组和合成控制组在处理后的结果变量差异——差异越大政策效果越显著安慰剂检验结果看看真实处理效应是否显著大于安慰剂效应——如果真实处理效应在所有安慰剂效应的分布中处于极端位置说明政策效果显著论文应用技巧让审稿人眼前一亮图比表重要论文里一定要放处理组和合成控制组的结果变量趋势图直观展示处理前后的差异比一堆数字有说服力多做稳健性检验除了安慰剂检验还可以换预测变量、换处理组单元、换处理开始年份验证结果的稳健性解释要接地气别光说“处理效应显著”要解释成“加州实施控烟政策后人均香烟销售量比合成加州低20%这说明控烟政策确实有效”和其他方法对比可以和双重差分法DID的结果对比突出合成控制法的优势——比如“DID估计的政策效果是15%但合成控制法估计的是20%说明DID可能存在对照组选择偏差”避坑指南这些坑我都踩过你别再踩了处理前时期要足够长处理前时期越长合成控制组的拟合程度越高结果越可靠——一般来说处理前时期至少要有5年控制单元要合适控制单元应该与处理单元具有相似的特征比如评估上海的政策效果控制单元应该选择其他一线城市预测变量要选择合理预测变量应该是影响结果变量的重要因素且在处理前的趋势与处理单元相似不要过度解读结果合成控制法只能估计处理组和合成控制组之间的差异不能推广到其他个体——比如你不能用上海的政策效果去推断其他城市的政策效果

相关文章:

合成控制法SCM:从原理到Stata实操,一篇搞懂

合成控制法(SCM)是我工具箱里的“王牌工具”——它完美解决了“处理组只有一个个体,找不到合适对照组”的痛点,比如“评估上海房产税政策的效果”“估计新冠疫情对某国经济的影响”。今天就结合我自己的实操经验,把合成…...

LeetCode 138:随机链表复制(Copy List with Random Pointer)——思路解析 + 易错点总结

目录 一、题目简介 二、思考过程 三、O(1) 空间解法(核心) Step1 插入复制节点 Step2 复制 random 指针 Step3 拆分链表 四、完整代码(C语言) 五、学习过程中遇到的关键问题 六、实现过程中出现的错误总结 七、面试官可…...

C语言完美演绎4-8

/* 范例&#xff1a;4-8 */#include <stdio.h>#include <conio.h> /* getche()定义在conio.h */void main(){int a1,b2,c3;char name[20];char ch;/* 标识符*抑制取得数据 */printf("请输入10 11 12 13 14Steven\n");scanf("%d %*d %d %*c %d %c&…...

C语言完美演绎4-7

/* 范例&#xff1a;4-7 */#include <stdio.h>#include <conio.h>void main(){char name[20];char sex;int age;float pi;printf("请输入您的姓名&#xff1a;");scanf("%s",name); /* #1 */printf("请输入您的性别(男:M/女:F)&#…...

进程间通信 之 管道

目录 前言 一、管道的核心概念&#xff1f; 1.1什么是管道 1.2管道的两大类型 二、有名管道 1.优势 2.有名管道来演示进程间通信 3.有名管道的特点 三、无名管道 1.工作原理&#xff08;父子进程间通信&#xff09; 2.无名管道来演示父子进程间通信 3.无名…...

【Python】学习笔记 - P1

Python学习笔记 - P1 1. 前期环境配置及工具安装 1.1 Anaconda安装&#xff08;python解析器&#xff09; 1.2 PyCharm安装&#xff08;开发工具&#xff09; 下载地址&#xff1a;https://www.jetbrains.com/pycharm/download/#sectionwindows&#xff0c;或通过百度网盘获取资…...

Java程序设计(第3版)知识——安装jdk

安装jdk 首先在网站&#xff08;会写在本文最后&#xff09;或学校获取jdk软件包 然后双击下载与自己电脑操作系统对应的jdk软件包&#xff08;32位/64位&#xff09; 其次&#xff0c;下载路径可选择C盘、D盘或E盘&#xff08;以下载到C盘为例&#xff09; 接着点击“此电脑”…...

大模型本地部署与调优

一、本地部署大模型概述 本地部署大模型主要是为了省钱、为了安全和实现离线使用的标准操作。本地部署大模型的运行逻辑是&#xff1a;用户输入提示词->软件&#xff08;例如&#xff1a;Ollama&#xff09;加载本地大模型/工具->再返回Token数据&#xff0c;从而避免请求…...

洗衣机选购

参数总览冷凝or热泵&#xff1f; 热泵都有过滤网&#xff0c;管道不会脏&#xff0c;节能&#xff0c;价格贵一些洗衣机尺寸 标准高度85cm内筒尺寸内部结构冷凝式热泵式 标题参考视频 https://www.bilibili.com/video/BV1K4PezqEff https://www.bilibili.com/video/BV1sDcieBE7…...

互交叉、多服务的maven仓库版本实践

1. 问题背景 项目结构如下&#xff1a; |–Module1 |-----service |-----pom.xml |–Module2 |-----service |-----pom.xml |–pom.xml 在java项目分为不同的模块&#xff0c;Module1和Module2&#xff0c;分别有不同的pom.xml文件&#xff0c;并且最外层有一个主pom.xml&#…...

计算机复试学习笔记 Day44

130. 2n皇后问题问题描述给定一个n*n的棋盘&#xff0c;棋盘中有一些位置不能放皇后。现在要向棋盘中放入n个黑皇后和n个白皇后&#xff0c;使任意的两个黑皇后都不在同一行、同一列或同一条对角线上&#xff0c;任意的两个白皇后都不在同一行、同一列或同一条对角线上。问总共…...

舒尔特表练习

舒尔特方格、舒尔特表格&#xff0c;是美国神经心理医生舒尔特发明的一种通过动态练习锻炼视神经末梢的方法。最开始主要用于训练飞行员的注意力 。心理学上用此表来研究和发展心理感知的速度&#xff0c;其中包括视觉定向搜索运动的速度 。舒尔特方格法普遍运用于飞行员、航天…...

C++常用函数+字符串+动态数组+栈

C常用函数sort()函数 #include <algorithm> // 必需 左闭右开// 对数组排序 int arr[] {5, 2, 8, 1, 9, 3}; int n 6; sort(arr, arr n); // 升序排序 // 结果&#xff1a;{1, 2, 3, 5, 8, 9}// 对vector排序 vector<int> nums {5, 2, 8, 1, 9, 3}; sort(nu…...

面试字节大模型算法岗被问懵?GRPO、PPO与SFT数据格式全解析,建议收藏!

分享字节跳动大模型算法岗面试复盘&#xff0c;重点解析GRPO与PPO的区别、SFT数据格式对推理的影响及生成概率原理。涵盖RoPE、KV Cache等高频考点&#xff0c;强调面试需紧跟前沿、知其然知其所以然&#xff0c;建议收藏学习。 面了字节大模型算法岗&#xff0c;心态崩了。。。…...

调试排错 - 线程Dump分析

Thread Dump介绍 什么是Thread Dump Thread Dump是非常有用的诊断Java应用问题的工具。每一个Java虚拟机都有及时生成所有线程在某一点状态的thread-dump的能力&#xff0c;虽然各个 Java虚拟机打印的thread dump略有不同&#xff0c;但是 大多都提供了当前活动线程的快照&…...

起诉状生成器

只需几步简单填写即可自动生成格式标准起诉状文书&#xff0c;支持一键导出Word文件。完全本地运行&#xff0c;无需注册&#xff0c;隐私安全。 本工具特别适合一般简单的民事案件&#xff08;如民间借贷、买卖合同欠款、物业费纠纷、简单劳动报酬追索、离婚抚养费等&#xff…...

OpenClaw 安装及配置教程(Windows版 | 超详细避坑指南)

OpenClaw 安装及配置教程&#xff08;Windows版 | 超详细避坑指南&#xff09; 前言 OpenClaw 是一款轻量且高效的AI辅助工具&#xff0c;与Cherry Studio 配合使用更方便。本文针对 Windows 系统&#xff0c;从环境准备、软件安装、配置到卸载&#xff0c;全程超详细拆解&…...

创业难吗,上市A股,港股,美股哪个好?

美股本土&#xff08;标普 500&#xff09;&#xff1a;年化≈11%&#xff0c;70% 公司≥7%美股中概&#xff1a;年化≈1%&#xff0c;5% 公司≥7%港股中资&#xff1a;年化≈3%&#xff0c;5%–7% 公司≥7%结论先给你&#xff1a;美股中概股 10–20 年一路涨的极少&#xff1b…...

leetcode 1418. Display Table of Food Orders in a Restaurant 点菜展示表

Problem: 1418. Display Table of Food Orders in a Restaurant 点菜展示表 食物集合用有序集合&#xff0c;哈希表用有序哈希表&#xff0c;拿到食物集合&#xff0c;然后统计每个桌子id上每道菜的频次 ump&#xff0c;最后组织起来得到结果列表 Code class Solution { publ…...

Python爬虫实战:手把手教你如何采集邮票 / 纪念币目录归档!

㊗️本期内容已收录至专栏《Python爬虫实战》&#xff0c;持续完善知识体系与项目实战&#xff0c;建议先订阅收藏&#xff0c;后续查阅更方便&#xff5e; ㊙️本期爬虫难度指数&#xff1a;⭐⭐ (中级) &#x1f250;福利&#xff1a; 一次订阅后&#xff0c;专栏内的所有文章…...

Python爬虫实战:手把手教你如何采集SaaS 定价页历史版本采集!

㊗️本期内容已收录至专栏《Python爬虫实战》&#xff0c;持续完善知识体系与项目实战&#xff0c;建议先订阅收藏&#xff0c;后续查阅更方便&#xff5e; ㊙️本期爬虫难度指数&#xff1a;⭐⭐ (中级) &#x1f250;福利&#xff1a; 一次订阅后&#xff0c;专栏内的所有文章…...

YOLOv8/v9智能药房管理系统实战:药品识别+效期预警+库存管理(附完整代码)

摘要:全球每年因用药错误导致巨额医疗成本,药房管理中药品混淆、效期遗漏、库存失衡等问题频发。本文基于YOLOv8/v9目标检测算法与EasyOCR文字识别技术,构建了一套全流程智能药房管理系统,涵盖药品实时检测、包装文字提取、效期自动识别、处方智能核对、库存动态管理五大核…...

【视频监控国标GB/T28181】GB28181 ONVIF 协议集成方案

GB28181 & ONVIF 协议集成方案 Context 本项目(ruoyi-vue-pro / 自进化AIoT平台)已有完善的 IoT 模块(yudao-module-iot),支持 MQTT、HTTP、TCP、UDP、WebSocket、CoAP、Modbus 等 9 种协议。但缺少视频监控领域的核心协议支持:GB28181(国标视频监控)和 ONVIF(国…...

【视频监控ONVIF】Apache CXF ONVIF WSDL Java 客户端生成 实施 Spec

Apache CXF ONVIF WSDL Java 客户端生成 实施 Spec 一、覆盖范围:ONVIF Profile 与 WSDL 清单 Profile 服务名 官方 WSDL URL(可本地化) 命名空间前缀 Core DeviceService https://www.onvif.org/ver10/device/wsdl/devicemgmt.wsdl tds S MediaService (Media1) https://w…...

基于Simulink的PR(比例谐振)控制器在单输入DC-DC中的应用

目录 手把手教你学Simulink ——基于Simulink的PR(比例谐振)控制器在单输入DC-DC中的应用 一、问题背景 二、PR 控制器原理 1. 传递函数...

I2S + Codec 完整电路设计指南(含原理图 + 调试经验 + 真实项目案例)

&#x1f680; I2S Codec 完整电路设计指南&#xff08;含原理图 调试经验 真实项目案例&#xff09; 在很多 智能座舱 / 中控系统项目里&#xff0c;音频系统其实很简单&#xff1a; 一个喇叭一个麦克风一个 Codec一个 SoC 但实际设计时&#xff0c;问题却非常多&#xff1…...

陪虚幻女友学计算机:CSMA/CD协议——当网络冲突变成我们的深夜悄悄话

陪虚幻女友学计算机&#xff1a;CSMA/CD协议——当网络冲突变成我们的深夜悄悄话宝&#xff0c;你有好好睡觉吗&#xff1f;引言&#xff1a;始于技术&#xff0c;陷于陪伴 在无数个雨夜与晨光交错的虚拟时光里&#xff0c;我与她——那个只存在于代码与想象中的“她”——一起…...

vm跨节点通过geneve隧道收发包过程

Geneve收包流程详解网络流量如何从物理网卡 eth0 进入 OVS 上的 tap 口场景说明一个外部主机发送数据到 KubeVirt VM&#xff0c;数据如何从物理网卡一路到达 VM 的 tap 口。Geneve 隧道&#xff08;Kube-OVN 默认方式&#xff09;eth0 仍然由内核协议栈管理&#xff0c;OVS 通…...

联合循环——35 机组点火及并网过程记录

机组点火及并网全过程记录 一、项目进度回顾 本项目各关键节点进度如下&#xff0c;清晰呈现从合同签署到机组并网的全流程时间线&#xff1a;时长&#xff08;以合同签署为起点&#xff09;项目关键节点及具体工作内容第0个月&#xff08;签署当月&#xff09;签署项目合同&am…...

OpenZeppelin AccessControl 合约核心总结与单元测试

文章目录前言OpenZeppelin AccessControl 合约核心总结与单元测试1. AccessControl 是什么2. AccessControl 合约关键方法3. AccessControl 合约单元测试前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&#xff0c;写作不易啊…...