断点回归模型
断点回归(Regression Discontinuity Design, RDD)是一种准实验设计方法,用于评估政策或其他干预措施的效果。这种方法利用了一个清晰的阈值或“断点”,在这个阈值上,处理状态(例如是否接受某种干预)会突然改变。通过比较断点两侧单位的差异,可以估计出干预效果。
一个生活中的例子是关于学生的奖学金分配。假设一所大学设立了一项奖学金,只有那些平均成绩达到80分以上的学生才有资格获得。这里,80分就是断点。在80分之上的学生和80分之下的学生在其他方面可能非常相似,但由于这个政策,他们的一个关键区别就是前者获得了奖学金而后者没有。

- 有一个突变过程,想象一下分段跳跃函数
反事实:
如果你不读博,你现在在干嘛?可惜你已经读博了,回不去了。所以反事实很难构建。
取平均后的效应( S 1 − S 0 S_1-S_0 S1−S0)是被高估的。

原因:
-
1.高分可能人更聪明,可能获得更好的发展空间
-
2.高分人的家庭条件更好,实习的机会更多,家庭的社会资源更广
-
3.。。。。就是原因可能并不完全来自【政策、处理】的效应。
那么该如何估计呢? -
1.设计一个小窗
-
2.在小窗内建立一个模型,但限制在小窗范围内
-
3.用前一个断点代替反事实
-
4.两者相减,得到处理效应

-
断点推文

模拟实验验证
- 产生数据

- 数据可视化


传统估计方法
- 简单均值比较


- 全样本回归


分别估计断点前后的线,计算出 τ 2 − τ 1 \tau_2-\tau_1 τ2−τ1就是处理效应。
这种也是高估的。 - 下面展示的是模型设定造成的偏差


- 下面是正解
断点:多项式回归-二次函数


断点:局部线性
- 适用条件:在断点局部有足够多的数据


RDD估计-理论
-
截距的阐释


-
以上就是一个平移【左加右减】,可以看出线不动,动坐标轴
-
x c < 0 xc<0 xc<0 control 组 and x c > 0 xc>0 xc>0 treat组
-
其实用用 α 1 \alpha_1 α1当作 α 2 \alpha_2 α2反事实。
-
关于h(窗宽)h越大,样本区间越大,估计越准确,但风险越高(样本区间的x和y不一定是线性关系),h越小,线性拟合越合理。
分两种情形的讨论
- 模型-平行斜率(左1)
- 模型-变斜率(左2、3)
注意在模型假设的形式上的区别。

当h扩大,线性假设可能不成立,如下图。所以,可以采取加平方项的局部多项式回归。模型假设如下(右下角)

记住一点:RDD算的处理效应其实就是在断点两边分别估完方程后与y【断点竖向轴线】的交叉值的差 其实斜率不重要。
RDD的stata模拟

- 标准stata的RDD实现代码

最优带宽的选择

rdrobust y x 自动选择带宽

- 一般在论文中要报告:左右两边的图像拟合情况。下面是代码和图像


- 注意:上图的散点其实是的分组 求平均的
- 比如:N=4000,带宽内的样本占比0.2,N1=800,在左右分成20组,一组N2=20,对组内求平均,左右各画20个点。

扩展:是否加入控制变量
连老师:其实不用,加入控制变量会出现变量冗余,通过局部多项式估计(1次2次3次项作为控制)之后,其实就够了,但一部分文献做了,可能是为了估得更准。
建议:都行,目前在争论。

关于局部多项式【高阶问题】 项数的选择问题
给出实验


模拟数据给出:阶数似乎越大越好,但这是基于我们知道模拟数据的真实情况,日常科研中,我们不是上帝,不知道真是的处理效果。
- 解决办法:信息准则


- AIC的模型更丰满(参数更多)-选M8
- BIC的模型更骨干(参数较少)-先M5


核加权局部多项式
- 用核密度函数估计
lpoly y x if x<0 ,at(cut) gen(av_y0) 左边条件
lpoly y x if x>=0 ,at(cut) gen(av_y1) 左边条件

总结
- 借助局部线性回归模型 Or 非线性(加入平方、三次、n次控制)
- 关键点是h的选择,有自动的代码
rdrobust


相关文章:
断点回归模型
断点回归(Regression Discontinuity Design, RDD)是一种准实验设计方法,用于评估政策或其他干预措施的效果。这种方法利用了一个清晰的阈值或“断点”,在这个阈值上,处理状态(例如是否接受某种干预…...
app广告推送常见业务术语
DAU: 日活跃用户(Daily Active Users) GMV: 商品交易总额(Gross Merchandise Volume) DSP=demand side platform=需求方平台 DMP=data management platform数据管理平台 ADX=ad exchange=广告交…...
2024/9/11 小型PLC典型应用2:伺服canlink配置、指令、应用
下面这个指令需要设置伺服的急停方式(例如:惯性停机、急停等等) 通讯故障步骤排查 1:接线问题 2:配置问题(波特率.....)...
在IDEA中如何创建web项目?——不使用Archetype
二、不使用Archetype 1、创建Maven项目 (1)首先打开Project Structure:File——>Project Structure或者快捷键crtlaltshifts (2)Module——>New Module: (3)在新打开的页面下…...
基于C#+SQL Server2008 开发三层架构(CS界面)图书管理系统
图书管理系统 一、项目背景及意义 当今由于信息技术的飞速发展,图书馆作为社会知识信息媒介的功能日益重要,网络环境下的信息资源建设知识仓库的设计,开放存取学术交流模式,知识管理系统,智能检索,数字参…...
AIGC简化文件管理:Python自动重命名Word和PDF文件
1.背景 大家应该也有遇到,自己电脑有很多文件命名不合理的文件,比如:文件1、想法3 ,当你长时间再看到这个文件的时候,已经很难知道文件内容。 今天我们将借助AIGC的编码能力,帮我们生成一个批量改文件名的…...
产线工控安全之防勒索病毒杀手锏
在当今数字化时代,数据安全已成为企业运营中不可或缺的一部分。勒索病毒和内部泄密事件的频发,使得企业必须采取更为严格的安全措施来保护其关键数据和运营系统。苏州深信达网络科技推出的MCK主机加固解决方案,正是为了应对这些挑战而设计的。…...
超详细超实用!!!网站开发页面适配360浏览器兼容模式
云风网 云风笔记 云风知识库 开发网站偶尔会遇到需要兼容ie的需求,这里以360浏览器为例,360浏览器是基于Chrome和IE双核浏览器,在极速模式下是跟谷歌浏览器内核一致的,兼容模式下的内核是IE内核。这里尤其是360兼容模式下&#x…...
【Redis】主从复制 - 源码
因为主从复制的过程很复杂, 同时核心逻辑主要集中在 replication.c 这个文件中, 避免篇幅过大, 所以将主从复制中涉及这个文件的代码集中到了另一篇文章。 在当前文章主要分析主从复制的大体代码逻辑, 如果需要了解整体的过程, 可以配合 Redis 主从复制 - relication 源码分析 …...
Redis:缓存击穿
缓存击穿(热点key): 部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库,造成巨大压力 1.互斥锁:可以保证强一致性 线程一:未命中之后,获取互斥锁,再查询数据库重建缓存,写…...
一文说清什么是数据仓库
01 数据仓库的概念 数据仓库的概念可以追溯到20世纪80年代,当时IBM的研究人员开发出了“商业数据仓库”。本质上,数据仓库试图提供一种从操作型系统到决策支持环境的数据流架构模型。 目前对数据仓库(Data Warehouse)的标准定义&a…...
【算法】哈希表相关
【ps】本篇有 5 道 leetcode OJ。 一、算法简介 哈希表是一种存储数据的容器,可以快速查找某个元素,其查找的时间复杂度为 O(1),非常合适需要频繁查找某一个元素的场景。其具体用法为: 直接使用底层为哈希表的 STL 容器。用数组…...
企微机器人:企业数字化转型的得力助手
在数字化转型的浪潮中,企业对于提高运营效率、降低人力成本的需求日益迫切。企微机器人,作为基于企业微信平台开发的一种智能工具,以其高度自动化、灵活性强、安全性高和易于使用的特点,迅速成为企业内部的得力助手。本文将深入探…...
Linux编程之socket入门教程 socket通讯原理
在Linux网络编程中,套接字Socket是进程间通信的基础,用来在网络上不同主机间进行数据的发送和接收。套接字作为一种抽象的接口,它屏蔽了底层网络协议的复杂性,使得开发者可以专注于数据的传输。以下将详细介绍Linux网络编程中的So…...
Windows上安装RabbitMQ
rabbitmq是干嘛的我就不介绍了,直接开始安装教程。 搭建成功演示图 下载安装包 https://pan.baidu.com/s/1ZlCFxh9Q00ynSU3ZCpTC9Q?pwdry51pan.baidu.com/s/1ZlCFxh9Q00ynSU3ZCpTC9Q?pwdry51 下载完后有两个包(erlang和rabbitmq) 先安装otp_win64_24.1.7.exe…...
【C++ 高频面试题】构造函数和析构函数你了解多少呢?
文章目录 1. 什么是构造函数和析构函数2. 构造函数和析构函数可以是虚函数吗3. 构造函数有哪几种4. 深拷贝和浅拷贝的区别 1. 什么是构造函数和析构函数 🐧 构造函数: 构造函数是在创建对象时自动调用的特殊成员函数。 目的:初始化对象的成…...
linux中vim介绍以及常用命令大全
前言 在Linux系统中,Vim是一个功能强大的文本编辑器,它广泛应用于服务器管理、脚本编写和程序开发中。Vim拥有两种模式:命令模式和插入模式。了解和掌握常用的Vim命令对于提高文本编辑效率至关重要。本文将详细介绍Vim的常用命令,…...
线性代数 第六讲 特征值和特征向量_相似对角化_实对称矩阵_重点题型总结详细解析
文章目录 1.特征值和特征向量1.1 特征值和特征向量的定义1.2 特征值和特征向量的求法1.3 特征值特征向量的主要结论 2.相似2.1 相似的定义2.2 相似的性质2.3 相似的结论 3.相似对角化4.实对称矩阵4.1 实对称矩阵的基本性质4.2 施密特正交化 5.重难点题型总结5.1 判断矩阵能否相…...
CSS“多列布局”(补充)——WEB开发系列35
多列布局是一种非常常见的布局方式,适用于内容丰富的页面,如新闻网站、杂志或博客。 一、CSS多列布局概述 CSS多列布局允许我们将内容分成多个垂直列,使页面布局更加灵活和多样化。多列布局的主要属性包括 column-count、column…...
UI自动化测试痛点解决方案
前言 UI自动化测试可以快速、准确地执行大量的测试用例,减少人工测试所需的时间和劳动力。能够在短时间内完成多个测试用例的执行,提高测试的效率和速度。但是UI自动化有个最大的痛点。当前端界面发生变化时,往往页面元素定位也会改变&#…...
别光盯着分号!从C2143编译错误,聊聊C++预处理和语法解析那些事儿
别光盯着分号!从C2143编译错误,聊聊C预处理和语法解析那些事儿 当你盯着屏幕上的C2143错误,反复检查分号却依然无解时,有没有想过编译器到底"看"到了什么?这个看似简单的语法错误背后,隐藏着从源…...
Java反射getMethods()方法顺序不确定性解析与解决方案
1. 项目概述:一个看似简单却暗藏玄机的API行为如果你写过Java反射相关的代码,大概率用过Class.getMethods()这个方法。它的官方文档描述简洁明了:“返回一个包含 Method 对象的数组,这些对象反映了此 Class 对象表示的类或接口的所…...
RoboMaster云台控制实战:基于大疆C板与GM6020的双环PID调参心得与角度控制优化
RoboMaster云台控制实战:基于大疆C板与GM6020的双环PID调参心得与角度控制优化 1. 从电机转动到精准控制的技术跃迁 当GM6020电机第一次在开发板上转动起来时,那种成就感往往会让初学者兴奋不已。但很快就会发现,让电机简单地转动与实现云台的…...
K3s离线安装保姆级避坑指南:从镜像准备到集群验证(含Harbor私有仓库配置)
K3s离线安装全流程实战:从私有仓库搭建到集群高可用 在金融、军工、政务等对网络安全要求极高的领域,离线环境部署Kubernetes集群已成为刚需。作为轻量级Kubernetes发行版,K3s凭借其小于50MB的二进制体积和内置组件简化设计,成为隔…...
CANN/asc-devkit log1pf函数文档
log1pf 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.com/can…...
告别臃肿PDF!用Ghostscript命令行批量压缩/拆分/合并的保姆级教程
Ghostscript实战指南:PDF批量处理的高效命令行艺术 每次面对动辄上百兆的扫描版PDF报告时,你是否也经历过邮箱附件发送失败、云盘上传卡在99%的崩溃瞬间?当领导临时要求合并二十份季度报表,或是学术期刊需要按章节拆分投稿时&…...
不止是省9.9刀:解锁特斯拉Model 3的‘行驶中保持WiFi’功能,打造家庭移动娱乐中心
不止是省9.9刀:解锁特斯拉Model 3的‘行驶中保持WiFi’功能,打造家庭移动娱乐中心 特斯拉Model 3的车载4G网络虽然方便,但在信号不佳的区域或需要大流量娱乐的场景下,往往显得力不从心。更让许多家庭用户纠结的是,高级…...
城市网格化治理平台
在快速城市化的今天,传统的“治安维护”模式已经远远不够。如何利用有限的治理资源,最大化地覆盖城市的每一个角落?答案就在于网格化。所谓网格化治理,即将城市空间划分为若干个均匀的“网格”,每一个网格都有明确的边…...
避坑指南:ESP32-C3蓝牙开发中GATT读写事件的常见误解与正确姿势
ESP32-C3蓝牙GATT开发实战:破解读写事件的核心逻辑与高效数据流设计 当你在ESP32-C3上实现蓝牙温度传感器时,是否遇到过这样的困境:手机APP读取到的温度值总是比实际值延迟了2秒?或者明明在代码里更新了数据,客户端却始…...
56、CAN总线RC低通滤波器截止频率计算与实战
CAN总线RC低通滤波器截止频率计算与实战 一、一个让我熬夜三天的CAN通信故障 去年做某车载ECU项目,CAN总线在电机启动瞬间频繁丢帧。示波器抓波形,CAN_H对地毛刺高达8V,持续时间约200ns。团队里有人提议“加磁珠”,有人喊“上共模扼流圈”。我翻出TI的AN-2298应用笔记,发…...
