当前位置：首页 > news >正文

【Python实战因果推断】23_倾向分3

news 2026/6/1 16:57:22

Propensity Score Matching

Inverse Propensity Weighting

Propensity Score Matching

另一种控制倾向得分的常用方法是匹配估计法。这种方法搜索具有相似可观测特征的单位对，并比较接受干预与未接受干预的单位的结果。如果您有数据科学背景，您可以将匹配视为一种简单的 K 最近邻（KNN）算法，其中 K=1 。首先，使用倾向得分作为唯一特征，在接受治疗的单位上拟合一个 KNN 模型，并用它来推算对照组的 Y1。然后，在未治疗单位上拟合一个 KNN 模型，用它来推算治疗单位的 Y0。在这两种情况下，推算值都只是匹配单位的结果，而匹配是基于倾向得分的：

 from sklearn.neighbors import KNeighborsRegressorT = "intervention"X = "propensity_score"Y = "engagement_score"treated = data_ps.query(f"{T}==1")untreated = data_ps.query(f"{T}==0")mt0 = KNeighborsRegressor(n_neighbors=1).fit(untreated[[X]],untreated[Y])mt1 = KNeighborsRegressor(n_neighbors=1).fit(treated[[X]], treated[Y])predicted = pd.concat([# find matches for the treated looking at the untreated knn modeltreated.assign(match=mt0.predict(treated[[X]])),# find matches for the untreated looking at the treated knn modeluntreated.assign(match=mt1.predict(untreated[[X]]))])predicted.head()

一旦你有了一个匹配的每个单位，你可以估计的ATE： $ATE=\frac1N\sum\left\{\left(Y_i-Y_{jm}(i)\right)T_i+\left(Y_{jm}(i)-Y_i\right)(1-T_i)\right\},$

其中 $Y_{jm}(i)$ 是治疗组不同于i的单位i的匹配值：

 np.mean((predicted[Y] - predicted["match"])*predicted[T]+ (predicted["match"] - predicted[Y])*(1-predicted[T]))0.28777443474045966

老实说，我不是这个估计器的忠实粉丝，第一，因为它有偏差；第二，因为它的方差很难推导；第三，因为我在数据科学方面的经验让我对 KNN 产生了怀疑，主要是因为它在处理高维 X 时效率很低。我在这里教授这种方法，主要是因为它非常有名，你可能会在这里或那里看到它。

Inverse Propensity Weighting

还有一种被广泛使用的倾向得分利用方法，我认为它更可取--反倾向加权法（IPW）。这种方法根据干预的反概率对数据重新加权，可以使干预在重新加权的数据中看起来像是随机分配的。为此，我们通过 $1/P(T=t|X)$ 对样本进行重新加权，以创建一个伪人群，近似于如果每个人都接受了 t 治疗会发生的情况： $E\bigl[Y_t\bigr]=E\biggl[\frac{\mathbb{1}\left(T=t\right)Y}{P(T=t\mid X)}\biggr]$

再说一遍，证明这一点并不复杂，但这不是重点。因此，让我们坚持直觉。假设你想知道 Y1 的期望值，即如果所有经理都参加了培训，平均参与度会是多少。为了得到这个期望值，你需要将所有接受干预的经理人按照接受干预的反概率进行排序。这样，那些接受干预的概率很低，但还是接受了培训的人的权重就会很高。从本质上讲，你是在提高罕见干预案例的权重。

这很有道理，对吗？如果一个接受干预的个体接受治疗的概率很低，那么这个个体看起来就很像未接受干预的个体。这一定很有趣！如果未接受治疗的个体接受了治疗， $Y_{1}|T=0$ ，那么这个看起来像未接受治疗的个体很可能对未接受治疗的个体会发生的情况有很大的参考价值。对照组也是如此。如果对照组看起来很像治疗组，那么它很可能是 $Y_{0}|T=1$ 的良好估计值，所以你要给它更大的权重。

以下是管理培训数据的处理过程，权重表示为每个点的大小：

请注意，当 $\hat{e}(X)$ 较低时，接受过培训的经理人（T = 1）的权重较高。你给予了那些看起来像未接受过培训的经理人很高的权重。相反，当 $\hat{e}(X)$ 较高或 $\hat{P}(T=0|X)$ 较低时，未接受培训的经理人的权重较高。在这种情况下，您就会高度重视与已治疗者相似的未治疗者。

如果您可以使用倾向得分来恢复平均潜在结果，这也意味着您可以使用倾向得分来恢复 ATE：

$ATE=E\bigg[\frac{\mathbb{1}\left(T=1\right)Y}{P(T=1\mid X)}\bigg]-E\bigg[\frac{\mathbb{1}\left(T=0\right)Y}{P(T=0\mid X)}\bigg]$

这两种期望都可以用非常简单的代码从数据中估计出来：

 weight_t = 1/data_ps.query("intervention==1")["propensity_score"]weight_nt = 1/(1-data_ps.query("intervention==0")["propensity_score"])t1 = data_ps.query("intervention==1")["engagement_score"]t0 = data_ps.query("intervention==0")["engagement_score"]y1 = sum(t1*weight_t)/len(data_ps)y0 = sum(t0*weight_nt)/len(data_ps)print("E[Y1]:", y1)print("E[Y0]:", y0)print("ATE", y1 - y0)E[Y1]: 0.11656317232946772E[Y0]: -0.1494155364781444ATE 0.2659787088076121

此外，这个结果看起来与使用 OLS 得到的结果非常相似，这可以很好地检查您是否做错了什么。还值得注意的是，ATE 表达式可以简化如下：

$ATE=E\bigg[Y\frac{T-e(x)}{e(x)(1-e(x))}\bigg]$

果然，它产生的结果与以前完全相同：

 np.mean(data_ps["engagement_score"]* (data_ps["intervention"] - data_ps["propensity_score"])/ (data_ps["propensity_score"]*(1-data_ps["propensity_score"])))0.26597870880761226

【Python实战因果推断】23_倾向分3

Propensity Score Matching

Inverse Propensity Weighting

相关文章：

【Python实战因果推断】23_倾向分3

Qt源码解析之QObject

【算法专题】模拟算法题

分库分表真的适合你的系统吗？

9 redis,memcached,nginx网络组件

【MySQL】事务四大特性以及实现原理

【控制Android.bp的编译】

【车载开发系列】J-Link/JFlash 简介与驱动安装方法

207 课程表

罗剑锋的C++实战笔记学习（一）：const、智能指针、lambda表达式

宁德时代天行发布，商用车超充时代来临

硅纪元应用评测 | 弱智吧大战GPT4o和Claude 3.5 Sonnet

注意力机制 attention Transformer 笔记

开始尝试从0写一个项目--后端（二）

【图解大数据技术】Hive、HBase

composables 目录下的文件（web前端）

使用Python绘制堆积柱形图

DP:二维费用背包问题

C语言标准库中的函数

Qt5.9.9 关于界面拖动导致QModbusRTU(QModbusTCP没有测试过)离线的问题

抖音数字资产管理方法论：构建个人内容沉淀系统的技术实践

T型翼/尾板导向的穿浪双体船姿态控制【附代码】

CVPR 2023反无人机数据集实战：用ModelScope上的开源模型快速上手目标检测

深度学习从心电信号中解码呼吸频率：原理、实现与临床价值

用Python+OpenCV手把手实现Prewitt边缘检测（附完整代码与效果对比图）

利用DiSEqC协议与AVR单片机驱动卫星天线电机改造户外设备

别再死记硬背SMO公式了！用Python手写一个SVM分类器，带你一步步拆解SMO核心逻辑

三十岁想从零转行现实吗？带你分辨真正有前景的好工作

基于ATmega2560与ISD1700的智能语音时钟：硬件选型、软件架构与避坑指南

企业云盘签章技术方案：从数字签名原理到工程落地