Stata实操：用PSM搞定论文内生性问题，从数据清洗到结果解读保姆级教程-平芜编程栈

Stata实战：用PSM方法解决研究内生性问题的完整指南

在实证研究中，内生性问题一直是困扰研究者的重要障碍。当处理组和对照组在观测特征上存在系统性差异时，简单的回归分析可能导致有偏的估计结果。倾向得分匹配（Propensity Score Matching，PSM）作为一种准实验方法，能够有效缓解由选择偏差带来的内生性问题，近年来在经济学、社会学、公共卫生等领域得到广泛应用。

本文将基于Stata软件，从实际研究问题出发，详细介绍PSM方法的完整操作流程。不同于简单的代码罗列，我们将深入探讨每个步骤背后的计量经济学原理，帮助研究者不仅掌握操作技巧，更能理解方法适用性和结果解读要点。无论你是正在撰写毕业论文的研究生，还是准备投稿期刊的青年学者，这份指南都能为你提供可直接套用的解决方案。

1. PSM方法基础与适用场景

1.1 内生性问题与PSM原理

内生性问题源于样本选择偏差，当个体是否接受处理（如参与培训项目）与其潜在结果相关时，传统的回归分析就会产生偏误。PSM通过构建"反事实框架"解决这一问题，其核心思想是为处理组的每个个体找到特征相似的对照组个体，从而模拟随机实验环境。

PSM的关键步骤包括：

估计倾向得分：计算每个个体进入处理组的概率
匹配处理：根据倾向得分寻找相似个体
平衡性检验：验证匹配后组间协变量是否平衡
效应估计：比较匹配样本的结果差异

提示：PSM只能控制可观测变量的影响，对于不可观测的混杂因素仍需借助工具变量等其他方法。

1.2 适用条件与前提假设

PSM方法有效性的前提是满足以下假设：

条件独立性假设：给定协变量，处理分配与潜在结果独立
共同支撑假设：处理组和对照组的倾向得分分布存在重叠区域
平衡性假设：匹配后协变量在处理组和对照组间分布均衡

下表对比了PSM与随机对照试验(RCT)的特点：

特征	PSM	RCT
处理分配	非随机	随机
混杂控制	仅可观测变量	可观测和不可观测变量
外部效度	取决于样本代表性	通常较高
实施成本	相对较低	通常较高

2. 数据准备与倾向得分估计

2.1 数据导入与变量处理

我们以研究"职业培训对收入的影响"为例，使用Stata自带的nswre74.dta数据集。首先进行数据准备工作：

use nswre74.dta, clear * 生成必要变量 gen u74 = (re74==0) // 1974年失业状态 gen u75 = (re75==0) // 1975年失业状态 * 描述性统计 summarize age educ black hisp married nodegree re74 re75 u74 u75 if treat==1 // 处理组 summarize age educ black hisp married nodegree re74 re75 u74 u75 if treat==0 // 对照组

2.2 倾向得分模型设定

选择合适的协变量是PSM成功的关键。协变量应满足：

影响处理分配（如是否参与培训）
影响结果变量（如收入）
不受处理影响（在时间上先于处理）

我们使用logit模型估计倾向得分：

* 安装psmatch2包 ssc install psmatch2, replace * 定义全局变量 global x "age educ black hisp married nodegree re74 re75 u74 u75" * 估计倾向得分 logit treat $x predict pscore, pr // 生成倾向得分

3. 匹配方法与实施

3.1 常用匹配方法比较

Stata的psmatch2命令支持多种匹配算法，各有优缺点：

方法	命令选项	优点	缺点
最近邻匹配	neighbor(1)	简单直观	可能匹配质量差
卡钳匹配	caliper(0.2)	避免差匹配	可能损失样本
核匹配	kernel	使用所有信息	计算量大
半径匹配	radius	平衡质量与数量	需要设定合理半径

3.2 实施1:1最近邻匹配

* 1:1最近邻匹配 psmatch2 treat, pscore(pscore) neighbor(1) common out(re78) * 查看匹配结果 psgraph // 共同支撑域 pstest $x, both // 平衡性检验

匹配后需特别关注：

匹配样本量（共同支撑域）
标准化偏差（%bias应<10%）
t检验结果（组间应无显著差异）

3.3 匹配质量诊断

良好的匹配应使处理组和对照组在关键变量上分布相似。我们可以通过多种图形检验匹配质量：

* 核密度图比较 twoway (kdensity pscore if treat==1) /// (kdensity pscore if _weight!=.), /// legend(label(1 "处理组") label(2 "匹配对照组")) /// title("匹配后倾向得分分布")

4. 结果解读与报告

4.1 处理效应估计

PSM主要估计三种处理效应：

ATE(Average Treatment Effect)：总体平均处理效应
ATT(Average Treatment Effect on the Treated)：处理组的平均处理效应
ATU(Average Treatment Effect on the Untreated)：对照组的平均处理效应

在学术论文中，通常报告ATT结果：

* 显示ATT结果 estat att

结果解读要点：

ATT值的经济意义和统计显著性
处理效应的方向（正/负）和幅度
与匹配前估计的比较（偏误减少程度）

4.2 敏感性分析

为验证结果稳健性，建议进行以下敏感性分析：

不同匹配方法比较：

* 半径匹配 psmatch2 treat, pscore(pscore) radius caliper(0.2) out(re78) * 核匹配 psmatch2 treat, pscore(pscore) kernel out(re78)

不同卡钳值测试：尝试0.1、0.2等不同卡钳值，观察结果稳定性
协变量组合测试：增减协变量，检验ATT变化

5. 常见问题与解决方案

在实际应用中，研究者常遇到以下问题：

问题1：匹配后样本量大幅减少

检查共同支撑域（psgraph）
尝试更宽松的匹配标准（如增大卡钳值）
考虑使用核匹配保留更多样本

问题2：某些变量始终不平衡

检查该变量是否同时影响处理和结果
尝试在匹配中增加该变量的二次项或交互项
考虑使用马氏距离匹配（mahalanobis选项）

问题3：处理效应不显著

检查匹配质量（pstest结果）
验证共同支撑假设（psgraph）
考虑是否存在不可观测混杂因素

注意：PSM不是万能的，当关键混杂因素不可观测时，应考虑结合其他方法如双重差分(DID)或断点回归(RD)。

6. 论文写作中的PSM报告规范

在学术论文中报告PSM结果时，应包括以下要素：

方法描述：
- 匹配变量选择依据
- 使用的具体匹配方法
- 匹配前后的样本量
平衡性检验：
- 标准化偏差变化
- 关键变量的t检验结果
- 匹配质量可视化展示
效应估计：
- ATT值及标准误
- 统计显著性水平
- 经济意义解释
稳健性检验：
- 不同匹配方法的结果比较
- 不同协变量组合的测试
- 其他敏感性分析结果

以下是一个典型的PSM结果报告表格示例：

变量	匹配前处理组均值	匹配前对照组均值	匹配后对照组均值	标准化偏差(%)	偏差减少(%)
年龄	25.82	28.03	25.91	3.2	89.5
教育	10.35	10.24	10.33	0.5	95.1
收入	2095	1532	2087	0.4	98.3

在应用PSM方法的过程中，我发现匹配质量对结果影响极大。一次关于教育政策评估的研究中，最初匹配后某些变量仍存在显著差异，通过调整协变量组合和匹配算法，最终获得了良好的平衡性。这个过程让我深刻体会到，PSM不仅是一种技术操作，更需要研究者对数据特征和理论背景的深入理解。

Stata实操：用PSM搞定论文内生性问题，从数据清洗到结果解读保姆级教程