过去三十年,以安格里斯特(Joshua Angrist)为代表的“经验主义范式”主导了经济学实证研究。其核心思路被概括为“无伤大雅”(Mostly Harmless):通过简单易行的回归模型,尤其是双重固定效应(TWFE)回归,近似估计异质性处理效应的平均值。然而,近年来这一范式屡受质疑,争议焦点之一便是TWFE回归在双重差分(DID)方法中的误用与泛化。
林梦芸、徐阳、郭汝飞、易君健在《管理世界》2025年第6期发表的《在模型误设的统一框架下理解双重差分方法的最新发展》一文,系统揭示了TWFE回归在广义DID应用中的模型误设问题,并提出统一框架以重新审视DID方法的发展与局限。
一、背景:“无伤大雅”思路的起源与推广
1. 条件独立假设下的常系数回归
安格里斯特(1998)提出,在条件独立假设下,常系数回归模型可近似估计异质性处理效应的加权平均(权重非负且和为1),因此忽略处理效应异质性是“无伤大雅”的。这一结论基于饱和控制(对离散控制变量所有可能的取值进行控制),此时回归系数识别的是一种以处理状态条件方差为权重的加权平均处理效应。
2. 平行趋势假设下的TWFE回归推广
安格里斯特与皮施克(2009,2014)将“无伤大雅”思路延伸至平行趋势假设下的DID方法,提炼出TWFE回归的三类推广:
推广1:二元交错处理变量(多处理组、多时点);
推广2:非二元处理变量(多值或连续型处理强度);
推广3:添加额外协变量(如同时期其他政策变动)。
这些推广因灵活性与便利性在全球(尤其中国)经济学研究中广泛应用。然而,原文指出,这三类推广均未经过严格理论证明,仅依赖平行趋势假设时,常系数TWFE回归无法估计异质性处理效应的凸组合,导致“无伤大雅”失效。
二、核心发现:三类推广的模型误设与“负权重”问题
1. 二元交错处理变量(推广1)
在“试点先行、逐步推广”的政策场景中(如新农合、高铁建设),处理组在不同时间点接受处理。此时,TWFE回归不仅将未受处理组作为控制组,还将较早接受处理的组作为控制组,导致“禁止的对比”(如用先处理组作为后处理组的控制组)。
机制分析:通过DID示例分解发现,后处理组的DID估计值混合了先处理组不同时点的处理效应,甚至出现负权重(如先处理组在后期的效应以相反数进入估计)。古德曼培根(2021)的“培根分解”显示,TWFE系数可分解为多个2×2 DID估计的加权平均,其中部分组合权重为负,导致估计偏误。
动态模型(事件研究法)的局限:孙和亚伯拉罕(2021)指出,动态模型中相对时期虚拟变量的相关性会导致某期估计值混入其他期处理效应,即使控制组与处理组满足平行趋势,异质性仍会引发偏误。
2. 非二元处理变量(推广2)
当处理变量为多值离散或连续型(如地方教育附加征收比例、进口关税降幅),TWFE回归将处理强度较低的组作为控制组,引入“禁止的对比”。例如,若低强度组的单位处理效应更强,TWFE系数可能与真实效应符号相反。
机制分析:双组双期示例显示,双重差分估计值为两组处理效应的线性组合,其中低强度组的效应可能以负权重进入估计。多时点与非恒定处理强度进一步加剧“负权重”问题,导致估计偏误。
3. 额外协变量(推广3)
在政策评估中,处理组与控制组的特征差异(如财政实力、产业结构)可能随时间变化,直接添加时变协变量会导致模型误设:
坏控制变量:若协变量受处理变量直接影响(如政策加速产业结构转型),控制它会引入新的选择性偏误;
时变系数假设不成立:控制变量对结果的影响可能随时间变化(如环境库兹涅茨曲线的倒U型关系),常系数模型无法捕捉;
多处理变量干扰:控制其他政策变量时,副处理变量的效应会混入主处理变量的估计(德谢兹马丹和达奥尔特弗耶,2023a)。
三类推广的共同问题在于:仅依赖未受处理潜在结果的平行趋势假设时,TWFE回归不再以未受处理组为唯一控制组,导致常系数无法表示为异质性处理效应的凸组合(权重可能为负)。其本质是“禁止的对比”引入了不可控的权重,产生“负权重”问题,最终导致估计偏误。
三、解决办法:充分考虑处理效应的异质性
现有文献针对TWFE回归三类推广下的模型误设问题,开发了一系列新的估计方法。这些新方法背后的分析思路是一致的:既然TWFE回归的估计偏误来源于模型误设,那就在模型设定上充分考虑处理效应的异质性,直接估计包含异质性处理效应的复杂模型。

文章提供的相关实例和代码索引如下图所示(如果想进一步了解STATA命令可以阅读文章附录六实例和代码):

四、结语
原文的核心贡献在于构建了模型误设的统一框架,揭示了TWFE回归在广义DID中“无伤大雅”思路的根本局限:当处理效应异质且推广情形不满足凸组合条件时,常系数回归无法避免“负权重”偏误。这一发现挑战了安格里斯特经验主义范式的适用性,强调实证研究需基于具体问题背景与经济理论设定模型,而非依赖“一刀切”的回归工具。
原文对研究者的启示尤为深刻:其一,应避免机械套用TWFE,识别处理效应的异质性,警惕“负权重”问题;其二,应结合经济理论选择模型,如“试点先行”政策需考虑交错处理的异质性,“多强度政策”需避免低强度组作为控制组;其三,应采用稳健估计方法,如队列分析、插补法、工具变量法等,提升因果推断的可信度。
文献引用
林梦芸,徐阳,郭汝飞,等.在模型误设的统一框架下理解双重差分方法的最新发展[J].管理世界,2025,41(06):227-264.
DOI:10.19744/j.cnki.11-1235/f.2025.0084.