
双重差分法(Difference-in-Differences, DID)作为因果推断领域的“常青树”,在近年的社会科学研究中应用极广。然而,随着计量经济学理论的不断演进,研究者们逐渐意识到,当样本受处理的时间点不一致(Staggered Adoption)且存在异质性处理效应时,传统的双向固定效应(Two-way Fixed Effects, TWFE)模型可能会产生严重的估计偏误。
近年来,以 Callaway & Sant’Anna (2021)、Goodman-Bacon (2021) 为代表的学者对这一问题进行了深刻剖析。这不仅是计量理论的突破,更直接影响了政策评估的结论可靠性。本文旨在详细介绍多期DID中的负权重问题,并深入探讨主流的改进方案及其在Stata中的实现。
一、双向固定效应(TWFE)的失效困境
1. 传统模型的局限性。经典的多期DID模型通常设定为如下形式:
其中,
是处理变量,
为个体固定效应,
为时间固定效应。在处理时点齐一的情况下,
是无偏的。但在处理时点不一致(Staggered DID)时,该模型隐含了一个强假设:处理效应在个体间和时间上是同质的。
2. 负权重问题的直观理解
Goodman-Bacon (2021) 提出的分解定理揭示了TWFE估计量的构成。他指出,
实际上是三类双组DID估计量的加权平均:
(1)早处理组vs.晚处理组:在晚处理组尚未受处理时,早处理组作为处理组。
(2)晚处理组vs.早处理组:此时早处理组已受处理,其观测值被当作晚处理组的控制组。
(3)处理组vs.始终未处理组:最干净的对照方案。
当存在动态处理效应(即政策效果随时间增强或减弱)时,上述第(2)类比较会出现“污染”。由于早处理组的观测值中包含了其自身处理效应的变动,将其作为对照组剔除后,会导致估计结果严重偏离真实值,甚至产生“符号逆转”。
三、前沿改进方法的理论与路径
1. CS估计量:基于分组平均处理效应(GATT)
Callaway & Sant’Anna (2021) 提出了解决多期DID偏误的新框架。其核心逻辑是不再进行全局加权,而是计算“组别-时间”维度的平均处理效应ATT(g, t)。
(1)识别机制
对于在g时点受处理的组别,在t时点的效应定义为:
该方法只使用“尚未受处理”或“始终未受处理”的样本作为对照组。这种选择机制排除了“已处理组”作为对照的可能性,从源头上消除了负权重。
(2)平行趋势的放松
CS估计量允许通过倾向得分匹配(PSM)来处理协变量,即便在原始数据不满足平行趋势时,只要满足“条件平行趋势假设”,仍能获得一致估计。
2. 堆叠双重差分法(Stacked DID)
堆叠DID在实践中极受欢迎,因为它直观且易于操作。
(1)构建逻辑
研究者针对每一个政策时点g提取一个小数据集(Event Cohort),该数据集包含在g时点受处理的单位,以及在整个观察期内从未受处理的“干净”单位。最后将这些子数据集纵向堆叠。
(2)模型设定
在堆叠数据上跑回归时,必须加入“子集-个体”和“子集-时间”固定效应。这种做法确保了每一对比较都是在“处理组”与“干净对照组”之间进行,完全规避了时点差异带来的交叉污染。
四、软件实现:基于Stata的实操指南1. CS估计量的实现(csdid 命令) Stata用户可以使用csdid命令。假设y是因变量,id是个体,year是时间,first_treat 是首次受处理年份:
*安装命令
ssc install csdid, replace
*执行估计
csdid y x1 x2, ivar(id) tvar(year) gvar(first_treat) method(drimp)
*查看汇总效应
estat simple
*绘制动态效应图(事件研究法)
estat event, window(-5 5)
csdid_plot
2. 堆叠 DID 的实现逻辑
堆叠DID虽无单一官方命令,但可通过stata的循环语句快速构建。关键在于为每个Cohort标记特定的固定效应。目前已有stackedev等第三方包可以辅助完成这一过程。
参考文献
[1] Callaway B, Sant’Anna P H C. Difference-in-differences with multiple time periods[J]. Journal of econometrics, 2021, 225(2): 200-230.
[2] Goodman-Bacon A. Difference-in-differences with variation in treatment timing[J]. Journal of econometrics, 2021, 225(2): 254-277.
[3] Baker A C, Larcker D F, Wang C C Y. How much should we trust staggered difference-in-differences estimates?[J]. Journal of Financial Economics, 2022, 144(2): 370-395.
[4] Sun L, Abraham S. Estimating dynamic treatment effects in event studies with heterogeneous treatment effects[J]. Journal of econometrics, 2021, 225(2): 175-199.