前沿方法 | 多期 DID 估计的新范式：异质性处理效应下的偏误纠正与路径选择-广东外语外贸大学粤港澳大湾区会计与经济发展研究中心

当前位置: 网站首页

科学研究

正文

科学研究

前沿方法 | 多期 DID 估计的新范式：异质性处理效应下的偏误纠正与路径选择

双重差分法（Difference-in-Differences, DID）作为因果推断领域的“常青树”，在近年的社会科学研究中应用极广。然而，随着计量经济学理论的不断演进，研究者们逐渐意识到，当样本受处理的时间点不一致（Staggered Adoption）且存在异质性处理效应时，传统的双向固定效应（Two-way Fixed Effects, TWFE）模型可能会产生严重的估计偏误。

近年来，以 Callaway & Sant’Anna (2021)、Goodman-Bacon (2021) 为代表的学者对这一问题进行了深刻剖析。这不仅是计量理论的突破，更直接影响了政策评估的结论可靠性。本文旨在详细介绍多期DID中的负权重问题，并深入探讨主流的改进方案及其在Stata中的实现。

一、双向固定效应（TWFE）的失效困境

1. 传统模型的局限性。经典的多期DID模型通常设定为如下形式：

　其中，是处理变量，为个体固定效应，为时间固定效应。在处理时点齐一的情况下，是无偏的。但在处理时点不一致（Staggered DID）时，该模型隐含了一个强假设：处理效应在个体间和时间上是同质的。

2. 负权重问题的直观理解

Goodman-Bacon (2021) 提出的分解定理揭示了TWFE估计量的构成。他指出，实际上是三类双组DID估计量的加权平均：

（1）早处理组vs.晚处理组：在晚处理组尚未受处理时，早处理组作为处理组。

（2）晚处理组vs.早处理组：此时早处理组已受处理，其观测值被当作晚处理组的控制组。

（3）处理组vs.始终未处理组：最干净的对照方案。

当存在动态处理效应（即政策效果随时间增强或减弱）时，上述第（2）类比较会出现“污染”。由于早处理组的观测值中包含了其自身处理效应的变动，将其作为对照组剔除后，会导致估计结果严重偏离真实值，甚至产生“符号逆转”。

三、前沿改进方法的理论与路径

1. CS估计量：基于分组平均处理效应（GATT）

Callaway & Sant’Anna (2021) 提出了解决多期DID偏误的新框架。其核心逻辑是不再进行全局加权，而是计算“组别-时间”维度的平均处理效应ATT(g, t)。

（1）识别机制

对于在g时点受处理的组别，在t时点的效应定义为：

该方法只使用“尚未受处理”或“始终未受处理”的样本作为对照组。这种选择机制排除了“已处理组”作为对照的可能性，从源头上消除了负权重。

（2）平行趋势的放松

CS估计量允许通过倾向得分匹配（PSM）来处理协变量，即便在原始数据不满足平行趋势时，只要满足“条件平行趋势假设”，仍能获得一致估计。

2. 堆叠双重差分法（Stacked DID）

堆叠DID在实践中极受欢迎，因为它直观且易于操作。

（1）构建逻辑

研究者针对每一个政策时点g提取一个小数据集（Event Cohort），该数据集包含在g时点受处理的单位，以及在整个观察期内从未受处理的“干净”单位。最后将这些子数据集纵向堆叠。

（2）模型设定

在堆叠数据上跑回归时，必须加入“子集-个体”和“子集-时间”固定效应。这种做法确保了每一对比较都是在“处理组”与“干净对照组”之间进行，完全规避了时点差异带来的交叉污染。

四、软件实现：基于Stata的实操指南1. CS估计量的实现（csdid 命令）　Stata用户可以使用csdid命令。假设y是因变量，id是个体，year是时间，first_treat 是首次受处理年份：

*安装命令

ssc install csdid, replace

*执行估计

csdid y x1 x2, ivar(id) tvar(year) gvar(first_treat) method(drimp)

*查看汇总效应

estat simple

*绘制动态效应图（事件研究法）

estat event, window(-5 5)

csdid_plot

2. 堆叠 DID 的实现逻辑

堆叠DID虽无单一官方命令，但可通过stata的循环语句快速构建。关键在于为每个Cohort标记特定的固定效应。目前已有stackedev等第三方包可以辅助完成这一过程。

参考文献

[1] Callaway B, Sant’Anna P H C. Difference-in-differences with multiple time periods[J]. Journal of econometrics, 2021, 225(2): 200-230.

[2] Goodman-Bacon A. Difference-in-differences with variation in treatment timing[J]. Journal of econometrics, 2021, 225(2): 254-277.

[3] Baker A C, Larcker D F, Wang C C Y. How much should we trust staggered difference-in-differences estimates?[J]. Journal of Financial Economics, 2022, 144(2): 370-395.

[4] Sun L, Abraham S. Estimating dynamic treatment effects in event studies with heterogeneous treatment effects[J]. Journal of econometrics, 2021, 225(2): 175-199.

【关闭窗口】