双重差分法(DID)已成为经济学与政策评估中最主流的识别策略之一。然而,随着研究情境的复杂化——尤其是“渐进政策”“交错处理”“多强度干预”等现实场景的普及,传统双向固定效应模型(TWFE)的局限性日益凸显,甚至可能因“负权重”问题导致估计严重偏误。
近年来,围绕DID方法的研究迎来了一轮重要的范式反思与方法革新。赵西亮、刘劭成、康卿在《双重差分设计及其最新发展》一文中系统梳理了这一演进脉络,从基于设计的计量范式出发,重新审视DID的目标参数、识别条件与估计方法。
一、双重差分法在应用研究中存在的一些问题
1. 估计方法使用不当的问题
评估渐进政策的文章大多使用TWFE作为主要的估计方法,但很少有文章在稳健性检验中采用最新的估计方法以讨论异质性对估计结果的可能影响。
2. 估计方法和识别假设不一致的问题
双重差分法的核心识别条件是平行趋势假设,而应用学者往往使用回归模型估计政策效应,但回归模型所蕴含的平行趋势假设和作者试图引入的平行趋势假设可能并不一致,从而使估计结果产生偏差。
3. 平行趋势检验问题
多数文章做了平行趋势检验,但基本上都采用事件研究法进行事前趋势的估计。在经典DID设计中,事件研究法作为估计事前效应的方法是合适的,但在渐进政策中,事件研究法可能存在污染偏差,并不适合估计事前效应。另外,目前流行的平行趋势检验方法存在很大问题,将安慰剂检验和显著性检验混淆,安慰剂检验是评估平行趋势是否成立的一种方法,而随机置换检验是在平行趋势假设成立的前提下检验DID估计量的统计显著性。
4. 协变量的引入方式问题
在TWFE模型中,非时变协变量不能直接引入,但有些学者没有注意到这一点,使估计方法所蕴含的平行趋势假设和作者引入的假设不一致,从而出现估计偏差。另外,对于时变协变量,应用学者往往将其直接引入回归模型,Caetano & Callaway(2024)发现,这种引入方式会造成负权重问题,从而出现估计偏差。
二、两种计量经济学研究范式
计量经济学存在两种基本的研究范式:基于模型的计量和基于设计的计量。基于模型的计量也称为结构计量(structural econometrics),其基本特点是根据经济理论等先验知识构造结构方程。结构方程是描述变量间因果关系的行为方程,应用中通常采用线性模型,模型系数就是因果效应参数。基于设计的计量也称为简约式计量(reduced-form econometrics),其是随着结构计量的衰落而发展起来的。基于设计的计量的典型特点是不引入结构方程,不引入任何函数形式假设,采用定义——识别——估计的三阶段方法。表1总结了两种计量研究范式的区别。

双重差分法是一种使用广泛的应用微观计量方法,是一种重要的研究设计和识别策略,核心识别条件是平行趋势假设,属于基于设计的计量的典型例子,是前向工程方法,采用目标参数定义——因果识别——参数估计的三阶段研究范式。
三、给实证研究者的行动指南
在应用DID设计时,可以采用如下步骤(Imbens & Xu,2024;Baker et al.,2025):
第一,可以利用panelveiw画出数据的结构图,可以画出干预实施的演化进程,也可以画出不同群组平均结果的演化路径,从而可以直观地判断无条件平行趋势是否满足。
第二,如果图形显示无条件平行趋势可能满足,可以利用模型(3)和模型(4)直接估计政策效应,理论上不需要引入其他控制变量。当然,如果从图形明显看出无条件平行趋势不满足,可以考虑引入非时变协变量,非时变协变量可以是政策实施前的相关变量。选择协变量时要考虑引入潜在的混杂因素,即可能会影响到干预分配同时影响到结果的变量。可以利用事件研究法估计各期效应,并画出事件研究法系数动态图,观察事前系数是否接近于零,从而评估条件平行趋势是否成立,并注意是否存在事前趋势。如果要引入时变协变量,根据Caetano & Callaway(2024)的最新研究,不能直接引入回归模型,需要将每期协变量作为非时变协变量进行引入。此时,可能会遇到高维协变量问题,需要利用DML等技术实施降维并估计参数。在引入协变量时,需要检验共同区间假设是否满足,可以利用倾向得分匹配,保证协变量平衡,估计时可以采用双重稳健等估计方法。如果评估的是渐进政策,要考虑异质性的影响,如果用TWFE进行估计,需要用Goodman-Bacon分解检验异质性的影响,或者采用新的估计量,并且在进行平行趋势检验时,需要用最新方法估计出事前效应,而不是直接使用事件研究法估计量。
第三,进行安慰剂检验和敏感性分析。通过构造合适的伪干预组,基于 Rosenbaum(1987)多个控制组对比的思想,检验平行趋势是否成立。这里不要使用随机置换检验,而是根据具体的研究问题构造合理的伪干预组(Duflo,2001)。如果事前具有明显的趋势,可以考虑假设事后也有类似趋势检验对估计效应的影响,即进行 Rambachan & Roth(2023)提出的敏感性分析以检验估计结果的稳健性。
第四,关于DID估计量的统计显著性,在聚类足够多时,可以采用聚类标准误差进行t检验。如果聚类太少,可以考虑使用随机置换检验作为稳健性检验,或使用Abadie et al.(2023)提出的基于设计的因果聚类标准误差。
文献引用
赵西亮,刘劼成,康卿.双重差分设计及其最新发展[J].经济学动态,2025,(10):193-208.