前沿方法 | 工具变量法最新理论发展与应用展望-广东外语外贸大学粤港澳大湾区会计与经济发展研究中心

当前位置: 网站首页

科学研究

正文

科学研究

前沿方法 | 工具变量法最新理论发展与应用展望

工具变量法（IV）是经济学因果推断中应用最广泛的识别策略之一。然而，当处理效应存在异质性、工具变量不止一个、内生变量不再二元、或者政策评估需要外推到更广人群时，传统IV框架的局限性开始显现——局部平均处理效应（LATE）还能解释什么？我们还能信任Bartik工具变量吗？

王也、李海风、杨汝岱、易君健在《工具变量法最新理论发展与应用展望》一文中，系统梳理了异质性处理效应下工具变量法的前沿进展。从LATE到边际处理效应（MTE），再到Bartik工具变量的识别革命，这篇文章为实证研究者提供了一份清晰的方法论地图。

一、经典LATE框架的三个“够不着”

Imbens & Angrist（1994）提出的LATE框架，是IV估计量的“定海神针”。它将IV估计结果解释为“依从者”（compliers）的平均处理效应，简洁、非参、无须分布假设。

但随着研究情境复杂化，经典LATE开始显得力不从心：

1. 多个工具变量时，单调性假设太强

当研究者同时使用多个工具变量（如距离+学费），经典LATE的单调性假设要求所有人的偏好排序完全一致——要么所有人都更看重距离，要么所有人都更看重学费。这显然与现实不符。

事实上，有人只在乎距离，有人只在乎学费。此时，传统IV估计量不再是单一依从者的平均效应，而是多类“依从者们”的加权平均，且部分权重可能为负——IV估计结果可能彻底失去解释力。

2. 内生变量多值时，依从者的“来路”不清楚

当处理变量不再是“上不上大学”，而是“选经济学、法学还是数学”时，工具变量变化所引致的依从者可能来自不同的次优选择。有人是从数学转来，有人是从法学转来——他们的处理效应可能截然不同。

此时，IV估计量是这些不同“来路”依从者的加权平均，若无次优选择信息，研究者无法分离出“选A相对于选B”的真实回报。

3. 只能估计依从者，无法外推

政策制定者真正关心的，往往不是“因为工具变量而改变行为的那群人”，而是“所有人”甚至“特定目标人群”。但LATE框架无法回答：始终接受者和从不接受者的处理效应是多少？这项政策在另一个环境里还会有效吗？

这三个“够不着”，推动了工具变量法的两轮重要革新：边际处理效应（MTE）与Bartik工具变量识别理论的突破。

二、边际处理效应：从“局部”走向“全局”

MTE框架由Heckman & Vytlacil（1999, 2005）等发展，它不是对LATE的否定，而是将LATE置于一个更广阔的选择模型之中。

1. MTE是什么？

直观而言，MTE衡量的是：在是否接受处理刚好“无差异”的个体中，处理效应的平均值。

这些“临界个体”的倾向得分（propensity score）不同，MTE就不同。LATE正是某一区间内MTE的平均值。换句话说，LATE是MTE的“切片”，而MTE是LATE的“全集”。

2. 从LATE外推：打开非依从者的黑箱

在MTE框架下，只要对潜在结果关于倾向得分的函数形式做合理假设（如线性），就可以将依从者的处理效应外推至始终接受者与从不接受者。

这意味着：即使你的工具变量只能“扰动”一小部分人，你仍然可以估计出全样本的平均处理效应（ATE）、处理组的平均处理效应（ATT），甚至特定政策目标人群的预期效应。

3. 离散工具变量怎么办？

现实中许多经典IV（如出生季度、抽签结果）取值有限。此时非参数估计MTE不可行，需引入额外假设。最新进展提供了两种路径：

对选择模型的误差项分布做参数假设；

假设处理效应关于倾向得分加性可分，从而通过增加协变量取值来识别更丰富的MTE形态。

三、Bartik工具变量：从“黑箱”到“工具箱”

Bartik工具变量（又称shift-share IV）是区域经济、国际贸易、劳动经济学中的“常青树”。但很长一段时间，它的识别假设像一只“黑箱”。

1. 三个视角，三种识别路径

Goldsmith-Pinkham et al.（2020）、Borusyak et al.（2022）、Borusyak & Hull（2023）分别从“份额外生”“变动外生”“直接控制”三条路径，为Bartik IV提供了清晰的识别条件。

份额外生法：如果期初份额（share）与后续冲击无关，则可将各行业份额分别作为工具变量，Bartik估计量是其加权平均。此时需重点关注权重较大的行业份额是否满足平行趋势。

变动外生法：如果行业层面的冲击（shift）是随机的，且行业数量足够多，则可将地区层面的回归转化为行业层面的回归。这一转化不仅厘清了识别条件，也解决了长期困扰实证研究的“份额相关扰动项”导致的过度拒绝问题。

直接控制法：当Bartik工具变量是冲击与份额的非线性函数时（如市场可达性），即使冲击外生，工具变量仍可能因份额的内生性而有偏。此时可通过构造工具变量的条件期望，将其作为控制变量或进行“去均值”处理，恢复外生性。

2. 冲击的性质决定参数含义

一个常被忽视的问题是：Bartik IV估计出来的弹性，究竟是供给弹性还是需求弹性？

答案取决于冲击的性质。如果使用的是劳动力需求冲击，估计的是供给弹性；如果使用的是劳动力供给冲击，估计的是需求弹性。若冲击是两者的混合，则估计量失去结构参数含义。

研究者必须根据研究问题，审慎选择或论证冲击的外生性与属性。

四、给实证研究者的行动指南

面对异质性处理效应与复杂的工具变量情境，实证研究可以遵循以下步骤：

第一，明确研究目标，选择适配的方法层级。

若只需评估某项已实施政策在当下环境中的效果，LATE框架足矣。请严格检验工具变量的独立性、排他性、单调性，并报告依从者特征。

若需将结果外推至其他人群或政策环境，MTE是更优选择。需评估工具变量是否支持连续倾向得分，并谨慎对待离散工具变量下的函数形式假设。

若需进行反事实模拟或福利分析，结构估计不可或缺。此时应以LATE估计为特征事实，构建经济学理论模型。

第二，处理多个工具变量时，警惕“负权重”。

在使用多个工具变量时，传统2SLS估计量可能赋予部分依从者负向权重。建议：

报告Goodman-Bacon风格的工具变量权重分解；

采用Mogstad et al.（2021）的部分单调性假设，并检验是否存在负权问题；

若负权严重，考虑合并工具变量或切换至MTE框架。

第三，使用Bartik IV时，先问三个问题。

我的识别依赖份额外生，还是变动外生？

若依赖份额外生，权重最大的几个份额是否满足平行趋势？

若依赖变动外生，行业数量是否足够？是否将地区回归转化至行业层面进行推断？

Adão et al.（2019）与Borusyak et al.（2022）均提供了便捷的Stata实现命令，应成为Bartik IV研究的标配。

第四，进行严肃的敏感性分析与有效性检验。

异质性处理效应下，传统工具变量过度识别检验不再适用。可参考Kitagawa（2015）、Sun（2023）的IV有效性检验方法。

MTE框架下，可检验工具变量是否独立于潜在结果与选择方程的误差项（Carr & Kitagawa，2023）。

Bartik IV可通过对事前结果变量的安慰剂检验、有效样本量汇报、基于份额的过度识别检验等方式，增强结果可信度。

文献引用

王也,李海风,杨汝岱,等.工具变量法最新理论发展与应用展望[J].经济学(季刊),2025,25(06):1411-1442.

【关闭窗口】