工具变量法(IV)是经济学因果推断中应用最广泛的识别策略之一。然而,当处理效应存在异质性、工具变量不止一个、内生变量不再二元、或者政策评估需要外推到更广人群时,传统IV框架的局限性开始显现——局部平均处理效应(LATE)还能解释什么?我们还能信任Bartik工具变量吗?
王也、李海风、杨汝岱、易君健在《工具变量法最新理论发展与应用展望》一文中,系统梳理了异质性处理效应下工具变量法的前沿进展。从LATE到边际处理效应(MTE),再到Bartik工具变量的识别革命,这篇文章为实证研究者提供了一份清晰的方法论地图。
一、经典LATE框架的三个“够不着”
Imbens & Angrist(1994)提出的LATE框架,是IV估计量的“定海神针”。它将IV估计结果解释为“依从者”(compliers)的平均处理效应,简洁、非参、无须分布假设。
但随着研究情境复杂化,经典LATE开始显得力不从心:
1. 多个工具变量时,单调性假设太强
当研究者同时使用多个工具变量(如距离+学费),经典LATE的单调性假设要求所有人的偏好排序完全一致——要么所有人都更看重距离,要么所有人都更看重学费。这显然与现实不符。
事实上,有人只在乎距离,有人只在乎学费。此时,传统IV估计量不再是单一依从者的平均效应,而是多类“依从者们”的加权平均,且部分权重可能为负——IV估计结果可能彻底失去解释力。
2. 内生变量多值时,依从者的“来路”不清楚
当处理变量不再是“上不上大学”,而是“选经济学、法学还是数学”时,工具变量变化所引致的依从者可能来自不同的次优选择。有人是从数学转来,有人是从法学转来——他们的处理效应可能截然不同。
此时,IV估计量是这些不同“来路”依从者的加权平均,若无次优选择信息,研究者无法分离出“选A相对于选B”的真实回报。
3. 只能估计依从者,无法外推
政策制定者真正关心的,往往不是“因为工具变量而改变行为的那群人”,而是“所有人”甚至“特定目标人群”。但LATE框架无法回答:始终接受者和从不接受者的处理效应是多少?这项政策在另一个环境里还会有效吗?
这三个“够不着”,推动了工具变量法的两轮重要革新:边际处理效应(MTE)与Bartik工具变量识别理论的突破。
二、边际处理效应:从“局部”走向“全局”
MTE框架由Heckman & Vytlacil(1999, 2005)等发展,它不是对LATE的否定,而是将LATE置于一个更广阔的选择模型之中。
1. MTE是什么?
直观而言,MTE衡量的是:在是否接受处理刚好“无差异”的个体中,处理效应的平均值。
这些“临界个体”的倾向得分(propensity score)不同,MTE就不同。LATE正是某一区间内MTE的平均值。换句话说,LATE是MTE的“切片”,而MTE是LATE的“全集”。
2. 从LATE外推:打开非依从者的黑箱
在MTE框架下,只要对潜在结果关于倾向得分的函数形式做合理假设(如线性),就可以将依从者的处理效应外推至始终接受者与从不接受者。
这意味着:即使你的工具变量只能“扰动”一小部分人,你仍然可以估计出全样本的平均处理效应(ATE)、处理组的平均处理效应(ATT),甚至特定政策目标人群的预期效应。
3. 离散工具变量怎么办?
现实中许多经典IV(如出生季度、抽签结果)取值有限。此时非参数估计MTE不可行,需引入额外假设。最新进展提供了两种路径:
对选择模型的误差项分布做参数假设;
假设处理效应关于倾向得分加性可分,从而通过增加协变量取值来识别更丰富的MTE形态。
三、Bartik工具变量:从“黑箱”到“工具箱”
Bartik工具变量(又称shift-share IV)是区域经济、国际贸易、劳动经济学中的“常青树”。但很长一段时间,它的识别假设像一只“黑箱”。
1. 三个视角,三种识别路径
Goldsmith-Pinkham et al.(2020)、Borusyak et al.(2022)、Borusyak & Hull(2023)分别从“份额外生”“变动外生”“直接控制”三条路径,为Bartik IV提供了清晰的识别条件。
份额外生法:如果期初份额(share)与后续冲击无关,则可将各行业份额分别作为工具变量,Bartik估计量是其加权平均。此时需重点关注权重较大的行业份额是否满足平行趋势。
变动外生法:如果行业层面的冲击(shift)是随机的,且行业数量足够多,则可将地区层面的回归转化为行业层面的回归。这一转化不仅厘清了识别条件,也解决了长期困扰实证研究的“份额相关扰动项”导致的过度拒绝问题。
直接控制法:当Bartik工具变量是冲击与份额的非线性函数时(如市场可达性),即使冲击外生,工具变量仍可能因份额的内生性而有偏。此时可通过构造工具变量的条件期望,将其作为控制变量或进行“去均值”处理,恢复外生性。
2. 冲击的性质决定参数含义
一个常被忽视的问题是:Bartik IV估计出来的弹性,究竟是供给弹性还是需求弹性?
答案取决于冲击的性质。如果使用的是劳动力需求冲击,估计的是供给弹性;如果使用的是劳动力供给冲击,估计的是需求弹性。若冲击是两者的混合,则估计量失去结构参数含义。
研究者必须根据研究问题,审慎选择或论证冲击的外生性与属性。
四、给实证研究者的行动指南
面对异质性处理效应与复杂的工具变量情境,实证研究可以遵循以下步骤:
第一,明确研究目标,选择适配的方法层级。
若只需评估某项已实施政策在当下环境中的效果,LATE框架足矣。请严格检验工具变量的独立性、排他性、单调性,并报告依从者特征。
若需将结果外推至其他人群或政策环境,MTE是更优选择。需评估工具变量是否支持连续倾向得分,并谨慎对待离散工具变量下的函数形式假设。
若需进行反事实模拟或福利分析,结构估计不可或缺。此时应以LATE估计为特征事实,构建经济学理论模型。
第二,处理多个工具变量时,警惕“负权重”。
在使用多个工具变量时,传统2SLS估计量可能赋予部分依从者负向权重。建议:
报告Goodman-Bacon风格的工具变量权重分解;
采用Mogstad et al.(2021)的部分单调性假设,并检验是否存在负权问题;
若负权严重,考虑合并工具变量或切换至MTE框架。
第三,使用Bartik IV时,先问三个问题。
我的识别依赖份额外生,还是变动外生?
若依赖份额外生,权重最大的几个份额是否满足平行趋势?
若依赖变动外生,行业数量是否足够?是否将地区回归转化至行业层面进行推断?
Adão et al.(2019)与Borusyak et al.(2022)均提供了便捷的Stata实现命令,应成为Bartik IV研究的标配。
第四,进行严肃的敏感性分析与有效性检验。
异质性处理效应下,传统工具变量过度识别检验不再适用。可参考Kitagawa(2015)、Sun(2023)的IV有效性检验方法。
MTE框架下,可检验工具变量是否独立于潜在结果与选择方程的误差项(Carr & Kitagawa,2023)。
Bartik IV可通过对事前结果变量的安慰剂检验、有效样本量汇报、基于份额的过度识别检验等方式,增强结果可信度。
文献引用
王也,李海风,杨汝岱,等.工具变量法最新理论发展与应用展望[J].经济学(季刊),2025,25(06):1411-1442.