Practice makes perfect
文献集锦
如何理论创新?
管理学理论集锦
Python实际应用
聚类标准误与固定效应
巫师3:狂猎
Stata应用技巧
Python知识与技巧
双重差分法(DID)
创新文献阅读与摘要
计量经济学
Python绘图相关
遗漏变量偏误检验
遗漏变量偏误检验方法:ITCV 与 RIR
type
Post
status
Published
date
slug
summary
tags
category
遗漏变量偏误检验
icon
password
网址
作者
标签
文章链接
发布时间
来源
为何要引入ITCV与RIR分析?
在管理学论文发表过程中,最令作者头疼的一条审稿意见莫过于:“该论文存在遗漏变量的内生性问题”(Omitted Variable Bias)。也就是说,有一些不可观测的混淆变量与自变量和因变量均相关,从而使模型估计产生偏差,使得推论无效。对此,一般的解决思路是:
- 增加审稿人建议的控制变量。然而,如果这些变量本身就难以观测与度量,就无法引入回归模型。另外,潜在的遗漏变量总是补充不完的。
- 对于面板数据,可以同时引入个体固定效应与时间固定效应,前者是为了控制个体层面不随时间变化的遗漏变量(如企业文化、企业注册地等),后者是为了控制时间层面不随个体变化的遗漏变量(如宏观政策事件的发布)。在一定程度上,此法能够缓解遗漏变量偏误对实证结果的影响。
- 基于相关性(与内生解释变量相关)、外生性(与误差项无关,即只能通过解释变量来影响因变量)的双重原则,寻找合适的工具变量,随后做两阶段最小二乘法(2sls)。然而,如果工具变量本身是弱变量或具有内生性,就会引入更大的偏差,而且满足排他约束性(exclusion restriction)的工具变量很难找到。
理论上,遗漏变量偏误总是无法避免的,几乎每个回归模型都会受其干扰(现实中没有无偏的计量模型)。那么,何不转换一下思路,评估这种偏误在多大程度上影响参数估计?如果影响程度较小,我们就可以大致认为目前的回归模型是合理的,虽然并不完美。反之,就需要使用以上列举的一般方法予以纠正。
基于以上想法,Frank教授及其研究团队开发了两套评估指标:(1)遗漏变量影响阈值(ITCV)与(2)推断对样本置换的稳健性 (RIR)。传统解决方案的关注点在于实证关系是否由于遗漏变量而产生偏差,而 ITCV/RIR 将关注点转向了“需要多少偏差才能使原始推论失效”。换句话说,这两个指标可以指示回归系数由统计显著到统计不显著的“阈值”,进而能够评估内生性问题的严重程度。
下面介绍核心原理:
遗漏变量影响阈值 (ITCV)
Frank (2000) 对遗漏变量影响因果推断的程度进行了量化,将指标取名为ITCV (Impact Threshold of a Confounding Variable),计算方式如下:
由上式可以看出,ITCV是混淆变量与自变量以及混淆变量与因变量的相关系数的乘积。例如,如下图所示,在研究父亲的职业
x 和其子女受教育程度y之间的关系时,一个被忽略的混淆变量可能是父亲的受教育程度cv,因为父亲的受教育程度同时和自变量父亲的职业以及因变量子女受教育程度相关。
- 直观逻辑:进一步的, 想象一个未被观测到的协变量(
cv)。要推翻你现有的因果结论,这个cv必须是一个“超级变量”:它既要与自变量(x)高度相关,又要与因变量(y)高度相关。ITCV 衡量的正是这种相关程度的乘积阈值。
- 为何是“乘积”? 偏误的大小取决于
cv桥接x与y的能力。如果 的乘积超过了基于自变量x计算出的ITCV,那么该遗漏变量便足以使你的回归系数降至零或统计不显著。
- 基准参考: 原则上没有标准的参考值,建议将ITCV与模型中所有协变量的ITCV值相比较。例如,如果模型中其他变量的ITCV都低于自变量
x的ITCV,那么可以认为结果是稳健的。
建议将自变量的ITCV与模型中所有协变量的ITCV值相比较,如果前者大于后者,那么可以认为模型结果是稳健的。
使推断无效的偏差百分比 (RIR)
RIR (Robustness of Inference to Replacement) 基于 Rubin 因果模型(RCM),它将复杂的统计偏误转化为一个简单的问题:“如果要改变目前的结论,需要置换掉样本中多少比例的数据?”
“[We] define the Robustness of an Inference to Replacement (RIR) as the number of treatment cases that had positive outcomes that would have to be replaced to invalidate an inference.“ (Frank, 2021)
RIR本质上是将一个估计值与一个阈值对比,观察要多大偏差才能使推论转变。计算方式如下:
系数估计值超过阈值越多,使推论转变所需的偏差越多,因果推断就越稳健。
如下图所示,假设研究 A(估计效果为 6)和 B(估计效果为 8)的处理效果都超过了推断 4 的阈值。但是研究 B 的估计效果超出阈值的程度超过了研究 A 的估计效果(其他条件相同)。那么,可以认为研究 B 得出的推论比研究 A 得出的推论更可靠,因为研究 B 得出的估计有更大的比例是由于偏差而使推论无效。因此,超过阈值越多,结果越稳健,遗漏变量偏误越不重要。

- 反事实逻辑: 借用 Frank et al. (2013) 的“头痛与阿司匹林”类比:你吃了药头不痛了,但要证明药效,需考虑“如果你没吃药会怎样”的反事实。因此,RIR问的是:需要有多少相反症状的人来代替原样本,才能让平均效应消失?
- 双重应用场景:
- 内部有效性(观察性研究): 此时 RIR 指的是需要多少比例的观测数据被“反事实数据”(即假设这部分人未受处理后的结果)置换。
- 外部有效性(实验研究): 此时 RIR 指的是需要置换掉多少比例的实验参与者,改用“非研究人群/非志愿者”的数据,才能使结论不再成立。
适用场景对比:ITCV 还是 RIR?
维度 | ITCV | RIR |
作用原理 | “遗漏变量得有多强(相关性多大)才能推翻结论?” | “得替换多少数据才能推翻结论?” |
更适合哪类模型 | 线性回归模型,比如OLS | 线性与非线性模型皆可,常用于负二项回归、Logit回归等,适用于对交互项的检验 |
最关键的解释抓手 | “遗漏变量需要多强才能推翻结论?” | “需要置换多少样本数据才能改变推断?” |
结果形式 | 相关系数的乘积 (),通常二者数值相等 | 样本置换的百分比 (%) |
Busenbark et al. (2022)给出了专业建议,详见下面的判断流程图:
参考文献
Frank, K.A. (2000) Impact of a Confounding Variable on a Regression Coefficient. Sociological Methods & Research, 29, 147–194. https://doi.org/10.1177/0049124100029002001
Frank, K.A., Maroulis, S.J., Duong, M.Q., Kelcey, B.M. (2013) What Would It Take to Change an Inference? Using Rubin’s Causal Model to Interpret the Robustness of Causal Inferences. Educational Evaluation and Policy Analysis, 35, 437–460. https://doi.org/10.3102/0162373713493129
Xu, R., Frank, K.A., Maroulis, S.J., Rosenberg, J.M. (2019) konfound: command to quantify robustness of causal inferences. The Stata Journal: Promoting Communications on Statistics and Stata, 19, 523–550. https://doi.org/10.1177/1536867X19874223
Busenbark, J.R., Yoon, H. (Elle), Gamache, D.L., Withers, M.C. (2022) Omitted Variable Bias: Examining Management Research With the Impact Threshold of a Confounding Variable (ITCV). Journal of Management, 48, 17–48. https://doi.org/10.1177/01492063211006458
上一篇
Stata中时间变量的格式转换
下一篇
Stata: konfound&pkonfound
Loading...