基于相关性（与内生解释变量相关）、外生性（与误差项无关，即只能通过解释变量来影响因变量）的双重原则，寻找合适的工具变量，随后做两阶段最小二乘法（2sls）。然而，如果工具变量本身是弱变量或具有内生性，就会引入更大的偏差，而且满足排他约束性（exclusion restriction）的工具变量很难找到。

实际研究中，遗漏变量偏误总是无法避免的，几乎每个回归模型都会受其干扰。那么，何不转换一下思路，评估这种偏误在多大程度上影响参数估计？如果影响程度较小，我们就可以认为目前的回归模型是合理的，虽然并不完美。反之，就需要使用以上列举的一般方法予以纠正。

基于以上想法，Frank教授及其研究团队开发了两套评估指标：（1）遗漏变量影响阈值（ITCV）与（2）推断对样本置换的稳健性（RIR）。传统解决方案的关注点在于实证关系是否由于遗漏变量而产生偏差，而 ITCV/RIR 将关注点转向了“需要多少偏差才能使原始推论失效”。换句话说，这两个指标可以指示回归系数由统计显著到统计不显著的“阈值”，进而能够评估内生性问题的严重程度。

下面介绍核心原理：

遗漏变量影响阈值 (ITCV)

Frank (2000) 对遗漏变量影响因果推断的程度进行了量化，将指标取名为ITCV (Impact Threshold of a Confounding Variable)，计算方式如下：

由上式可以看出，ITCV是混淆变量与自变量以及混淆变量与因变量的相关系数的乘积。例如，如下图所示，在研究父亲的职业 x 和其子女受教育程度y之间的关系时，一个被忽略的混淆变量可能是父亲的受教育程度cv，因为父亲的受教育程度同时和自变量父亲的职业以及因变量子女受教育程度相关。

直观逻辑：进一步的，想象一个未被观测到的协变量（cv）。要推翻你现有的因果结论，这个 cv 必须是一个“超级变量”：它既要与自变量（x）高度相关，又要与因变量（y）高度相关。ITCV 衡量的正是这种相关程度的乘积阈值。

为何是“乘积”？偏误的大小取决于 cv 桥接 x 与 y 的能力。如果的乘积超过了基于ITCV阈值，那么该遗漏变量便足以使你的回归系数降至零或统计不显著。

基准参考：没有统一的参考值，建议将ITCV与模型中所有协变量的ITCV值相比较。例如，如果模型中其他变量的ITCV都低于自变量x的ITCV，那么可以认为结果是稳健的。

使推断无效的偏差百分比 (RIR)

RIR (Robustness of Inference to Replacement) 基于 Rubin 因果模型（RCM），它将复杂的统计偏误转化为一个简单的问题：“如果要改变目前的结论，需要置换掉样本中多少比例的数据？”

“[We] define the Robustness of an Inference to Replacement (RIR) as the number of treatment cases that had positive outcomes that would have to be replaced to invalidate an inference.“ (Frank, 2021)

RIR本质上是将一个估计值与一个阈值对比，观察要多大偏差才能使推论转变。计算方式如下：

🎇

系数估计值超过阈值越多，使推论转变所需的偏差越多，因果推断就越稳健。

如下图所示，假设研究 A（估计效果为 6）和 B（估计效果为 8）的处理效果都超过了推断 4 的阈值。但是研究 B 的估计效果超出阈值的程度超过了研究 A 的估计效果（其他条件相同）。那么，可以认为研究 B 得出的推论比研究 A 得出的推论更可靠，因为研究 B 得出的估计有更大的比例是由于偏差而使推论无效。因此，超过阈值越多，结果越稳健，遗漏变量偏误越不重要。

反事实逻辑：借用 Frank et al. (2013) 的“头痛与阿司匹林”类比：你吃了药头不痛了，但要证明药效，需考虑“如果你没吃药会怎样”的反事实。因此，RIR问的是：需要有多少相反症状的人来代替原样本，才能让平均效应消失？

双重应用场景：

内部有效性（观察性研究）：此时 RIR 指的是需要多少比例的观测数据被“反事实数据”（即假设这部分人未受处理后的结果）置换。
外部有效性（实验研究）：此时 RIR 指的是需要置换掉多少比例的实验参与者，改用“非研究人群/非志愿者”的数据，才能使结论不再成立。

适用场景对比：ITCV 还是 RIR？

维度	ITCV	RIR
作用原理	“遗漏变量得有多强（相关性多大）才能推翻结论？”	“得替换多少数据才能推翻结论？”
更适合哪类模型	线性回归模型，比如OLS	线性与非线性模型皆可，常用于负二项回归、Logit回归等，适用于对交互项的检验
最关键的解释抓手	“遗漏变量需要多强才能推翻结论？”	“需要置换多少样本数据才能改变推断？”
结果形式	相关系数的乘积 ()	样本置换的百分比 (%)

关于什么情况下使用ITCV或者RIR的问题，Busenbark et al. (2022)在文章中提供了专业建议，具体请见下方的判断流程图：

参考文献

Frank, K.A. (2000) Impact of a Confounding Variable on a Regression Coefficient. Sociological Methods & Research, 29, 147–194.

Frank, K.A., Maroulis, S.J., Duong, M.Q., Kelcey, B.M. (2013) What Would It Take to Change an Inference? Using Rubin’s Causal Model to Interpret the Robustness of Causal Inferences. Educational Evaluation and Policy Analysis, 35, 437–460.

Xu, R., Frank, K.A., Maroulis, S.J., Rosenberg, J.M. (2019) konfound: command to quantify robustness of causal inferences. The Stata Journal: Promoting Communications on Statistics and Stata, 19, 523–550.

Busenbark, J.R., Yoon, H. (Elle), Gamache, D.L., Withers, M.C. (2022) Omitted Variable Bias: Examining Management Research With the Impact Threshold of a Confounding Variable (ITCV). Journal of Management, 48, 17–48.

Stata中时间变量的格式转换

Stata: konfound

Last update: 2026-4-1

Hi, welcome to my blog!