第二种是替换推断稳健性（Robustness of Inference to Replacement，RIR）—Frank等（2013，2021）。RIR产生类似这样的结论："要使推断无效，估计效应中需要有__％是由偏差造成的。也就是说，要使推断无效，预计需要将__％的样本替换为预测变量对结果没有影响的样本。

2. konfound

2.1 概述

在选取模型后（线性回归模型），用户提供一系列变量名称，konfound 命令将会计算遗漏变量对每一个变量的影响（即ITCV），以此来判断因果推断的有效性。此外，konfound 还可以计算在估计中因果推断有效性偏差的大小（即RIR）。konfound 还可以提供用户模型中在统计意义上显著的变量的灵敏度图（P.S. 只有统计意义上显著的变量才能产生条形图）。

2.2 konfound命令

注意：

首次使用 konfound 命令的用户需要安装ssc install moss, indeplist 和 matsort三个命令。

konfound命令必须在回归之后立刻运行，中间不能有其他命令。

konfound在不指定指数类型时，默认输出RIR。

可以同时评价多个变量因果推断的稳健性

2.3 konfound输入

sig(#) 指明显著性水平，默认值为 sig (0.05)，也可以设置为其他值，例如 konfound x, sig(0.1)

nu(#) 指明与所检验估计相对立的原假设，默认值为 nu (0)

onetail(#) 默认双尾检验，即onetail(0)，单尾则需要改为：onetail(1).

uncond(#)计算ITCV值时是否考虑控制变量，默认考虑 uncond (0)，如不考虑则改为uncond (1)

indx()指定输出指数类型，indx("RIR")会输出RIR，而indx("IT")则输出ITCV。

rep_0(#) 控制偏差百分比替换情形下的效果，rep_0(0)（默认）意味着被替换样本的效应等于恰好让推断失效的临界值，而rep_0(1)则意味着被替换样本的效应等于0。注：目前只允许rep_0(0)，而rep_0(1)已经失效。

non_li (#) 针对非线性模型（如 logit 或 probit 模型），指定解释偏差百分比的基础。non_li(0)（默认）使用原始回归系数，non_li(1)使用平均边际效应。具体而言，non_li(#)存在两种设定：其一， non_li(0)意味着使用 原始回归系数（logit/probit 的 β）， 优点是与 Stata 输出一致，然而系数含义很难解释；其二，non_li(1)意味着使用平均边际效应，优点是经济含义清晰，可以解释为“概率变化” ，在实证研究中得到青睐。但对于线性回归而言，二者并没有区别。注：对于更新后的konfound命令，不能在logit命令之后直接使用konfound，作者团队更推荐使用pkonfound命令：we recommend using pkonfound for logistic regression

2.4 konfound 输出

konfound命令可以输出丰富的结果指标，在return list之后就会出现：

指标	含义
`itcv`	（考虑控制变量后）遗漏变量阈值
`unconitcv`	（不考虑控制变量）遗漏变量阈值
`rir`	样本替换稳健性
`thr`	显著性阈值
`r_xcv`	X 与遗漏变量相关性
`r_ycv`	Y 与遗漏变量相关性
`RsqXZ`	控制变量对 X 的解释力度（R方）
`RsqYZ`	控制变量对 Y 的解释力度（R方）
`Rsq`	微调整的原始R方

特别的，r_xcv：需要计算出CV与X之间的相关性需要达到多大程度，才能完全消除X对因变量的显著影响。这个临界相关性水平就是"最小影响"。如果需要很强的相关性才能抵消X的效应，说明即便存在CV，X的效应也是相当稳健的。反之,如果相关性很低就能消除X的效应,则表明模型结果可能不太稳健。

2.5 应用实例 - 线性回归

以 Hamilton (1992) 数据集来说明 konfound 命令的用法。第一个命令来自 Hamilton (1983) 关于用水量的调查。被解释变量是1981年夏天的家庭用水量 water81，解释变量包括1980年夏天的家庭用水量 water80，家庭收入 income，受教育年限 educ，户主是否退休 retire 和1980年家庭成员数 peop80。

Hamilton (1983).dta

13.8KB

首先，正常进行OLS回归。

由回归结果可以看出，家庭成员数 peop80 在统计意义上显著。为了量化关于遗漏变量的因果推断稳健性或量化判断因果推断有效性的偏差百分比，我们使用konfound命令，结果如下所示。

还可以输出更详细的参数值：

2.6 结果解读

ITCV阈值为 0.269，这意味着未观察到的混杂变量与 peop80 （自变量）和 water81 （因变量）之间的相关性之积只需约为 0.519（=√0.269）即可推翻 OLS 结果。虽然根据定义，我们无法观测到混杂变量（因为不可观测之变量不可得），但我们有其他控制变量。在第二个基于偏相关系数计算的表格中，我们展示了每个独立协变量的纳入对peop80系数的影响。与 ITCV 类似，Impact被定义为 x 变量与控制变量之间的偏相关性与 y 变量与控制变量之间的相关性的乘积。Impact的符号表示控制变量的纳入如何影响peop80系数：正影响分数表示控制变量的纳入会降低peop80的系数，而负影响分数则具有相反的效果。

可以看出，对peop80系数影响最大的变量是water80，其Impact值为 0.3325，将其作为benchmark，计算比值:

该比例意味着需要存在一个比 water80 与peop80、water81的相关性之积高出1.561倍（或者超过56%）的遗漏变量，才能推翻peop80影响water81的回归结果。

也就是说，首先将考虑控制变量后得出的ITCV与偏相关表格中各个协变量的Impact的绝对值进行比对，如果后者全部小于前者，则认为不可观测的遗漏变量对结果的影响较弱，那么回归结果是稳健的。

💡

在使用 ITCV 评估稳健性时，关键不在于 ITCV 本身的大小，而在于将其与什么基准进行比较。通常，研究者会将 ITCV 与控制变量的Impact进行对比，这种影响通常基于偏相关（即第二张表）计算，即在控制其他变量后的独立贡献。然而，这种比较隐含一个重要假设：潜在遗漏变量与已有控制变量在相关结构上是相似的。如果该假设不成立，例如遗漏变量与现有控制变量较为独立，则使用偏相关作为基准可能过于宽松。在这种情况下，应采用原始相关（即第一张表）作为更为保守的比较标准，这通常会降低对结果稳健性的判断。尽管如此，如果模型中已经包含了关键且强有力的控制变量，那么即使存在理论上可以推翻结果的遗漏变量，其在现实中的存在可能性仍然较低。因此，ITCV 的解释应结合基准选择与研究情境进行综合判断。

值得注意的是，Stata会生成如下图片：

上述图片的纵坐标为peop80的回归系数，由两部分构成：红色区域代表回归系数中超过阈值的部分，蓝色区域为是推断失效的阈值。因此，红色区域的占比越多，代表结果越稳健。

此外，使推断无效的偏差百分比（RIR）对于线性或非线性模型都适用，如果我们想进一步了解该模型的RIR数值，那么可以输入：

结果显示，RIR=74.96%，也就是说，对变量peop80而言，为使得因果推断无效，需要被效应为0的样本替代的样本比例为74.96%

网页版工具

如果不想用Stata，也可以直接访问 KonFound-It! 官方网站，找到KonFound-it! Shiny App，逐步选择因变量类型、数据类型、分析类型，输入回归报告中的基础数值，即可得到ITCV与RIR的报告。

主要参考文献

Frank, K.A. (2000) Impact of a Confounding Variable on a Regression Coefficient. Sociological Methods & Research, 29, 147–194.

Pan, W., Frank, K.A. (2003) A Probability Index of the Robustness of a Causal Inference. Journal of Educational and Behavioral Statistics, 28, 315–337.

Xu, R., Frank, K.A., Maroulis, S.J., Rosenberg, J.M. (2019) konfound: command to quantify robustness of causal inferences. The Stata Journal: Promoting Communications on Statistics and Stata, 19, 523–550.

Busenbark, J.R., Yoon, H. (Elle), Gamache, D.L., Withers, M.C. (2022) Omitted Variable Bias: Examining Management Research With the Impact Threshold of a Confounding Variable (ITCV). Journal of Management, 48, 17–48.

Frank, K.A., Saw, G.K., Lin, Q., Xu, R., Rosenberg, J.M., Maroulis, S.J., Staudt Willet, K.B. (n.d.) A practical guide to impact threshold of a confounding variable (ITCV) and robustness of inference to replacement (RIR). In s.f. Michigan State University.

遗漏变量偏误检验方法：ITCV 与 RIR

Stata: pkonfound

Last update: 2026-4-2

Hi, welcome to my blog!

Stata: konfound

1. 引言