工具变量相关内容的详述b

工具变量的研究背景与目的

在研究公众注意力(Public Attention)对企业选择性披露(Selective Disclosure)的影响时,作者面临一个潜在的内生性问题(endogeneity),主要体现在以下两个方面:
内生性来源
具体表现
反向因果关系(Reverse Causality)
企业选择性披露行为本身可能会吸引媒体和公众关注。例如,一家公司大规模公开环保活动或丑闻,都会反过来提升其曝光度。
遗漏变量偏差(Omitted Variable Bias)
有些未观测因素可能同时影响公众注意力和选择性披露,比如公司治理水平、行业环境监管强度、公众环保意识等。
如果不解决这些问题,实证结果可能会误将相关性当作因果关系,从而得出错误结论。
例如:观察到公众注意力高的公司披露率高,但这可能是因为公司主动发布环保新闻吸引注意力,而非公众注意力促使其披露。
因此,作者引入工具变量法(IV),通过寻找与自变量(公众注意力)相关,但与因变量(选择性披露)仅通过公众注意力间接相关的外生变量,来识别公众注意力的真实因果效应。

工具变量的选择逻辑

作者提出了三类工具变量,分别针对公众注意力的两个测量指标——媒体报道数量(Media Coverage)维基百科访问量(Wikipedia Views)

媒体报道相关工具变量

(1) 行业层面媒体报道量(MEDIA-COV-IND)

  • 定义:行业层面(两位SIC行业代码)平均媒体报道数量,减去目标公司自身的媒体报道量。
  • 逻辑
    • 行业整体的新闻热度会影响媒体对个别公司的关注度,例如石油行业爆发环保丑闻时,整个行业都会被媒体追踪。
    • 但行业整体新闻量本身不会直接影响某一公司是否选择性披露,只是通过影响公众对该公司的关注度间接发挥作用。
  • 外生性解释
    • 行业热度是外部冲击,理论上与单个公司内部的选择性披露行为不直接相关。

最近新闻中心距离(NEWS-OUTL-DIST)

  • 定义:公司总部与最近的 Dow Jones 区域新闻机构之间的地理距离(单位:公里)。
  • 逻辑
    • 离主要新闻机构越近,公司更容易被报道,因为新闻机构获取信息的成本更低。
    • 地理距离影响报道概率,但不直接影响公司披露决策。
  • 外生性解释
    • 距离属于自然地理因素,不受公司自身披露策略或治理水平的影响,因此可作为一个外生工具变量。
这一思路类似于金融研究中常用的“距离法”,如分析分析师关注度与公司治理问题。

维基百科访问量相关工具变量

(3) 行业层面维基百科访问量(WIKI-VIEWS-IND)

  • 定义:与MEDIA-COV-IND类似,计算所在行业的平均维基百科页面访问量,再减去目标公司自身的访问量。
  • 逻辑
    • 如果某行业整体成为公众讨论的焦点,该行业下所有公司可能都受到更多访问关注。
    • 但行业整体维基百科访问量本身不会直接影响某一公司选择性披露的内容。
  • 外生性解释
    • 通过控制行业平均值,可以剥离与个别公司策略相关的部分,使得剩余波动仅反映外部公共兴趣的变化。

工具变量与主要变量的对应关系

自变量(内生性变量)
工具变量
作用机制
媒体报道数量(MEDIA-COV)
- MEDIA-COV-IND(行业媒体报道量) - NEWS-OUTL-DIST(最近新闻机构距离)
行业或地理因素驱动媒体关注度变化
维基百科访问量(WIKI-VIEWS)
- WIKI-VIEWS-IND(行业维基百科访问量)
行业兴趣驱动维基百科关注度变化
通过这些工具变量,作者可以分别识别两种公众注意力指标的外生波动。

4. 工具变量的理论合理性

为了确保工具变量有效,需满足以下两个核心条件:
条件
定义
在本研究中的体现
相关性(Relevance)
工具变量必须与内生解释变量(公众注意力)高度相关
- 行业整体媒体报道量与单个公司报道量高度相关- 公司与新闻中心距离与媒体关注度负相关
外生性(Exogeneity)
工具变量不能通过其他途径直接影响因变量(选择性披露)
- 行业层面平均值控制了个体行为- 地理距离是自然因素,不直接决定披露策略
作者在文中提供了理论依据并进行统计检验,证明这些工具变量符合条件。

5. 工具变量在模型中的应用

5.1 模型类型

  • 因变量为二元变量(SEL-DISC-BIN)时,使用 两阶段回归 + Logistic模型
  • 因变量为连续变量(SEL-DISC-MAGN)时,使用 两阶段Tobit模型

5.2 模型结构

第一阶段(First Stage):

解释公众注意力(Media Coverage 或 Wikipedia Views)
  • 其中 代表工具变量,如行业平均值或新闻距离。

第二阶段(Second Stage):

使用第一阶段预测的公众注意力,估计其对选择性披露的因果影响
  • 这里的 是预测值,解决了公众注意力与误差项相关的问题。

6. 结果与解释

作者报告了工具变量模型的关键检验结果:
检验
结论
第一阶段相关性
工具变量与公众注意力显著相关,F统计量远高于10,排除弱工具问题。
外生性检验
Hansen J检验(过度识别检验)表明工具变量外生性成立。
稳健性结果
使用IV模型后,公众注意力对选择性披露的正向关系仍然显著,且系数大小略有下降,表明原始OLS结果可能高估了效果。

7. 总结与意义

  1. 解决内生性问题
      • 工具变量帮助识别公众注意力对选择性披露的真实因果效应,排除企业主动操控公众关注的干扰。
  1. 理论与实证的结合
      • 工具变量设计紧密结合行业结构和地理分布特点,增强了模型的可解释性与外生性。
  1. 结果稳健
      • 即使在严格控制内生性后,结果依然支持“聚光灯理论”:
        • 公众注意力通常激励企业进行“战略性粉饰”,而不是增加真实透明度。

一句话总结工具变量部分

作者通过行业整体新闻热度、地理距离和行业维基百科访问量这三类外生工具变量,解决了公众注意力与企业选择性披露之间可能存在的反向因果和遗漏变量问题,从而更可靠地识别了公众注意力对选择性披露的真实因果效应。
Loading...
Article List
Practice makes perfect
文献集锦
如何理论创新?
管理学理论集锦
Python实际应用
聚类标准误与固定效应
巫师3:狂猎
Stata应用技巧
Python知识与技巧
双重差分法(DID)
创新文献阅读与摘要
计量经济学
Python绘图相关