工具变量:教育回报IV探讨
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会 · 2023 Stata寒假班
作者:王美甜 (东北财经大学)
邮箱:17866548843l@163.com
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
目录
1. 基于 Card (1995) 讨论教育回报的 IV
1.1 描述性统计分析
1.2 使用 OLS 估计的回归结果
1.3 使用 2SLS 估计
1.4 Card (1995) 总结
2. 基于 Adams (2021) 讨论教育回报的 IV
2.1 工具变量法估计教育回报
2.2 工具变量的有效性检验
2.3 LATE 估计教育回报
2.4 Adams (2021) 总结
3. 基于 Kédagni (2021) 讨论教育回报的 IV
3.1 将上大学距离作为工具变量
3.2 LATE 实证边界范围
3.3 将上大学距离作为代理变量
3.4 Kédagni (2021) 总结
4. 总结
5. 参考文献
6. 相关推文
1. 基于 Card (1995) 讨论教育回报的 IV
1.1 描述性统计分析
Card (1995) 使用的数据来源于美国 1966 至 1981 年对青年男性的纵向调查数据 (NLSYM),对调查样本的描述性统计结果见下图所示。
统计结果显示:NLSYM 样本不是随机的对美国人口进行抽样的结果。NLSYM 样本中包含的位于南部地区的男性和黑人男性的比例较大。1976 年的子样本的统计结果显示:
41% 的男性居住在南部地区,64%-65% 的男性居住在标准都市区统计区域 (SMSA),67%-68% 的男性在 1966 年居住在 4 年制大学附近。 在家庭组成方面,78%-79% 的被调查者在 14 岁时与父母同住在一起,10% 仅与母亲住在一起,其余 11%-12% 与亲戚或继父继母同住在一起。 父亲与母亲的平均受教育年限为 10 年 (22% 与 11% 的样本分别缺少父亲与母亲的受教育年限,将缺少的数据用父母受教育水平的平均值进行替代)。 1966 年的访问还调查了世界知识测试得分,这项测试在以前研究教育回报率的文献中被用来度量能力。 被调查者在 1976 年的平均受教育年限是 13.2 年。其中,1/3 的样本报告了 12 年的受教育水平,23% 的样本报告有上大学,27% 的样本报告了大于 16 年的受教育水平。
1.2 使用 OLS 估计的回归结果
作者先使用了 OLS 估计方法研究教育回报率问题。具体建立了线性回归模型,并在所有模型中都包括了线性的受教育水平连续型变量、工作年数及其二次项、种族哑变量、居住在南部地区与大都市区 (SMSA) 地区哑变量。回归结果如下图所示。
OLS 估计结果显示受教育年数的系数相当稳定,每增加一年教育,收入增加 7.3%-7.5%。由于有许多原因会带来受教育年数与随机误差项相关。例如遗漏能力变量、受教育年数存在测量误差,因此上述 OLS 结果可能会导致教育回报率的有偏估计。如果我们找到与受教育年数相关,但不与工资相关的变量作为受教育年数的工具变量,就可以对“真实”的教育回报率进行一致估计。
1.3 使用 2SLS 估计
1.3.1 IV 相关性说明
作者选取了 是否在大学附近成长 作为受教育年数的工具变量。其理由是那些没有在大学附近成长的学生,上大学的成本会很高。这些较高的成本会减少他们上大学,这个情况至少对于家庭收入低的学生是成立的。
为了证明是否在大学附近成长与受教育年数的相关性,作者将整个样本按照受教育年数的预测值分成了四份 (按照四分位数的值进行划分),然后在这四份样本中按照是否在大学附近成长进行分组,并计算这四份样本的受教育年数观察值的平均值。计算结果如下图所示:
从上图的计算结果可以看到,在每一个受教育年数预测值的四分位数上,在大学附近成长的样本的受教育年数都大于未在大学附近成长的样本,可以推测是否在大学附近成长与受教育年数相关。具体来看,
在三个较高的受教育年数预测值分位数上,在是否与大学邻近的样本之间,受教育年数的差别较小,相差 0.2-0.4 年。 在最低的受教育年数预测值分位数上,是否与大学邻近的受教育年数的差值为 1.1 年。 在大学附近成长对那些不倾向于继续上学的男性 (例如单亲家庭、父母受教育年数少、在南部农村地区) 的影响是较大的。
1.3.2 使用 2SLS 法的估计结果
使用 是否在大学附近成长 作为受教育年数的工具变量,并用 2SLS 法建立回归方程。下表中呈现了一系列约减形式的受教育年数和工资方程,以及工资的结构方程。其中,
第 1 列与第 2 列显示了受教育年数对是否与大学邻近的回归结果。 第 3 列与第 4 列显示了去掉受教育年数之后的工资的约减方程的回归结果。 第 5 列与第 6 列报告了使用 IV 的教育回报率的估计值 (可以用是否在大学附近成长在工资约减方程中的系数值除以在受教育年数方程中的系数值计算)。 Panel A 部分将工作年数及其平方项视为外生变量,Panel B 中将工作年数及其平方项视为内生变量,认为若受教育年数有测量误差,则工作年数也有测量误差,并使用年龄及其平方项作为工作年数及其平方项的工具变量。
从上表的结果中可以看到,不论模型中是否包括家庭背景方面的变量,不论将工作年数及其平方项视为外生或内生变量,教育回报率的结果是十分相近的,估计值介于 0.12-0.14 之间。这些值比 OLS 估计结果高出 50-60%,与已有的一些文献结果是类似的。但是 IV 估计的标准误较大,我们不能拒绝这个假设:IV 与 OLS 估计值的差别是由抽样误差带来的。
在大学附近成长对受教育年数具有正效应 (增加 0.32-0.38 年),对工资也具有正效应 (增加 4.2%-4.8%),是因为模型 (3) 和 (4) 中没有受教育年数变量。
1.3.3 IV 的外生性证明
从上图中可以看出,是否在大学附近成长对于家庭受教育背景较差的学生的教育回报率的影响是较大的。鉴于此,作者选取 在大学附近成长与家庭受教育背景较差的交乘项 作为受教育年数的工具变量,并检验是否在大学附近成长与工资的相关性,建立受教育年数与工资的约减方程、工资的结构方程进行 OLS 与 IV 估计。其中,家庭受教育背景较差变量的定义是父亲和母亲都没有高中毕业。回归结果如下表所示:
在以上回归结果中,
第 1 列与第 2 列结果显示了在大学附近成长对受教育年数与工资的影响效果,在家庭受教育背景较差的男性的群体中更大。 第 3 列报告了使用在大学附近成长与家庭受教育背景较差的交乘项作为工具变量的估计结果。与表 3 中的结果相比要小一些,并且标准误要略大一些。结果还显示了在大学附近成长对工资的影响很小,并且不显著,表明是否在大学附近成长这个工具变量的外生性。 在第 4 列回归模型中,作者使用 8 类表示家庭受教育背景的哑变量与是否在大学附近成长的交乘项作为工具变量进行 IV 估计,结果显示标准误有所减小,系数值略微增加。
上述结果显示,不论如何将家庭受教育背景进行分类,不论使用交乘项作为工具变量还是仅使用是否在大学附近成长作为工具变量,估计结果是相近的。并且,是否在大学附近成长对工资的影响效果是很小的并且不显著,证明了工具变量的外生性。
1.4 Card (1995) 总结
最后,我们对 Card (2015) 这篇文献在工具变量方面的基本思想进行总结:
IV 的选择:作者使用是否在大学附近成长作为受教育年数的工具变量。 IV的相关性:在大学附近成长的男性的受教育年数与工资显著高于未在大学附近成长的男性。并且,对于那些家庭教育背景较差的男性来说,在大学附近成长对受教育年数与工资的正效应更大。 IV的外生性:作者利用在大学附近成长对那些家庭教育背景较差的男性的正效应更大的特征,使用是否在大学附近成长与家庭教育背景较差的交乘项作为工具变量,这样工资的结构方程中可以直接包括是否在大学附近成长这个变量,以检验它的显著性。使用交乘项作为工具变量的结果与仅使用是否在大学附近成长作为工具变量的估计结果是相近的,并且,是否在大学附近成长对工资的影响很小且不显著。 使用工具变量的 2SLS 与 OLS 结果比较:使用是否在大学附近成长作为 IV、使用 2SLS 法对受教育年数的边际影响的估计结果介于 10-14%,与 OLS 估计结果相比 (7.3%),OLS 估计结果是下偏的。当对模型中变量的设定进行稍微改变时,IV 估计结果是稳健的。这些结果与已有的一些文献的结论是相似的,但却与 OLS会高估受教育年数的边际效应的普遍认知是相反的。
2. 基于 Adams (2021) 讨论教育回报的 IV
2.1 工具变量法估计教育回报
2.1.1 工具变量估计法的特性
如下图所示,我们在运用 IV 估计法时,工具变量 有三个性质:
工具变量 对政策变量 有直接影响 。 工具变量 独立于不可观测因素 U 。 工具变量 对 的影响独立于不可观测因素对 的影响 。
下图中, 对 的影响为 , 对 的影响为 ,通过将二者相除,我们可以得到 对 的影响为 。在估计方程中可以写为下式:
即
首先,我们用 OLS 做 对 的无偏估计可得到 ;然后再做 对 的无偏估计得到 ,将二者相除即可得到 对 的无偏估计 。
2.1.2 用工具变量法估计教育回报
将教育回报这一案例应用到上图,即可得到如下关系图:
Card (1995) 选用是否在大学附近生长作为教育的工具变量,但是青年男性的不可观测因素可能会同时影响他们的教育年数以及收入。例如,那些来自抚育家庭的青年男性可能更倾向于上大学,因为家庭可以负担他们上大学的成本。而这些人获得高收入可能是由于家庭关系而非教育本身。这种混合影响导致我们得到的 是有偏的。
2.2 工具变量的有效性检验
基于以上分析,Adams (2021) 提出两种检验工具变量有效性的方法:第一,将青年男性分为“住在大学附近”和“不住在大学附近”两组,分别对教育、经验等进行回归判断 IV 的有效性。第二,通过对两个工具变量回归结果的比较判断 IV 的有效性。
2.2.1 分组回归
我们将青年男性分为“住在大学附近”和“不住在大学附近”两组,分别进行回归,结果如下表所示。我们可以看出在大学附近成长的青年男性往往具有更多的教育和更少的工作经验,但是他们更可能是非黑人、更可能住在城市,而非黑人和住在市区都与收入存在正相关关系。这说明“距大学的距离”并不是一个好的工具变量。
2.2.2 过度识别检验
假设我们有两个工具变量:是否在大学附近成长 () 和 14 岁时父母是否陪伴 ( )。作者认为在 4 年制大学附近成长更有可能上大学,14 岁时父母在身边陪伴更有可能上大学。如果 和 都是有效工具变量,则两个 IV 得到的估计结果应该一致,即:
作者利用矩阵代数方法,在两种不同工具变量下估计教育回报率,结果显示在两种 IV 下估计结果差值均值为 0.68,且在 90% 的置信区间包括 0。因此我们不能拒绝原假设,即不能拒绝“距离 4 年制大学的距离”和“14 岁时父母陪伴”均是有效工具变量的假设。
但是这也不能够说明二者均是有效的工具变量,因为可能存在其他情况证明其中一个或两个工具变量是无效的。
2.3 LATE 估计教育回报
2.3.1 LATE 基本思想
在上一小节我们已经提到,工具变量法要求工具变量对
就教育回报这一问题,我们假设每个人从政策中获得相同的效应是不合理的,即这种因果识别可能存在异质性。此时工具变量法失效,但我们可以采用局部平均处理效应 (LATE)。如果我们放弃“工具变量对
假设样本中有四类人群:
Compliers:在大学附近成长则上大学,不在大学附近成长则不上大学; Always Takers:无论是否在大学附近成长,均上大学; Never Takers:无论是否在大学附近成长,均不上大学; Defiers:在大学附近成长则不上大学,不在大学附近成长则上大学 (由于单调性假设,我们认为该类型人群不存在)。
居住地距离大学的距离可以视为上大学的成本,当成本发生变化,需求也会变化。在以上四类人群中只有 Compliers 会因上学成本变化而改变需求。
根据总期望法则可以得出每个类型 (C、A、N、D) 的意向分析效应:
基于工具变量和类型我们可以计算出平均产出:
由于
基于上式可以得到:
我们可以看出 Always Taker 和 Never Taker 的意向分析回归结果为 0,由于存在单调性假设,故不存在 Defiers。这就将意向分析简化为只包括 Compliers 这一种类型:
将上式转化为 LATE 估计量:
2.3.2 LATE 在教育回报问题中的应用
作者分别将“是否在大学附近成长”和“14 岁时父母是否陪伴”作为工具变量,分别运用 LATE 估计教育对收入的影响。当“是否在大学附近成长”做 IV 时,教育每增加一年,收入会提升 0.32%;当“14 岁时父母是否陪伴” 做 IV 时,教育每增加一年,收入会提升 0.18%。
LATE 的估计结果说明教育回报是具有异质性的。那些因为距离大学近而上大学的人具有更高的教育回报率,而那些因为父母陪伴而上大学的人具有更低的教育回报率。
2.4 Adams (2021) 总结
Adams (2021) 对用 OLS、IV、LATE 三种方法研究教育回报问题做如下总结:
由于有许多原因会带来受教育年数与随机误差项相关,OLS 结果可能会导致教育回报率的有偏估计。 Card (1995) 提出将“是否在大学附近成长”作为教育的工具变量会得到教育回报的无偏估计。在大学附近成长会降低人们上大学的成本,进而使得人们更倾向于上大学。IV 估计法得到的结果是 OLS 的 2 倍。 IV 估计法需要假定工具变量 对 的影响能够独立于不可观测因素 ,而 LATE 允许放松这一假定,得到教育对收入的异质性影响。
3. 基于 Kédagni (2021) 讨论教育回报的 IV
作者认为当利用工具变量处理内生性问题时,如果工具变量无效,可能会导致估计结果偏误。当工具变量与一阶段不可观察的随机干扰项相关时,将会导致工具变量无效。作者提出如果选择一个工具变量的代理变量 (proxy),不仅可以部分识别局部平均处理效应,而且可以识别 complier 的潜在收入分布。作者就 LATE 提出 3 个假设:
Selection of Types (ST):假设存在工具变量 以及代理变量 ,则给定样本类型 T,向量 独立于潜在收入 。样本类型 T 分别为 Always takers、Compliers、Never takers、Defiers。Monotonicity (MON):作者假设距离大学越近,上学成本越低,越容易选择上大学。故不存在距离大学越远越容易上大学的 Defiers。 Relevance (REL):对于 ,存在 和 满足 。
3.1 将上大学距离作为工具变量
数据来源:本文使用的数据来源于美国 1966 至 1981 年间对青年男性的纵向调查数据 (NLSYM)。被解释变量
作者认为该数据满足 LATE 的 REL 相关性假设以及 MON 单调性假设,但是未必满足 ST 假设。为证明 LATE 的 REL 相关性假设,作者就“是否上大学”对“是否在 4 年制大学附近成长”以及“14 岁时父母是否在身边陪伴”做线性回归和 Logit 回归,回归结果如下表所示。从表中可以看出在两种方法下,“在 4 年制大学附近成长”以及“14 岁时父母在身边陪伴”都与上大学显著正相关,相关性成立。
同时,上大学的需求不会随着上大学成本增加而增加,这说明 MON 单调性成立。然而,ST 假设要求
3.2 LATE 实证边界范围
基于以上分析,我们得出“距大学的距离”不是一个有效的工具变量。作者将“14 岁时父母是否在身边陪伴”作为“是否在 4 年制大学附近成长”的代理变量,并进行 2SLS 回归分析,回归结果如下表所示:
从表中我们可以看出两阶段最小二乘估计量为 2.2737,LATE 的置信集为
3.3 将上大学距离作为代理变量
以上分析将“是否在大学附近成长”作为教育的工具变量,该工具变量是可观测的。在该部分作者将“上大学的成本”作为教育的工具变量
从上表我们可以看出,对于那些因为上大学成本低而上大学的人来说,大学学位可以使平均工资增加 15%-30%,这一结果与可以为旨在减少大学教育成本的政策提供支持。
值得注意的是,当我们分别将“距大学距离”以及“上大学成本”作为工具变量时,计算的 LATE 边界是不同的。将“距大学的距离”作为工具变量时,LATE 上确界和下确界分别为
3.4 Kédagni (2021) 总结
作者在本文提出一种新的识别策略——当工具变量与随机干扰项相关,进而与被解释变量
作者采用 NLSYM 样本数据,将距离大学距离作为上大学成本的代理变量,估计 Compliers 子样本大学教育对于收入的影响。研究发现,大学学位对于收入具有显著正向影响,对于那些仅仅因为上大学成本低而获得大学学位的人来说,大学学位会使他们的小时收入增加 15%-30%。
4. 总结
在解决内生性问题上,工具变量法是一个非常受欢迎的手段。但是正如推文题目所言——找个 IV 不易呀!如果在模型中*引入一个新的工具变量
相对于相关性来说,工具变量的外生性很难满足。如果外生性难以满足,我们便认为该工具变量为“无效工具变量”。那么,当工具变量无效时,IV 估计法就不能用了吗?显然不是,此时我们无法衡量平均处理效应,但在某些情况下,我们可以将估计量解释为样本子集 (局部) 平均处理效应 (LATE)。LATE 允许放松“
另外,如果工具变量是一个不可观测变量怎么办?比如上大学成本包括经济成本、机会成本、心理成本等,将上大学的成本作为教育的工具变量,上大学的成本不能被准确观测到。Kédagni (2021) 提出只要能够找到该工具变量的代理变量
5. 参考文献
Card D. Using geographic variation in college proximity to estimate the return to schooling[J]. 1993. -PDF- Kédagni D. Identifying treatment effects in the presence of confounded types[J]. Journal of Econometrics, 2021. -PDF- Adams C P. Learning Microeconometrics with R[M]. Chapman and Hall/CRC, 2020. -PDF-
6. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:论文写作 Stata论文复现:份额移动法工具变量(Shift-Share IV) 专题:Stata命令 Stata新命令-pdslasso:众多控制变量和工具变量如何挑选? 专题:IV-GMM 工具变量:顶刊中的Shock-IV整理 工具变量:Shock-IV中预处理平衡的必要性 工具变量法:IV估计的信与不信 Stata:工具变量的秩检验-bootrantest Stata:无需工具变量的IV估计-kinkyreg- Stata:当工具变量小于内生变量时,该如何估计?-mmeiv Lasso一下:再多的控制变量和工具变量我也不怕-T217 IV在哪里?奇思妙想的工具变量 twostepweakiv:弱工具变量有多弱? 多个(弱)工具变量如何应对-IV-mivreg? IV:工具变量不满足外生性怎么办? IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计 IV:可以用内生变量的滞后项做工具变量吗? Stata: 工具变量法 (IV) 也不难呀! IV-估计:工具变量不外生时也可以用! 专题:内生性-因果推断 Stata:内生变量与工具变量非线性关系处理-discretize 工具变量-IV:排他性约束及经典文献解读
课程推荐:因果推断实用计量方法
主讲老师:邱嘉平教授
🍓 课程主页:https://gitee.com/lianxh/YGqjp
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。