查看原文
其他

基本无害 | 使回归有意义——回归的细节(3)

基本无害的 数据Seminar 2022-12-31

基本无害的计量经济学

——实证研究者指南

(重译本)

李井奎 译


第三章 使回归有意义第四节 回归的细节



正文共1934个字,预计阅读时间5分钟。感谢阅读!

原文:3.4.3

温馨提示:左右滑动可查看完整公式!



3.4.1 加权回归

3.4.2 有限因变量与边际效应

3.4.3 为什么回归被称为回归,回归之于均值意味着什么?

“回归(regression)”一词源于弗朗西斯·高尔顿(1886)对身高的研究。在该书第26页,高尔顿在拜访他的裁缝时获得启发,他处理的是关于父母和孩子身高的大致呈正态分布的数据样本。他指出,孩子身高的CEF取决于父母的身高,它是线性的,参数由二元回归的斜率和截距给出。由于身高是平稳的(其分布随时间变化不大),所以二元回归斜率也是相关系数,即这个值处于0到1之间。
高尔顿框架中的一元回归变量 是父母的平均身高,因变量 是成年子女的身高。回归斜率系数一如既往为 ,截距为 。但由于身高不会随着世代而变化, 的均值和方差是相同的。因此,
式中 为身高代际相关系数, 为人口平均身高。从这里我们得到了线性CEF:

因此,给定父母的身高,孩子的身高是父母身高和人口平均身高的加权平均值。因此,高个子父母的孩子一般不会像他们那么高。同样,对于矮个子父母来说他们的孩子也一般不会像他们那样矮。具体来说,身高6英尺3英寸的Pischke可以预期他的孩子们个子会比较高,尽管没有他那么高。不过,值得庆幸的是,身高5英尺6英寸的Angrist可以指望他的孩子比他高。高尔顿称这种特性为“遗传身长向平均水平的回归”。今天我们称之为均值回归。

高尔顿是查尔斯·达尔文的堂兄,以创立了优生学会而闻名,致力于培养更优秀的人种。事实上,他对回归的兴趣很大程度上来自于这种探索。由此我们得出结论,科学思想的价值不应以作者的政治立场来评判。
高尔顿似乎对我们本章主要关注的多元回归不太感兴趣。高尔顿著作中的回归是平稳随机变量分布的机械性特征;它们只是适用于父母身高对孩子身高的回归,但肯定不是因果关系。高尔顿自己也会这么说,因为他反对拉马克的观点(这种观点后来在斯大林统治下的俄罗斯得到了推广),即后天习得的特质可以遗传。
回归可以用于统计控制以令人满意地追求因果关系的想法,起源于乔治·乌德尼·尤尔(George Udny Yule)(1899)对贫困率决定因素的调查。尤尔是一名统计学家,也是卡尔·皮尔森(Karl Pearson)(卡尔·皮尔森是高尔顿的门人)的学生,他意识到高尔顿的回归系数可以通过求解勒让德和高斯很久以前推导出来的最小二乘法方程(the least squares normal equations)扩展到多个变量。尤尔(1899年)的论文似乎是第一篇包含多元回归估计值的文献。他的模型将一个地区贫困率的变化与当地《英国济贫法》的管理变化联系起来,同时控制了该地区的人口增长和年龄分布。他特别感兴趣的是:救济,即为穷人提供收入支持而不要求他们搬到救济院的做法,本身是否会导致更高的贫困率。这是一个定义明确的因果关系问题,至今仍在困扰着我们。[1]
最后,值得一提的是,史蒂文·斯蒂格勒(Steven Stigler, 1986)的书中对回归的历史进行了详细的描述。斯蒂格勒是芝加哥大学(University of Chicago)著名的统计学家,但不如他的父亲、经济学家、诺贝尔奖得主乔治•斯蒂格勒(George Stigler)出名。

注释

[1] 尤尔的第一篇关于济贫法的应用论文于1895年发表在《经济杂志》(Economic Journal)上,Pischke很自豪自己是该杂志的联合编辑。与此相适应的多元回归理论,出现在尤尔(1897)上。




本专栏主理人简介

企研数据学术顾问 · 李井奎


李井奎,1978年1月生,浙江工商大学经济学院教授、博士生导师,哈佛大学访问学者,以教书育人和传播学问为己任,曾获浙江省“高校优秀教师”称号。除学术论文写作之外,还著有《大侦探经济学:现代经济学的因果推断革命》等科普著作。




星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


基本无害 | 使回归有意义——回归的细节(2)

基本无害 | 使回归有意义——回归的细节(1)

企业数据库匹配系列(一)| 工企库与工商库匹配报告

数据治理 | 一文看懂GIT的基本原理!

数据治理 | 随心所欲切换文档版本!误删什么的再也不怕啦~

数据治理 | 还在手动保存副本?那你一定还不知道这个小工具!





数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 《基本无害的计量经济学——实证研究者指南(重译本)》

翻译 | 李井奎

校对 | 陈泽 王锐

排版 | 彭绮荣


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存