查看原文
其他

老姚专栏丨正态假定检验真的不重要吗?

姚耀军 数据Seminar 2022-12-31



推荐语:读了耀军兄的这篇推文,我立刻联想到医学检查的例子。包括本文“主角”正态假定检验在内的三个计量经济检验,不就与医学检查里的检测指标一样吗?例如,如果检测发现某人的血压持续偏高,“蹩脚医生”可能会立刻就开出降压药了事,就像文中提到一般做法是直接用稳健标准误来应对违背同方差或者无序列相关假设的情况那样。而按照现代医学正规程序,发现血压高应该要立刻检查是否为继发性高血压,以便将病根去除(一位亲属十多年前在邵逸夫医院就遇到类似情景,当时还一度引起家属误解,诚如本推文开始举的审稿小例子那样)。本文指出,正态假定并非可有可无,符合正态假定的估计结果不仅具有更好的性质,按照现代计量经济学观点,违反正态假定更是模型存在重大问题(误设)的警报。遇到类似问题时,年轻的研究者必须仔细检查检讨自己的模型设定,因为正确的模型设定才是这项研究产生稳健结论、能够经受考验的关键!

——杨奇明




——————

多年前,笔者的一位朋友收到一份外审意见。认真的匿名审稿人指出了一个比较细节的问题——根据实证结果的报告,残差正态性检验没有通过。朋友对这个细节性问题很不以为然,认为审稿意见有点吹毛求疵了。为什么朋友有此看法呢?原因在于,残差正态性检验旨在考察误差项是否服从正态分布,而这一正态假定被不少人认为是不重要的。本文认为,这种普遍存在的观点具有一定的误导性,因为正态假定检验未通过或许是模型设定错误的信号。


一、重新认识计量经济检验




在初级计量经济学中,异方差检验与序列相关检验是两大重要的计量经济检验。不过通常观点是,仅违背同方差或者无序列相关假定只是降低了OLS估计量的有效性,并不影响其一致性与无偏性,故在利用了稳健标准误的大样本回归中,异方差与序列相关问题并不重要。但计量经济学现代观点认为,事情或许没有这么简单。原因在于,异方差与序列相关问题往往派生于模型设定错误,而模型设定错误很可能会彻底摧毁OLS估计量所具有的良好性质。这意味着,通过计量经济检验所发现的异方差或者序列相关检验问题,或许是模型设定错误的信号,故其重要性不应被低估。检验模型误差项是否满足正态假定,其实亦属于计量经济检验的内容。然而,相对于异方差检验与序列相关检验,正态假定检验更是被严重忽视。原因显然在于,对于线性回归模型,在保证OLS估计量具有BLUE性质的高斯马尔科夫假定中,并不包括正态假定。具体来说,只要线性假定、非完全共线假定、严格外生性假定与球形误差假定这四大高斯马尔科夫假定成立,就可确保OLS估计量具有BLUE性质,而并不需要正态假定成立。但正如异方差与序列相关问题或许是模型设定错误的信号,通过计量经济检验发现正态假定被违背,也具有类似的功能。这表明,正态假定检验并非如不少人所认为的那样,是一个不重要的计量经济检验。接下来,我们就从初级计量经济学引入正态假定之起源开始,对此假定的作用与性质进行一个简略的梳理。






二、何时开始引入正态假定?









三、正态假定强化OLS估计量的优良性质





在大样本回归中,即使没有正态假定,按照中心极限定理,也是渐进服从正态分布的。此时,鉴于是对的一致估计,可知渐进服从标准正态分布。这意味着,只有在对小样本回归结果进行假设检验时,才有必要引入正态假定。这也是为何对于大样本回归,人们似乎觉得正态假定无关紧要的一大原因。

然而,在高斯马尔科夫假定成立基础上,如果正态假定亦成立(高斯马尔科夫假定与正态假定统称为经典线性模型假定),那么其将强化OLS估计量的优良性质。具体来说,包括线性无偏估计量在内的所有无偏估计量中,OLS估计量均是最有效的。之所以存在这个结论,是因为关于参数的极大似然估计量与OLS估计量完全等价,而极大似然估计确定了一个无偏参数估计量方差的下限(Cramer-Rao下界)。







四、正态假定的一般性

若只是为了小样本下的假设检验而施加正态假定,则看起来限制了模型的适用范围。但正态假定其实是一个一般化假定。也正是源于此,我们才能从更深层面理解,为什么一旦通过残差检验拒绝了此假定,或许就为模型设定错误提供了一个重要的信号。

那么,为什么正态假定属于一般化假定呢?答案其实很简单:当模型设定完备时,误差项是由很多非系统性因素所组成,而根据中心极限定理,我们有足够理由认为正态假定应该成立。我们还可以从比较技术性的角度来理解正态假定的一般性。

再例如,在进行极大似然估计时,即使误差项总体服从一个未知的分布,但若我们ad hoc地设定其服从正态分布,竟然也会获得一致估计结果——这就是所谓的拟极大似然估计。值得指出的是,在一元线性回归模型框架下,拟极大似然估计的一致性很容易被印证:一方面,只要正态假定成立,关于参数的极大似然估计量就与OLS估计量完全等价;另一方面,OLS估计量的一致性又与正态假定是否成立没有关系。因此,拟极大似然估计具有一致性。


五、结语


——————

本文指出,正态假定属于一般化假定,其底层逻辑是强大的中心极限定理。如果计量经济检验表明正态假定被违背,那么这可能是模型设定错误的一个重要信号。最后以一个十分有助于我们正确看待正态假定检验结果的统计学细节作为结语:我们应注意到,虽然正态假定检验的原假设是误差项服从正态分布,但整个假设检验是建立在高斯马尔科夫假定成立这一基础之上的。这意味着,如果检验没有通过,那么原因既可能是误差项服从正态分布作为原假设不成立,也可能是某些高斯马尔科夫假定不成立,而模型设定错误很可能正是导致高斯马尔科夫假定不成立之根源。总之,我们必须谨慎对待正态假定检验结果。若检验未通过,则有必要仔细反思模型的设定。


END


企研学术顾问 · 耀军



姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授,博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,企研数据创始学术顾问。曾获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。研究领域:金融发展理论与实证、应用计量经济学。

邮箱:Email:yaoyaojun@163.com

代表论文:

[1]姚耀军,施丹燕.互联网金融区域差异化发展的逻辑与检验——路径依赖与政府干预视角[J].金融研究,2017(05):127-142.

[2]姚耀军.制度质量对外资银行进入的影响——基于腐败控制维度的研究[J].金融研究,2016(03):124-139.

[3]姚耀军,董钢锋.中小企业融资约束缓解:金融发展水平重要抑或金融结构重要?-来自中小企业板上市公司的经验证据[J].金融研究,2015(04):148-161.


点击阅读原文,进入新型农业经营主体大数据库




点击搜索你感兴趣的内容吧

往期推荐

统计计量丨学计量经济学,你应该知道的六种概率分布

免费数据资源丨新基建系列:新一代信息技术专题数据库

免费数据资源丨新基建系列(二):5G产业专题数据库(文末有福利)

统计计量丨陈强老师来了!对!他来了!(上)

专题报告丨走进钱塘新区之经济篇

老姚专栏丨辛普森悖论、异质性与DID模型

机器学习丨决策树VS随机森林——应该使用哪种算法?(附代码&链接)







数据Seminar




这里是大数据、分析技术与学术研究的三叉路口




作者:姚耀军

排版编辑:青酱




    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存