查看原文
其他

大数据应用 | 经济学中,我们该使用什么样的夜间灯光数据?

企研数据 数据Seminar 2024-03-13



上一期,【数据seminar】推送了一篇Gibson等人讨论夜间灯光数据的应用和局限性的文章(点击查看>>>大数据应用 | 夜间灯光数据在经济学中的应用与挑战)。本次将推送同样由Gibson作为第一作者的另一篇研究文章,标题为Which night lights data should we use in economics, and where?,由John Gibson、Susan Olivia、Geu Boe-Gibson和Chao Li共同撰写。文章探讨了在经济学研究中应使用哪种夜间灯光数据以及在哪些地区使用它们。是上一篇文章非常好的补充。



系列回顾

大数据应用 | 前沿:卫星数据在实证研究中的应用,用其开展因果推断的好处!

2024-01-26

大数据应用 | 人与像素:连接遥感与社会科学

2024-02-06

大数据应用 | 夜间灯光数据在经济学中的应用与挑战

2024-02-12


文章概要

简介:本文通过使用夜间灯光数据预测GDP,比较了DMSP和VIIRS两种夜间灯光数据源,发现DMSP数据和VIIRS数据之间的预测性能差距较大,在空间层次较低的地区(如县)和低密度地区尤为明显。DMSP数据尤其低估了城市部门和高密度地区的空间不平等。而且对DMSP数据进行校准以纠正顶部编码的作用有限,仍然会低估空间不平等,并错过大城市的关键经济活动特征。

关键词:密度、DMSP、不平等、夜间灯光、VIIRS、印度尼西亚

主要内容

本文首先介绍了DMSP和VIIRS夜间灯光数据在经济学中的应用背景,进一步提出了DMSP数据的局限性,包括模糊、顶部编码(top-coding)和缺乏校准。

之后本文使用展示了DMSP和VIIRS数据在预测印度尼西亚次国家级GDP方面的表现,分析了夜间灯光数据在预测城市和农村地区GDP时的差异,并讨论了DMSP数据在估计空间不平等时的局限性。在研究中,作者们比较了DMSP(国防气象卫星计划)和VIIRS(可见红外成像辐射计套件)两种夜间灯光数据源在预测印度尼西亚、中国和南非的次国家级地区GDP时的表现。他们发现,DMSP数据在城市之外的地区是GDP的不良代理指标,特别是在低人口密度的农村地区。DMSP数据与非城市地区的实际GDP之间存在负相关关系,验证了亮度数据不提供低输出密度区域经济活动的可靠估计的结论。此外,DMSP数据在城市灯光-GDP关系中产生的噪音是VIIRS数据的两倍,这意味着DMSP数据在捕捉城市经济活动方面的表现不如VIIRS数据。在印度尼西亚的城市部门,无论使用哪种类型的夜间灯光数据,灯光-GDP关系都是正的,但如果使用DMSP数据,这种关系会更加嘈杂。

他们指出,DMSP数据由于顶部编码的问题,会低估空间不平等,尤其是在城市部门和高密度地区。顶部编码是指当DMSP传感器检测到的光强度超过其最大记录值时,所有这些光强度都被记录为相同的最大值,这导致无法区分实际光强度的差异。即使应用了校准方法来纠正顶部编码,DMSP数据仍然严重低估了空间不平等,并且错过了大城市中关键经济设施产生的亮度异质性,例如雅加达的港口。相比之下,VIIRS数据能够更好地捕捉到城市内部的亮度变化,提供了更准确的空间不平等估计。

图1 不同灯光数据下雅加达的夜间灯光亮度情况 (图片来源于原文)

作者又使用中国和南非的数据来验证印度尼西亚的结果,分析了DMSP和VIIRS数据在中国和南非的预测性能,发现DMSP数据在这些国家也表现出类似的局限性,特别是在低密度地区和较小的行政单位中,DMSP数据预测GDP的能力较弱。这些发现表明,在使用夜间灯光数据来研究经济活动的空间模式时,需要谨慎对待DMSP数据,特别是在研究城市发展的空间模式时。

本文因此得出结论,认为VIIRS数据是DMSP数据的更好替代,强调了DMSP数据在低密度农村地区的局限性,建议经济学家寻找其他方法来研究这些地区并进一步提出了对夜间灯光数据在经济学研究中应用的建议。他们建议经济学家要在以下几点特别注意:

1. 慎重选择数据源:作者建议经济学家在研究中应优先考虑使用VIIRS数据,因为与DMSP数据相比,VIIRS数据在预测GDP和估计空间不平等方面表现更好。VIIRS数据具有更高的空间精度和时间可比性,这使得它在捕捉城市和高密度地区的经济活动时更为准确。

2. 考虑数据局限性:尽管VIIRS数据优于DMSP数据,但作者们也指出,夜间灯光数据在低密度农村地区的应用仍然有限。因此,对于这些地区的研究,经济学家可能需要寻找其他遥感数据源,如白天的卫星图像,或者继续依赖传统的调查方法来衡量生活水平。

3. 注意数据在时间序列上的问题:作者们强调,夜间灯光数据在预测经济活动的时间序列变化方面的表现不佳,即使它们在横截面分析中可能是良好的预测指标。因此,在使用夜间灯光数据时,应主要关注其在横截面分析中的应用。

4. 关注数据的可更新和维护性:鉴于DMSP数据的局限性和VIIRS数据的优越性,作者们建议经济学家关注VIIRS数据的更新和维护,以便更好地利用这些数据进行研究。VIIRS数据的时间序列将随着时间的推移而增长,这为经济学研究提供了一个持续可用的数据源。

5. 进行跨学科合作:作者们鼓励经济学家与其他学科的研究者合作,以更好地理解和利用夜间灯光数据。这种跨学科的合作可以帮助经济学家更好地理解夜间灯光数据的来源和局限性,并在研究中更有效地使用这些数据。

小结

总的来说,作者们建议经济学家在研究中应更多地利用VIIRS数据,并认识到夜间灯光数据在预测经济活动方面的局限性,特别是在低密度农村地区。同时,他们强调了持续关注数据更新和跨学科合作的重要性。


如需阅读原文,后台回复关键词“20240216”即可获取全文PDF。




星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧


往期推荐


大数据应用 | 夜间灯光数据在经济学中的应用与挑战

大数据应用 | 人与像素:连接遥感与社会科学

软件应用 | 30个Python函数,解决99%的数据处理任务!

大数据应用 | 前沿:卫星数据在实证研究中的应用,用其开展因果推断的好处!

大数据应用 | 谭海华:探究数据质量在人工智能大模型中的重要性





数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存