机器学习 | 陶旭辉、郭峰——异质性政策效应评估与机器学习方法：研究进展与未来方向

数据Seminar 2024-03-13

概要

💡 本次推荐的文章《异质性政策效应评估与机器学习方法：研究进展与未来方向》，发表在《管理世界》2023年第11期上，作者是陶旭辉和郭峰。（👉点击查看文章详情）

这篇论文探讨了在大数据时代背景下，如何利用机器学习方法来评估公共政策的异质性效应。文章首先强调了准确评估公共政策的重要性，这对于制定科学政策和提升国家治理体系现代化至关重要。随后，论文指出传统的异质性政策效应评估方法在大数据时代面临挑战，如难以处理高维数据、难以全面分析多重异质性问题等。

文章的核心部分介绍了机器学习在异质性政策效应评估中的应用，包括如何更好地筛选和切分异质性变量、评估多重异质性政策效应以及估计个体政策效应。这些应用利用了机器学习的数据驱动特性和预测能力，为政策评估提供了新的视角和工具。

然而，论文也指出了机器学习在异质性政策效应评估中的局限性，如算法的可解释性、过程的可检验性以及结论的稳健性。为了克服这些局限性，文章提出了未来研究的方向，包括发展机器学习方法、结合传统分析范式、规范数据采集和处理流程，以及推动数据和代码的公开透明。

总的来说，这篇论文为公共政策研究者提供了一个框架，以理解和利用机器学习技术来更有效地评估政策的异质性效应，从而为政策制定提供更精确的指导。

主要内容

这篇文章主要分为以下几个部分，每一部分的主要内容如下：

1. 引言：

强调了公共政策评估的重要性，特别是在大数据时代背景下，异质性政策效应评估的必要性。

2. 异质性政策效应评估的价值和传统方法介绍：

“
关于异质性政策效应评估的研究很多，譬如低技能者相比高技能者在求职培训中可能获益更多（克瑙斯等，2022）；小户型住房相比大户型住房在地铁开通后可能更具有升值空间（承佑等，2018）；规模大的 P2P 网络借贷平台交易量更易受到新闻文本情绪影响（沈艳、王靖一，2021）。异质性政策效应评估越来越得到各界广泛的关注，从废除科举的社会效应（郝等，2022）到失业保险的经济后果（柴提，2008），从农村电子商务推广（科图雷等，2021）到城市经济学的户口价值评估（陈等，2019），从精准医疗（田等，2014）到定制营销建议（阿斯卡尔萨，2018），政策制定者都需要了解政策在不同群体中产生的异质性政策效应。总结而言，异质性政策效应评估具有以下几方面的价值。

首先，关于异质性政策效应评估的重要性，文章提到了几点。第一，异质性政策效应评估可以帮助我们验证政策效应的解释机制。例如，通过评估不同群体的政策效应，我们可以了解政策效果的作用机理，验证理论预测，或排除一些竞争性解释。第二，异质性政策效应评估可以提供差别化的政策处理依据。例如，通过了解政策在不同群体中的效果，我们可以为政策制定者提供更细致的信息，帮助他们制定更有针对性的政策，从而实现资源的最优配置。

接下来，文章介绍了两种传统的异质性政策效应评估方法：交互项分析和分组回归分析。交互项分析是直接在模型中引入政策变量和异质性变量的交互项，以考察政策效应的异质性。分组回归分析则是根据异质性变量的取值将样本分为不同的组，然后对每个组进行回归分析，以考察组间政策效应的差异。

然而，这两种方法都存在一定的局限性。首先，它们无法有效地处理多重异质性问题，即当政策效应受多个异质性变量影响时，传统方法难以全面考虑这些变量之间的交互作用。其次，传统方法在处理高维数据时效果不佳，容易受到“维度诅咒”的影响。最后，传统方法难以有效地评估个体政策效应，即针对每个个体的政策效果。

总的来说，传统方法在异质性政策效应评估中发挥了重要作用，但随着大数据时代的到来，这些方法在处理高维数据、多重异质性等问题时显得力不从心，因此需要引入新的方法，如机器学习方法，来改进异质性政策效应评估。

3. 大数据背景下传统异质性政策效应评估方法存在的问题：

首先，大数据时代的到来为政策效应评估提供了全新的素材。大数据包含了丰富的信息，如文本数据、图像数据、音频数据等，这些数据提供了传统数据无法比拟的细节和信息。然而，大数据的高维、非结构化等特点也给政策效应评估带来了新的挑战。传统的统计方法主要是为处理低维、结构化的数据设计的，在处理高维、非结构化的大数据时，将面临“维度诅咒”的问题，即模型估计的准确性和稳定性将大幅下降。

其次，大数据时代对异质性政策效应评估提出了更高的要求。在传统研究中，我们关注的是政策的平均效应，但在大数据时代，我们不仅要关注平均效应，还要关注针对不同群体、甚至是个体层面的政策效应。这就需要我们的评估方法能够处理高维数据，进行精细化的评估。然而，传统的交互项分析和分组回归等方法难以满足这一需求。

最后，大数据时代对政策效应评估的范式也提出了新的要求。在大数据背景下，研究者需要更多地依赖数据驱动的方法，而不仅仅是理论驱动。传统的异质性政策效应评估方法主要以理论为导向，难以应对大数据带来的挑战。

总的来说，大数据时代对传统异质性政策效应评估方法提出了新的要求，这些方法在处理高维数据、进行精细化评估等方面存在局限性。因此，需要引入新的方法，如机器学习方法，以应对大数据时代的挑战。

4. 机器学习在异质性政策效应评估中的优势与应用：

首先，关于机器学习在异质性政策效应评估中的优势，文章提到了几点。第一，机器学习是一种数据驱动的方法，它不需要预先设定的模型，而是通过从数据中学习来建立模型。这使得机器学习在处理高维数据、非线性关系等问题时具有优势。第二，机器学习具有预测能力，可以用于评估个体政策效应。这是传统方法难以做到的。

接下来，文章详细讨论了机器学习在异质性政策效应评估中的应用。第一，机器学习可以更好地筛选和切分异质性变量。例如，Lasso回归可以用于筛选重要的异质性变量，树模型可以用于确定变量的最佳切分点。第二，机器学习可以更好地评估多重异质性政策效应。例如，树模型可以处理多个异质性变量之间的交互作用，评估政策效应的多重异质性。第三，机器学习可以更好地评估个体政策效应。例如，因果森林和深度学习可以用于估计个体层面的政策效应。

总的来说，机器学习在异质性政策效应评估中具有明显的优势，它可以处理高维数据，评估多重异质性，预测个体政策效应，这些都是传统方法难以做到的。因此，机器学习为异质性政策效应评估提供了新的可能。

5. 机器学习在异质性政策效应评估中的局限以及未来方向：

首先，文章提到了机器学习在异质性政策效应评估中存在的局限。第一，机器学习算法的可接受性问题。机器学习算法的运行过程往往缺乏可解释性，这可能导致其结论难以被接受。第二，机器学习过程的可检验性问题。机器学习的过程往往依赖于数据驱动，这可能导致其结论难以被检验。第三，机器学习结论的稳健性问题。机器学习的方法往往缺乏统计特性，这可能导致其结论的稳健性较差。

接下来，文章提出了机器学习在异质性政策效应评估中的未来方向。第一，引入和发展机器学习方法，同时重视异质性政策效应评估的政策价值，并提高机器学习的可接受性。第二，结合传统分析范式，拓展机器学习在异质性政策效应评估中的新模式。第三，规范研究数据的采集和处理，推动数据和代码的公开透明。

总的来说，虽然机器学习在异质性政策效应评估中具有优势，但也存在一定的局限。未来的研究需要进一步发展和完善机器学习的方法，同时也要注意结合传统的方法，以实现更好的政策效应评估。

6. 结论：

主要对全文进行了总结，并强调了大数据时代下，机器学习方法可以拓展异质性政策效应评估的适用边界，但也带来了新的挑战，需要传统方法和机器学习形成互补关系。

首先，文章提到大数据时代的到来为政策效应评估提供了全新的素材，但同时也带来了新的挑战。传统的统计方法在处理高维、非结构化的大数据时，将面临“维度诅咒”的问题。而机器学习方法，如决策树、支持向量机等，可以有效地处理这些问题，拓展了异质性政策效应评估的适用边界。

其次，文章强调了虽然机器学习方法在处理大数据方面具有优势，但也带来了新的挑战。例如，机器学习算法的可接受性问题、过程的可检验性问题和结论的稳健性问题。因此，我们需要在发展机器学习的同时，也要关注这些问题，提高机器学习的可接受性、过程的可检验性和结论的稳健性。

最后，文章提出在大数据时代，我们需要将传统的统计方法与机器学习方法结合起来，形成互补关系。传统的统计方法具有理论基础，可以提供因果关系的解释，而机器学习方法具有处理大数据的能力，可以提供精细化的评估。只有将两者结合起来，才能更好地进行政策效应评估。

星标⭐我们不迷路！想要文章及时到，文末“在看”少不了！

点击搜索你感兴趣的内容吧

往期推荐

Python 教学 | 解密 Windows 中的 Path 环境变量

数据伦理 | 如何合规使用开源数据和软件？这几种常见协议你得知道！

Python实战 | 酷炫，Python实现交通数据可视化！

机器学习 | 刘景江、郑畅然、洪永淼：机器学习如何赋能管理学研究？国内外前沿综述和未来展望

大数据分析 | 文本方法衡量技术革新

数据Seminar

这里是大数据、分析技术与学术研究的三叉路口

欢迎扫描👇二维码添加关注

点击下方“阅读全文”了解更多

继续滑动看下一个

数据Seminar

向上滑动看下一个

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

机器学习 | 陶旭辉、郭峰——异质性政策效应评估与机器学习方法：研究进展与未来方向

概要

主要内容

1. 引言：

2. 异质性政策效应评估的价值和传统方法介绍：

3. 大数据背景下传统异质性政策效应评估方法存在的问题：

4. 机器学习在异质性政策效应评估中的优势与应用：

5. 机器学习在异质性政策效应评估中的局限以及未来方向：

6. 结论：

您可能也对以下帖子感兴趣

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

有的人走了，却永远活着

圈内疯传某谣言

不要放过这些人渣

“辣条二哥”直追卫龙，麻辣王子工厂遇洪受关注

生成图片，分享到微信朋友圈

机器学习 | 陶旭辉、郭峰——异质性政策效应评估与机器学习方法：研究进展与未来方向

概要

主要内容

1. 引言：

2. 异质性政策效应评估的价值和传统方法介绍：

3. 大数据背景下传统异质性政策效应评估方法存在的问题：

4. 机器学习在异质性政策效应评估中的优势与应用：

5. 机器学习在异质性政策效应评估中的局限以及未来方向：

6. 结论：

您可能也对以下帖子感兴趣