查看原文
其他

论文复现:基于组级纵向数据评估政策的试验模拟方法

连享会 连享会 2023-10-24

👇 连享会 · 推文导航 | www.lianxh.cn




连享会 · 2023 寒假班

   



作者:吕大兴 (中山大学)
邮箱:lvdx@mail2.sysu.edu.cn

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

编者按:本文主要摘译自下文,特此致谢!
Source:Ben-Michael E, Feller A, Stuart E A. A trial emulation approach for policy evaluations with group-level longitudinal data[J]. Epidemiology (Cambridge, Mass.), 2021, 32(4): 533. -PDF- -Replication-


目录

  • 1. 引言

  • 2. 政策试验模拟的步骤

    • 2.1 定义单位样本和政策接受

    • 2.2 相关的因果对照

    • 2.3 定义初始时刻

    • 2.4 定义政策效果

  • 3. 单目标试验

    • 3.1 选择政策实施州和对照州

    • 3.2 测定政策效果

  • 4 嵌套目标试验

    • 4.1 选择单位样本

    • 4.2 政策效果估计

  • 5. 讨论

  • 6. 参考文献

  • 7. 相关推文



1. 引言

为了限制新冠肺炎疫情的传播,世界各国政府实施了许多非医药相关的干预政策,如停止居民的非必要活动、设置隔离期等。聚焦到美国,各州之间制定的政策及推动其落实的力度差别很大。因此,研究这些政策的效果对未来具有重要的借鉴意义。

学界已经有成熟的流行病学方法来测定在单一地点和单一时间起作用的干预措施的影响,这可以追溯到约翰·斯诺对伦敦 1854 年霍乱爆发的研究。双重差分 (DID) 方法通过利用政策实施前后以及地区实施政策与否对比得到的组级纵向数据来构建反事实结果。它有一支变体称为面板数据方法 (panel data methods),包括事件分析法 (event studies) 和比较中断时间序列 (comparative interrupted time series) 模型。

但是,流行病学领域对于如何推动地方政策持续实施 (有时也称为交错实施,staggered adoption) 并没有达成明确共识。幸运的是,在数十年非实验性研究设计的基础上,研究人员已经掌握很多方法用于解决个体间干预政策的混淆问题和时变问题,能够在个人层面干预的研究中熟练地处理类似的难题。目标试验模拟 (Target trial emulation) 就是这样一种非实验性研究方法,它对纳入和排除标准、协变量、风险敞口、政策效果测定以及这些变量的时变特征的设定要求都很高。

原文指出使用组级纵向/面板 (panel) 数据测定政策效果也需要进行类似严谨的设计 (尤其是各州司法流程不同导致最终确定的干预时间也互不相同的情况下),并将该方法定义为政策试验模拟 (policy trial emulation)。其核心思路是对同时实施干预政策的各个州 (treatment cohort) 分别设定试验目标,再将结果加总。

原文基于新冠肺炎确诊总数对各州居家令的影响作了典型事实分析。作者认为在研究方法中纳入试验模拟是概念上一个重要的进步,尽管早有文献确立了基本统计方法并有许多衍生观点。原文认为在数据准确、模型设计和诊断分析都严谨的前提下,基于面板方法的效果测定能够更好地解释很多政策。但符合新冠肺炎疫情的潜在假设不能随意简化,而且抗击新冠肺炎疫情传播的政策实施过程也是充满变数的。

2. 政策试验模拟的步骤

政策试验模拟方法不仅对于设计随机试验非常必要,而且在非实验性研究中也日渐普遍化。其核心步骤 (在使用加总的纵向面板数据评估政策时也同样重要) 如下:

原文通过测定美国各州应对新冠肺炎疫情采取的就地隔离 (shelter-in-place) 或居家令 (stay-at-home) 政策的效果来说明核心观点。这些强制性政策要求当地居民非必要不出门。原文使用《纽约时报》追踪器确定政策制定日期和每日病例数。由于数据完全公开,不需要申请 IRB 批准。

# 从数据中获取各变量
tmpdat <- data %>%
  mutate(policy_var = data[[policy_var]],
          date_var = data[[date_var]],
          outcome = data[[outcome_var]],
          policy_var_time_to = date_var - policy_var)

2.1 定义单位样本和政策接受

首先,确定对政策接受的统一定义。由于政策只有单一形式,某特定政策的可观测效果等同于在这种政策环境下的潜在效果。各州制定的居家令及细则规定迥异,所以单凭《纽约时报》追踪器 (NYT Tracker) 无法确定政策制定日期。可以引入一个 trade-off,即将各类政策 (如暂闭学校、停止非必要活动) 分开考虑。

但该方法也极大地扩展了具体风险敞口的维度。原文一并考虑一揽子政策,给单位样本间政策的具体实施留出变动空间。因此,预期的政策效果是不同政策特定效果的平均值,可能缺乏说服力或违反一致性假设。

其次,越来越多的证据表明,居家令对个人行为的影响不大。即使官方没有改变政策,许多州的居民也会减少出行。原文使用定向政策 (Intent-To-Treat) 分析,即个体被随机分配到不同政策环境下,而且受到的政策数量各不相同。ITT 方法通常用于测定总体政策是否有效,并不衡量具体的实施过程。

如果有类似全国范围内的政策实施情况或居民出行政策的遵守程度的数据,则可以进行类似单协议效应 (per protocol effect) 的分析,如测定整体政策实施 (即所有人都遵守居家令) 的效果。试验模拟框架有助于解释清楚在新冠肺炎疫情背景下进行单协议分析所需的额外假设。

最后,个体之间行为的相互影响也很复杂,比如新冠肺炎患者在国内旅游传播了病毒,试验模拟框架要求进行目标试验时必须考虑这些情况。几乎已有所有的政策评价标准工具都假设个体之间行为没有相互干扰,这意味着一州的效果只取决于本州的干预政策。违反这一假设会使单位样本和政策接受的定义变得复杂,甚至得出偏颇的结论。

在研究控制传染病政策的同时,认识到现实与假设的这种相悖并调节出更适模型也相当重要。Holtz et al. (2020) 利用旅游和社交网络数据来解释各州之间的溢出效应。感兴趣的读者可以参考观察性因果推理方面的文献,包括基于普遍个体干预的推理和基于特殊个体的面板数据方法的推理。

2.2 相关的因果对照

定义好单位样本和风险敞口后,试验模拟框架的下一步是定义相关的的预估值。正如上文讨论,这里着重对政策实施州进行 ITT 分析。令 表示在 时刻 州居家令的实施情况,令 表示观察到的对应政策效果。其原理是通过潜在政策效果来反映相关的因果紧密度:

  • 时, 表示已实施居家令的政策效果;
  • 时, 表示末实施居家令的政策效果。

相关的因果对照测定就是在对实施政策的州在实施政策后的时间段内,取上述两个潜在政策效果差值 的平均值。作者也关注这些政策“启动”的影响,当然有些州也会“停止”这些政策。比如在个体风险敞口案例分析中,调节个体或地区风险敞口的开/关就很复杂。试验设置分析中的挑战性意味着非实验性情况下的研究更是一个大工程。

2.3 定义初始时刻

试验模拟分析的下一步是定义初始时刻 (time zero),即个人或州被随机置于政策环境的时刻。这一步对于清楚地区分干预前基准措施和干预后政策效果至关重要,因为不适当选择和调整干预后的变量会导致很多偏差 (包括消不掉的时间误差)。

在标准试验模拟中,初始时刻通常是根据个体符合特定资格标准的时间来确定的,这一定义对于政策组和控制组单位样本都适用。在政策试验模拟和标准目标试验模拟中一样,各州有资格在任一时间节点实施政策。对政策实施州而言,通常选取政策制定日期为初始时刻;而对于控制组的对照州,研究人员需要确定一个本该实施政策却没有实施的日期作为初始时刻。

一种方法是基于日历表把各州置于同一初始时刻。比如下文重点讨论在 3 月 23 日制定居家令的各州的目标试验,就可以把 3 月 23 日当作其他对照州的初始时刻。但是在新冠肺炎疫情的背景下,可能需要从某地疫情爆发起测定初始时刻,因为在疫情爆发前并未合理定义确诊病例。这一表述与许多文献中流行病模型的表述一致,作者将其称为病例时间 (case time),即从第十个确诊病例出现到开始干预的累计天数。

下图左半部分显示了从 3 月中旬开始实施全州范围居家令的各州时变情况。可以看到加利福尼亚、新泽西、伊利诺伊和纽约州政策实施较早;而佛罗里达和阿拉巴马州 4 月初才开始实施;甚至包括艾奥瓦和阿肯色州在内的一些州一直没有制定相关政策。

下图右半部分按病例时间描述变化情况。从这一角度可以看出包括西弗吉尼亚和爱达荷在内的一些州,在出现第十个病例后很短时间内就制定了居家令。相比之下,按日历表计第一个执行全州居家令的加州的病例时间很长。

初始时刻的选择取决于实际背景。在新冠肺炎疫情背景下,病例时间与传染病的传播规律更一致,但也对测定误差更敏感;日历时间解释各州受到的“共同冲击”(如某一天联邦政府制定了新政策) 更方便。对一些更具体的问题,如政策对雇工收入的影响,两种计时方式的区别可能并不明显。为方便解释,正文使用日历时间,附录给出病例时间的对应结果。

2.4 定义政策效果

政策试验模拟的下一步是定义政策效果,包括对效果本身和其时变情况的测定。在典型试验中,政策效果可能以类似“半年内死亡率”的形式呈现。在新冠肺炎疫情研究中,原文着重关注两个政策效果的测定:(a) 按对数计的病例个数,(b) 按对数计的病例隔日比。前者衡量病例的累积效应,后者衡量病例的日增长效应。

这里选取对数转化后的数据,是因为病例的指数级增长会导致原始数据呈现不同的政策干预前趋势。下文还将讨论测定政策干预前趋势存在的风险,并在附录中给出按原始数据计算的病例累计数和增长率变化情况。数据质量也很关键,务必选择能够准确测定的政策效果指标。随着时间的推移,各州测定机制的不同带来的差分区别可能会导致对政策效果的误判。

最后,原文聚焦到在总体水平上测定的政策效果。有时对一组 (而不是个体) 样本进行随机试验更合理,其政策作用在总体水平上,但政策效果在个体水平上测定。这一原则对试验模拟也同样适用,分级建模可用来解释多层次结构的数据。

3. 单目标试验

本节引入一个单目标试验,之后再引入一系列能够更全面反映政策交错实施背景的嵌套目标试验。这一节测定同时制定居家令的单实验州组的政策效果,聚焦到 2020 年 3 月 23 日制定政策的五个州:康涅狄格、路易斯安那、俄亥俄、俄勒冈和华盛顿州。

3.1 选择政策实施州和对照州

在随机试验中,研究人员先验地清楚实验组和对照组预期的基础特征是相似的。但在政策评估等非实验性研究中,情况却并非如此。因此,政策试验模拟的关键一步是谨慎选择对照组。下一节将讨论调整差分的统计方法。

在选择对照州时要重点考虑测定时间的长度,因为某对照州一旦制定了政策,就不再是符合假设的有效对照样本了。从第一个州制定居家令到最后一个只过去了 19 天,若是将 3 月 23 日实施政策的各州与后续实施政策的各州进行比较,最多也只能观测到 10 天的效果。一般而言,在实验组之间,测定时间越长,可作为对照州的数量越少。

由于病毒风险出现、症状显现到检疫确诊之间存在滞后性,作者预计居家令会对确诊病例数和病例增长率产生延迟的或持续的影响。对政策生效区间 (及不同类型的政策效果) 开始的定义与上文定义的初始时刻是密切联系的。因此,我们将实施政策的州与 8 个从未实施政策的州 (阿肯色、北达科他、南达科他、艾奥瓦、内布拉斯加、俄克拉荷马、怀俄明和犹他州) 进行比较,并对长期政策效果进行估计。

原则上,我们可以在对照组中添加还未实施政策的州,并从这些州制定政策开始把它们删掉。然而,未实施政策的州组会在整个测定时间段发生变化。因此很难测定政策效果的变化是否仅仅来自于对照州的组成变化。此外,对于每段测定时间段内的对照州组,下文将进行诊断检验,可能会导出大量的诊断病例。

3.2 测定政策效果

明确目标试验后,最后一步就是测定政策效果和预测基本假设条件下的确诊病例。虽然在许多方面与标准试验模拟的背景相似,但考虑到数据的纵向时间序列性质和相对较少的单位样本数 (50 个州),政策试验模拟的设定存在一些特殊的小差别和复杂情况。

下表为 3 月 23 日实施政策的州和从未实施政策的州各自的按对数计的每日病例平均增长率 (括号内为按对数计的病例隔日比,干预前时间段是从 3 月 8 日到 3 月 22 日,干预后时间段是从 3 月 23 日到 4 月 26 日)

Stay-at-Home OrderPrePostDifference
March 23 Cohort0.31 (37%)0.09 (10%)-0.22 (-20%)
Never Treated Cohort0.24 (27%)0.10 (11%)-0.14 (-12%)
Difference+0.07 (+10%)-0.01 (-1%)-0.08 (-8%)

3.2.1 双重差分基本量

传统面板数据测定的基本框架是双重差分 (DID)。构建 DID 测定指标需要进行两次可能有内生缺陷的对照。原文比较了 3 月 23 日实施政策的州在颁布居家令前后病例增长率的变化。上表列出了这些增长率,可以看到按对数计的平均增长率下降了 0.22,大约 20 个百分点。

然而,这样简单的对照依赖于居家令是唯一影响 3 月 23 日后增长率变化这一主要假设。可以直接比较两组州 3 月 23 日后的增长率:从 3 月 23 日到 4 月 26 日之间,政策实施州按对数计的平均增长率比从未实施政策州的增长率低 1 个百分点。虽然这种方法可以使两组州免受同一冲击影响 (比如全美范围的政策或测试),但并不适用于任意干预前病例个数的差分计算。

双重差分包括两步:第一步分别得到 3 月 23 日实施政策的州和从未实施政策的州在干预前和干预后按对数计的增长率的下降值为 0.22 与 0.14,第二步再取这两个差分结果的差分 (因此称为双重差分) 得到按对数计的增长率减少了 0.08 (8 个百分点)。

DID 测定值计算公式为:

其中, 表示实验组 在干预前和干预后的平均政策效果, 表示从末实施政策的州组。

3.2.2 假设

双重差分框架的关键是平行反事实趋势的假设:宽泛地讲,是指在未实施任何政策的情况下,实验组和对照组的平均发展趋势是相同的。该假设本质上依赖于政策效果的规模大小。因此会存在病例数据对数形式的发展趋势是相等的,但原数据形式的发展趋势不相等的情况。在以下两种情况下,假设会被推翻。

  • 预期行为:在全州严控之前人们行为发生变化,干预前零措施不再真正意味着“干预前”。在对居家令的研究中,有可靠证据证明这种预期性行为的存在。
  • 时变混淆:政策实施和决策制定的过程取决于各州特色而非基准水平,即在基准时间段内相关效果的平均水平。比如,州政府为了回应病例增长的趋势而制定居家令。

最后,这种方法完全依赖于结果的调节,因此不同于流行病学研究中替代模型控制的许多方法——特别是政策权重逆概率法 (Inverse Probability Treatment Weighting)。近期研究中新提出的双重差分的双重稳健实施方法也包含了 IPTW,因此结果依靠于不同的假设 (包括每一个州都至少实施一个政策的确定性假设) 而不是单独的结果调节。标准双重差分模型通过在各组之间进行潜在推断的含参政策效果模型设计避免这种确定性的干扰。

3.2.3 确诊病例及随后影响的时变情况

基础的 2×2 DID 测定表对数据反应不够敏感,它测定的是全部干预后时间段政策效果的平均值。将不同的 2×2 DID 测定表结合可以评估 3 月 23 日后的政策效果是如何随时间变化的。首先选取一个共同的参照日期——通常选择马上实施政策的日期 (此处是 3 月 22 日),然后得到其他每一个日期相对于该日期的 2×2 DID 测定值。具体而言,k 时期干预前后的 2×2 DID 测定值计算公式为:

表示实验组 时期干预前后的平均值。下图给出了对 3 月 23 日政策实施州的该值的测定 (有时也称为事件研究分布,通过单样本剔除刀切法量化不确定性)。

单目标试验 DID 测定值计算:

 map_df(policy_times,
   function(x) {
      x_dat <- tmpdat %>% 
        filter(policy_var == x |
                  policy_var > x + max_time_to |
                  is.na(policy_var),
              date_var <= x + max_time_to) %>%
        mutate(trt = coalesce(1 * (policy_var == x), 0))

      x_dat %>%
        group_by(date_var) %>%
        summarise(estimate = mean(outcome[trt == 1]) - 
                             mean(outcome[trt == 0]),
                event_time = max(policy_var_time_to, na.rm = T),
                nt = sum(trt),
                nc = sum(1 - trt)) %>%
        mutate(estimate = estimate - estimate[event_time == -1],
               cohort = str_replace_all(x, "-""_")) %>%
        filter(!is.na(estimate)) %>%
        ungroup() %>%
        select(-date_var)
   }) -> cohort_dids

刀切法处理测定值及标准误计算:

fit_event_jack <- function(outcome_var, date_var, unit_var,
                           policy_var, data, max_time_to = NULL) {
  # 刀切法处理测定值
  units <- unique(data[[unit_var]])
  map_df(units,
        function(i) {
          cat(paste("Dropping", i, "\n"))
          fit_event_manual(outcome_var, date_var,
                           policy_var, data[data[[unit_var]] != i,],
                           max_time_to) %>%
            mutate(dropped = i)
        }) -> jack_ests
  # 标准误计算
  full_res <- fit_event_manual(outcome_var, date_var, policy_var,
                               data, max_time_to)
  jack_ests %>%
    group_by(cohort, event_time) %>%
    summarise(se =  sqrt((n() - 1) / n() * 
                         sum((estimate - mean(estimate)) ^ 2 ))) %>%
    right_join(full_res)
}

这一步骤有几大优势:首先,提供了一种对平行趋势假设的诊断分析,思想上类似于平衡检查。 (虚线左侧) 时的 实际上是对干预前 期政策影响的安慰剂检验;若平行趋势假设成立,其值应该趋向于 0。尽管这不是对实际假设的直接测试 (因为包含了政策干预后时期的反事实结果),测算政策干预前趋势可以近似看作对假设的检验。这对于所有的诊断分析并不万能,因为检则差分的计算能力总是有限的,而且零值附近的噪声会影响研究人员解释假设为何成立的过程。

其次,正如上图所示,在 3 月 23 日前一周,安慰剂检验值接近于 0。但是前两周的方差很高,而且与 3 月 22 日相比,实施政策州组的病例增长率系统性地高于从未实施政策州组的。在按对数计的病例时变图中,对平行趋势假设的违背更明显。与从未实施政策的州相比,3 月 23 日实施政策的州组的病例数量急剧增加,这一情况可能解释了时变混淆的存在,尽管样本量少,但不确定性很大。

最后,对于 的情况,原文对每一时期后续政策不同的效果作了测定,但在预期政策效果移入或移出方面未作假设。从上图可以看出,在单目标试验中,区分零值附近的政策效果的精度远远不够,判断趋势就更困难了。

4 嵌套目标试验

4.1 选择单位样本

现在对实施居家令的所有 42 个州重复进行试验模拟研究来测定整体的平均政策效果。同前文所述,第一步是基于政策实施日期将所有实验州分进 17 个州组。再对每个州组进行单目标试验,并在每个目标试验中选取相同的 8 个从未实施政策的州作为对照组。最后,加总所有这些目标试验的结果。

因为每个目标试验可以设置不同的起始时间和政策测定时间跨度,这里的方法可称为嵌套目标试验,在一些计量经济学文献中有时也称为堆叠 (stacking) 或逐项分析 (event-by-event analysis)。采用的具体方法与 Abraham and Sun (2020) 的方法以及 Callaway and Sant’Anna (2019) 去除协方差后的方法一致。

4.2 政策效果估计

如前一节的步骤,对于每一个单目标试验,这里将在实验组内进行一系列两期双重差分测定。加总实验组的测定结果有很多方法,这里基于政策干预天数进行加总:

表示实验组的个数, 是实验组 中实施政策的州个数, 是实施政策州的总数。这种方法被称为嵌套测定 (nested estimates)。

嵌套目标试验 DiD 测定值加总计算:

cohort_dids %>% 
    left_join(cohort_weights, by = c("event_time""cohort")) %>%
    group_by(event_time) %>%
    summarise(estimate = sum(estimate * pct),
              nt = sum(nt),
              nc = sum(nc)) %>%
    ungroup() %>%
    mutate(cohort = "average") %>%
    bind_rows(cohort_dids)

下图给出了基于这种方法按对数计的病例日增长率和病例累计数的测定结果。与单目标试验一样,零点右侧是对相关的政策效果的测定,左侧是政策实施前效果的安慰剂检验。左半部分显示按对数计病例增长率的结果,一州在制定居家令前 10 天的安慰剂检验测定值接近于 0。但再早的安慰剂检验变化很大而且有随时间推移下降的趋势。因此对于零点右侧负的测定值的解释需要更加合理妥当。

右半部分显示按对数计病例累计数的结果,可看出安慰剂检验结果与零值的区别更加显著,这意味着该分析不一定符合要求,而且测定的政策效果可能只是对差分值变化趋势的反映。

5. 讨论

流行病学研究者经常面对这样的情况:许多地区随时间变化陆续采取同一政策,而且可获得的数据是来自前者及其他地区纵向数据的加总。政策试验模拟为测定这种背景下的因果效应提供了一个基础框架。

作者推崇的具体方法并不新颖,统计学与计量经济学领域有越来越多的文献给出了基于面板数据的稳健方法。原文说明了这些方法非常自然地适用于试验分析框架,特别是对多目标试验加总的分析。因此,可以借助方法论最前沿的内容应用于更复杂的宽松假设 (如基于协方差的平行趋势假设) 下的政策测定,包括逆倾向得分加权、双重稳健估计、综合控制和匹配法等;也可以在时间序列 (如比较中断时间序列) 中赋予试验更严格的建模假设,如单线性趋势。

很多研究者使用回归将纵向模型拟合到所有数据得到对州和时间的固定影响,这种方法是不值得提倡的。对于政策随时间变化且含有混淆因素的个体数据,粗糙的回归模型可能遮盖很多关键信息。已有文献论证,这里的混合模型的相关系数测定的是所有出现的 2x2 双重差分测定值的加权平均值,而且权重可能为负数。

还有一些测定不符合试验模拟精神,比如把两个实施政策的州进行对照。在现实实践中,这些复杂性意味着预期效果的指标值可能随着嵌套测定而跳动。尽管诸如“事件研究模型”的一些方法对这种批判并不在意,但作者论述的试验模拟框架更加透明、更不易犯错,这是因为所有因果对比的设计都是清晰的。

原文强调的问题只是更普遍地评估政策影响时所面临的许多挑战中的一小部分。其他挑战还包括:实施与未实施政策的州的差异,在统计数据有限的情况下识别出政策的时变特征。新冠肺炎疫情的传播给这些政策评估增添了额外的复杂性。比如,病毒传播过程、从感染到出现症状长达两周的潜伏期都使得精确识别预期效果的时变特征更加困难。

基于相关政策效果的数据也有限或者有问题,比如,发病率需要根据不同测试程度来测定。最后,不能解释溢出和沾污效应的方法在疫情背景下有可能导致偏差,因此正确地解决干扰问题同时是方法和实践上的关键一步。

这些问题与严格的基本假设警醒研究者在使用双重差分方法测定新冠肺炎疫情物理隔离政策的影响时要慎之又慎。政策试验模拟框架提供了一个渠道用以评估研究中所使用依据的质量。在未来研究中,与其他来源的依据一并考虑时,作者期望高质量的面板数据能够增进研究者对这些政策理解。

6. 参考文献

  • The New York Times. Coronavirus (Covid-19) Data in the United States. Accessed August 2, 2020. -link-
  • Holtz D, Zhaoa M, Benzellb SG, et al. Interdependence and the Cost of Uncoordinated Responses to COVID-19. Working paper, 2020. -PDF-
  • Callaway B and Sant'Anna Pedro HC. Difference-in-Differences with Multiple Time Periods (March 1, 2019). -PDF-
  • Goodman-Bacon A. Difference-in-Differences with Variation in Treatment Timing. National Bureau of Economic Research. Working Paper, 2018; 25018. -PDF-

7. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh did, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:倍分法DID
    • 队列DID:以知识青年“上山下乡”为例-T401
    • DID功效计算中的序列相关问题-T407
    • 多期DID文献解读:含铅汽油与死亡率和社会成本-L113
    • DID陷阱解析-L111
    • DIDM:多期多个体倍分法-did_multiplegt
    • 面板PSM+DID如何做匹配?
    • 倍分法:DID是否需要随机分组?
    • Fuzzy DID:模糊倍分法
    • DID:仅有几个实验组样本的倍分法 (双重差分)
    • 考虑溢出效应的倍分法:spillover-robust DID
    • tfdiff:多期DID的估计及图示
    • 倍分法DID:一组参考文献
    • Stata:双重差分的固定效应模型-(DID)
    • 倍分法(DID)的标准误:不能忽略空间相关性
    • 多期DID之安慰剂检验、平行趋势检验
    • DID边际分析:让政策评价结果更加丰满
    • Big Bad Banks:多期 DID 经典论文介绍
    • 多期DID:平行趋势检验图示
    • Stata:多期倍分法 (DID) 详解及其图示
    • 倍分法DID详解 (二):多时点 DID (渐进DID)
    • 倍分法DID详解 (一):传统 DID
    • 倍分法DID详解 (三):多时点 DID (渐进DID) 的进一步分析

课程推荐:因果推断实用计量方法
主讲老师:邱嘉平教授
🍓 课程主页https://gitee.com/lianxh/YGqjp

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存