活动回顾|刘生龙:断点回归方法在劳动经济政策评估中的应用
2022年11月23日晚上,由清华大学计算社会科学与国家治理实验室主办的首届清华交叉学科研究能力提升计划“大数据与因果推断研讨班”第三讲在线上举行。本次讲座邀请清华大学公共管理学院刘生龙副教授为研讨班学员作题为“断点回归方法在劳动经济政策评估中的应用”的主题讲座。本期讲座由清华大学公共管理学院副教授陈思丞主持,“大数据与因果推断研讨班”全体入选学员及助教以网络会议形式参加。
本次主题讲座围绕“断点回归设计及应用”及其“在劳动经济政策评估中的应用”展开。讲座伊始,刘生龙老师介绍断点回归发展历史以及近些年在五大经济学期刊上的应用情况,说明了断点回归研究方法的重要性不断提高,以及RD方法和应用议题还有很大的发展空间。
接下来,刘老师从政策评估中普遍存在的内生性问题入手,提出随机设计能够克服选择偏差、进行因果识别,但RCT存在成本过高、伦理问题等不足。断点回归被认为是最接近随机实验的自然实验方法。由于驱动变量是连续的,临界点附近的个体是相似的和可比的,于是两侧个体在结果上的差异可以归因为政策干预。与工具变量法、倾向得分匹配等因果识别方法相比,RD存在实施假设条件更容易被检验等一些特有优点。
然后,刘老师强调断点回归运用有三个前提假设,只有满足了前提假设才能使用该方法。前提假设分别是:(1)驱动变量在临界点处具有随机设定检验,检验方法为McCracy test;(2)前定变量连续性检验,检验方法为画图看看临界点处是否有明显的断点和直接估计法;(3)单调性检验,即LATE检验。
刘老师总结了断点回归的优缺点,优点包括:直观的图形设计,良好的内部有效性,稳健性检验,一旦实施前提满足、估计结果具有随机试验的特性。其缺点为内部有效性强、而外部有效性差,因为RD估计结果是局部平均处理效应,仅仅对于政策的遵从者有效,同样的政策对于部分地区部分人群有效,如果换成别的地区或者人群可能就没有效果。现在一些学者开始探讨RD外部有效性的评估,尝试弥补其外部有效性较差的缺陷。
刘老师介绍了RDD的应用示例,如采用年龄断点估计退休在家庭内的健康溢出效应,采用分数断点评估重点大学教育回报,采用地理断点评估长江中下游沿岸三峡大坝的效应,采用收入断点分析贫困政策的减贫效应,采用生日断点分析义务教育法效应,采用分数断点评估上不上大学的效应。
最后,刘老师对断点回归的估计过程和应用扩展进行了总结。一是寻找,即找到合适的驱动变量,通过图形观测相关经济变量在临界点附近是否存在明显的跳跃。二是估计,即代入数据检验第一阶段跳跃是否显著、基于2SLS估计核心解释变量对被解释变量的因果效应。三是稳健性分析,采用不同的估计方法、不同的窗宽和不同的多项式阶数等。四是前提假设检验,即检验驱动变量是否随机分布、前定变量是否连续。随着RD设计的应用不断扩展,时间断点回归设计、拐点回归设计、多断点RD设计、多驱动变量RD设计、离散型配置变量RD设计和分位数RD设计等方法的出现使得断点回归的科学性不断提高。
在讲座主要内容结束后,进入师生提问交流环节。学员们围绕“最优窗宽的设定”、“因变量的选取”、“如何图形观测”等问题踊跃向刘老师提问,刘老师逐一耐心解答与回复。最后,陈思丞老师感谢刘生龙老师的精彩发言并做简要总结。至此,本次讲座圆满结束。