位置: 首页 - 学术活动 - 正文

活动回顾|王伟杰:断点回归方法以及在公共管理研究中的应用

时间:2025年03月17日作者:点击数:

2025年3月5日,由清华大学计算社会科学与国家治理实验室主办的清华交叉学科研究能力提升计划“24秋清华大数据与因果推断研讨班”第十一期在线上举行。本次讲座邀请密苏里大学杜鲁门政府与公共事务学院长聘副教授王伟杰老师为研讨班学员作题为《公共管理研究中的事件史分析方法》的主题讲座。王伟杰老师的研究领域包括绩效管理、人事管理和协作治理,主要运用准实验方法研究绩效信号如何影响管理策略、公民以及员工的态度和行为。讲座由陈思丞老师主持,24秋大数据与因果推断研讨班全体入选学员及助教等约1500名同学通过B站直播的方式参加。

双重差分(DID)、工具变量(IV)和断点回归(RDD)是现今金融研究领域中最常使用的三种方法。其中,断点回归是一种广泛应用于因果分析和政策评估的准实验方法。一些公共政策的实施常常依据个体或者组织在某一连续变量的观测值,当观测值超过事先设定的临界值时就进入实验组,否则就进入控制组。在这一临界值的附近就形成了近似于随机分配的情形,从而为因果分析和政策评估创造了条件。
   首先,王伟杰教授从因果推断的基本难题讲起。在社会科学领域,因果推断的核心在于比较个体在接受干预和未接受干预的潜在结果。然而,现实中无法同时观察到这两种结果,这就导致了因果推断的根本性难题——反事实结果的不可观测性。王老师形象地比喻说,解决这一难题的理想工具是“时光机器”,但现实中并不存在,因此研究者需要寻找替代方法。而断点回归正是这样一种方法,它通过构造一个“准实验”场景,帮助研究者找到反事实结果。
其次,王伟杰教授详细介绍了断点回归方法的基本原理。断点回归的两种主要设计:精确断点回归(Sharp RD)和模糊断点回归(Fuzzy RD)。精确断点回归要求个体严格服从实验分配,即分配到实验组的个体必须接受干预,分配到对照组的个体则不接受干预。而模糊断点回归则允许存在不完全服从的情况。断点回归方法的核心在于利用一个连续变量的临界点,将个体分为实验组和对照组。在临界点附近,个体的分配变量取值接近,但是否接受干预的状态不同,从而可以构造出一个准实验场景。王老师通过多个实际案例,如山东省高考录取分数线对学生未来就业和收入的影响、纽约市学校绩效评级对教育公平的影响等,展示了断点回归方法在公共管理研究中的应用价值。
   同时,王伟杰教授还深入探讨了断点回归方法的主要途径:基于连续性的方法和局部随机化方法。基于连续性的方法假设在没有干预的情况下,回归函数在临界点处是连续的,这意味着,当个体的分配变量接近临界点时,潜在结果的变化是平滑的,不存在跳跃。基于这一假设,研究者可以通过拟合临界点两侧的回归函数,比较其在临界点的差异来估计干预的因果效应。而局部随机化方法要求在临界点附近的狭小区间内,个体的分配变量取值与潜在结果无关,类似于随机实验的设计,这种方法在理论上更为严格,能够提供更接近随机对照试验的因果推断效果。王老师强调,尽管局部随机化方法在理论上更为严格,但在实际应用中,基于连续性的方法更为常见。
   此外,王伟杰教授进一步讲解了断点回归分析的重点。断点回归分析成功实施依赖于对几个核心要素的精准把控,包括核函数的选择、多项式次数的确定以及带宽的优化。带宽的选择尤为关键,它直接决定了纳入分析的数据范围,从而影响结果的准确性和可靠性。王老师还详细介绍了如何通过密度检验、平衡性检验和安慰剂检验等方法来验证断点回归设计的有效性。密度检验用于验证临界点附近数据的分布是否符合预期,平衡性检验则确保实验组和对照组在关键变量上的相似性,而安慰剂检验则是通过引入虚拟的变量来验证分析结果的稳健性。这些检验方法为研究者提供了有力的工具,以确保断点回归分析能够准确地识别因果效应。
   最后,王伟杰教授通过统计软件的实际操作演示,向学员们展示了如何运用断点回归方法进行数据分析。随后,王伟杰教授与学员们进行了互动交流,回答了关于如何寻找断点、断点回归与其他因果推断方法(双重差分法)的区别等问题。王老师指出,断点回归和双重差分虽然都是因果推断的常用方法,但设计逻辑完全不同。断点回归依赖于临界点附近的准实验设计,而双重差分则侧重于利用时间序列或空间差异来构造对照组。断点回归的应用场景相对较少,但一旦找到合适的断点,其因果识别的清晰度非常高,能够为研究者提供有力的实证支持。
本次讲座不仅为学员们提供了断点回归方法的系统性介绍,还通过实际案例和现场操作演示,帮助学员们更好地理解和应用这一前沿的因果推断技术。王伟杰教授的精彩讲解和丰富经验分享,得到了在场学员的高度评价和热烈欢迎。大家期待未来能有更多这样高质量的学术交流活动。(撰稿人:董明新、马梓洲、王诗玮)