Estimating Context Independent Treatment Effects in
Education Experiments
2015年11月24日,第449期现代经济学系列讲座在经济学院710会议室顺利举行。实证政策评估研究对于判断政策或项目的效果具有重要的研究支撑作用,然而这类研究在方法上往往依赖严格的假设条件,使得估计结果面临质疑。本期讲座荣幸地邀请到上海纽约大学&女王大学的丁维莉教授,她报告了在政策评估研究实证方法上的进展以及其在教育实验中的应用。陆铭教授主持了讲座,陈钊教授以及其他博士研究生参与了讨论。
在研究动机上,丁教授受到了减少班级规模倡议的启发,这是一个在过去十年影响北美的重要运动。丁教授回顾认为:“在随后的政策辩论以及决定中,这个项目引起了人们对田纳西州的“学生教师成就比率”(STAR)项目的巨大关注。然而,对各个学校的估计处理效应上却存在巨大的异质性,并且还没有对此进行解释的研究。”
为了解释这种异质性,丁教授提出了“不解之谜”的观点。她认为,在STAR项目中的班级规模处理效应可能是由一部分特别的小班学生的出色表现导致的,与其他学校相比,这些小班所在的学校在比例上并没有那么多的学生接受了实验处理。“这一在学校层面的实验处理上的变化清楚地告诉我们,‘个体处理效应稳定假设’,亦即SUTVA,并不满足。”
为了验证“不解之谜”,丁教授介绍了新的实证方法,以此她希望能够确定并估计SUTVA不成立时候的因果效应。“我们的策略是利用一个地区的学校里接受实验处理的人数所占比例的随机变化来解释实验处理异质性。这个比例可以称作处理密度。这种实验变化并不是由实验设计人先验引入的。并且由这种变化所解释的处理效应也并不是实验设计的目标效应。”
利用STAR项目的数据集,丁教授在回归的基础上得出以下结论。首先,STAR项目的处理效应异质性是由处理组班级的学生表现导致的,而且这些班级所在学校具有一个低处理密度。丁教授将这种效应成为语境效应,回归估计显示语境效应占到STAR项目总处理效应的60-85%。同时,丁教授在确定因果效应的实证方法论上也取得了进步。当实验存在语境效应或者社会互动效用时,或者说SUTVA不成立时,丁教授利用处理密度来解释实验处理差异性。“通过放松SUTVA,我们在实验的外部有效性增加的情况下也许仍能够受益,我们不仅可以随机化实验处理,而且也可以随机化语境变量。”
文/石烁 摄影/石烁