昨天,我们了解了synth命令如何下载和使用,今天小编如约向你展示,用synth命令寻找灯火阑珊处的“他”——控制组。
3举例
背景:
1989年美国加州实施控烟法(Proposition 99),提高烟草税(政策实施),为了评估该项政策的效果(我们很自然的想到使用DID,但由于找不到相似合适的控制组,见4中图1), Abadie et al.(2010, JASA)使用合成控制法研究该项政策对香烟销售的影响,以期评估该政策的效果。
操作:
use smoking(或use smoking.dta,clear) // 载入美国39个州烟草销售数据(1970-2000年)
tsset state year // 声明面板数据集
合成控制法估计:
synth cigsale beer lnincome retprice age15to24 ///
cigsale(1988) cigsale(1980) cigsale(1975), trunit(3) ///
trperiod(1989) xperiod(1980(1)1988) nested fig
注释:
synth:合成控制法估计命令
结果变量(被解释变量):
cigsale(人均香烟销售量,包/年)
预测变量(解释变量):
beer(人均啤酒消费量)、lnincome(人均GDP取自然对数)
retprice(香烟零售价格)、age15to24(15-24岁人口所占总人口比重)
cigsale(1988)、 cigsale(1980)、 cigsale(1975)分别为1988、1980与1975年的人均香烟销售量
trunit(3):实验处理组(加州),括号里的3表示加州的编号是3(加州的值标签)
trperiod(1989):政策开始实施时期,括号里的1989表示政策实施年份,即:政策从1989年开始实施
xperiod(1980(1)1988):预测变量beer、lnincome、retprice、age15to24均为1980-1988年的平均值
nested:嵌套优化,寻找最优合成控制(寻找理想控制组,详见上期2、选项(2))
fig:figure,即作图(详见上期2、选项(3))
屏幕结果显示(截取部分):
(1)数据设置
(2)嵌套优化
(3)获得估计结果(合成加州的各州最优权重)
合成的控制组—“加州替身”:权重大于0的州只有五个,其他州权重均为0(见下图);需要说明的是:权重非负,且权重之和为1。
(4)加州与合成加州的预测变量的匹配程度(非常接近)
4图示对比
图1(无合成控制)
图2(合成控制,但未加nested选项)
图3(合成控制,且加nested选项,政策实施前两条线更接近)
5因果效应与一点思考(留给有兴趣读者的一些课下研究)
(1)因果效应怎么计算,下图怎么画(后面附有图)
(2)有兴趣读者可以help synt,进一步总结归纳
(3)自己思考总结一下3、4两点
(例如:为何加入cigsale(1988) cigsale(1980) cigsale(1975)作为预测变量?)
(4)合成控制法有何优缺点,有哪些注意事项
(5)权重如何计算
(6)安慰剂检验(placebo test)
详见参考文献[2](Abadie et al.(2010, JASA))
(7)比较Synthetic control method与PSM、DID、RD、IV等方法
参考文献:
[1]Abadie, A., Diamond, A., and J. Hainmueller. 2014. Comparative Politics and the Synthetic Control Method. American Journal of Political Science (Forthcoming 2014).
[2]Abadie, A., Diamond, A., and J. Hainmueller. 2010. Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California's Tobacco Control Program. Journal of the American Statistical Association 105(490): 493-505.
[3]Abadie, A. and Gardeazabal, J. 2003. Economic Costs of Conflict: A Case Study of the Basque Country. American Economic Review 93(1): 113-132.
[4]Vanderbei, R.J. 1999. LOQO: An interior point code for quadratic programming. Optimization Methods and Software 11: 451-484.
[5]Abadie, A., Diamond, A., and J. Hainmueller. 2011. Synth: An R Package for Synthetic Control Methods in Comparative Case Studies. Journal of Statistical Software. 42 (13): 1-13.
synth命令的作者:
Jens Hainmueller, jhain@stanford.edu
Stanford University
Alberto Abadie, alberto_abadie@harvard.edu
Harvard University
Alexis Diamond, adiamond@fas.harvard.edu
IFC
其他学习资料:
本文只介绍一二,感兴趣的童鞋可以自己继续深入摸索,以下资料可能会有帮助:
视频:http://web.stanford.edu/~jhain//Video/SynthDemo.mp4
Jens Hainmueller主页:http://web.stanford.edu/~jhain//
(八卦一下,除了AER,Jens Hainmueller (with K. Bansak and D. Hangartner)今年还在Science上published article,“nber”呀)
最后,让我们来句顺口溜记住synth命令吧:
没有枪没有炮,敌人给我们造;
没有合适的控制组,synth来构造;
众里寻他千百度,synth命令来帮助;
最优权重来合成,终于寻到控制组;
踏破铁鞋无觅处,蓦然回首,
她在爬虫俱乐部!
control group还难找乎?事在人为!记住synth命令了吗?快来爬虫俱乐部找他。要想健康,常来逛逛,有事没事,爬爬更健康!我是爬虫俱乐部爬小二,今天你爬了吗?
我们团队原来的微信公众号是“数据处理援助中心”,现在正式搬家到“爬虫俱乐部”,欢迎关注。新的公众号开始,我们推出有问必答栏目,对您提出的问题,我们会尽力回答,并通过推文的形式进行发布。我们也欢迎各位粉丝向公众号投稿。
(编辑 @徐苾雯)
欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:xueyuan19920310@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)如果大家遇到关于stata处理分析数据的问题,也可以给该邮箱写邮件,邮件名称为“提问”+“问题名称或者关键词”,我们会在后期的推文里给予解答
长按二维码关注公众号
微信扫一扫
关注该公众号