众里寻他千百度,synth命令来帮助!(二)

2016-10-10 赵磊 爬虫俱乐部 爬虫俱乐部

昨天,我们了解synth命令如何下载和使用今天小编如约向你展示,用synth命令寻找灯火阑珊处的”——控制组。

3举例

背景:

1989年美国加州实施控烟法(Proposition 99),提高烟草税(政策实施),为了评估该项政策的效果(我们很自然的想到使用DID,但由于找不到相似合适的控制组,见4中图1), Abadie et al.(2010, JASA)使用合成控制法研究该项政策对香烟销售的影响,以期评估该政策的效果。

操作:

use smoking或use smoking.dta,clear) // 载入美国39个州烟草销售数据(1970-2000年)

tsset state year   // 声明面板数据集


合成控制法估计

synth cigsale beer lnincome retprice age15to24  ///

cigsale(1988) cigsale(1980) cigsale(1975), trunit(3)  ///

trperiod(1989) xperiod(1980(1)1988) nested fig

注释:

synth:合成控制法估计命令

结果变量(被解释变量):

cigsale(人均香烟销售量,包/年) 

预测变量(解释变量):

beer(人均啤酒消费量)、lnincome(人均GDP取自然对数)

 retprice(香烟零售价格)、age15to24(15-24岁人口所占总人口比重

 cigsale(1988)、 cigsale(1980)、 cigsale(1975)分别为1988、1980与1975年的人均香烟销售量 

trunit(3)实验处理组(加州),括号里的3表示加州的编号是3(加州的值标签)

trperiod(1989)政策开始实施时期,括号里的1989表示政策实施年份,即:政策从1989年开始实施

xperiod(1980(1)1988)预测变量beer、lnincome、retprice、age15to24均为1980-1988年的平均值 

nested嵌套优化,寻找最优合成控制(寻找理想控制组,详见上期2、选项(2)

fig:figure,即作图(详见上期2、选项(3)


屏幕结果显示(截取部分):

(1)数据设置


(2)嵌套优化


(3)获得估计结果(合成加州的各州最优权重)

合成的控制组—“加州替身”:权重大于0的州只有五个,其他州权重均为0(见下图);需要说明的是:权重非负,且权重之和为1。


(4)加州与合成加州的预测变量的匹配程度(非常接近)


4图示对比


图1(无合成控制)


图2(合成控制,但未加nested选项)


图3(合成控制,且加nested选项,政策实施前两条线更接近)

5因果效应与一点思考(留给有兴趣读者的一些课下研究)

(1)因果效应怎么计算,下图怎么画(后面附有图)

(2)有兴趣读者可以help synt,进一步总结归纳

(3)自己思考总结一下3、4两点

(例如:为何加入cigsale(1988)  cigsale(1980)  cigsale(1975)作为预测变量?)

(4)合成控制法有何优缺点,有哪些注意事项

(5)权重如何计算

(6)安慰剂检验(placebo test)

详见参考文献[2](Abadie et al.(2010, JASA))

(7)比较Synthetic control methodPSM、DID、RD、IV等方法

参考文献:

[1]Abadie, A., Diamond, A., and J. Hainmueller. 2014.  Comparative Politics and the Synthetic Control Method. American Journal of Political Science (Forthcoming  2014).

[2]Abadie, A., Diamond, A., and J. Hainmueller. 2010.  Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California's Tobacco Control Program.  Journal of the American Statistical Association 105(490): 493-505.

[3]Abadie, A. and Gardeazabal, J. 2003. Economic Costs of Conflict:  A Case Study of the Basque Country. American Economic Review 93(1): 113-132.

[4]Vanderbei, R.J. 1999. LOQO: An interior point code for quadratic programming.  Optimization Methods and Software 11: 451-484. 

[5]Abadie, A., Diamond, A., and J. Hainmueller. 2011. Synth: An R Package for Synthetic Control Methods in Comparative Case Studies. Journal of Statistical Software. 42 (13): 1-13.

synth命令的作者:

  •       Jens Hainmueller, jhain@stanford.edu

      Stanford University

  •       Alberto Abadie, alberto_abadie@harvard.edu

      Harvard University

  •       Alexis Diamond, adiamond@fas.harvard.edu

      IFC

其他学习资料:

 本文只介绍一二,感兴趣的童鞋可以自己继续深入摸索,以下资料可能会有帮助:

 视频:http://web.stanford.edu/~jhain//Video/SynthDemo.mp4

 Jens Hainmueller主页:http://web.stanford.edu/~jhain//

(八卦一下,除了AER,Jens Hainmueller (with K. Bansak and D. Hangartner)今年还在Science上published article,“nber”呀)

最后,让我们来句顺口溜记住synth命令吧:

没有枪没有炮,敌人给我们造;

没有合适的控制组,synth来构造;

众里寻他千百度,synth命令来帮助;

最优权重来合成,终于寻到控制组;

踏破铁鞋无觅处,蓦然回首,

她在爬虫俱乐部!

control group还难找乎?事在人为!记住synth命令了吗?快来爬虫俱乐部找他。要想健康,常来逛逛,有事没事,爬爬更健康!我是爬虫俱乐部爬小二,今天你爬了吗?


我们团队原来的微信公众号是“数据处理援助中心”,现在正式搬家到“爬虫俱乐部”,欢迎关注。新的公众号开始,我们推出有问必答栏目,对您提出的问题,我们会尽力回答,并通过推文的形式进行发布。我们也欢迎各位粉丝向公众号投稿。

(编辑 @徐苾雯)


欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱xueyuan19920310@163.com

投稿要求

1)必须原创,禁止抄袭;

2)必须准确,详细,有例子,有截图;

注意事项

1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名。

2)邮件请注明投稿,邮件名称为投稿”+“推文名称

3)如果大家遇到关于stata处理分析数据的问题,也可以给该邮箱写邮件,邮件名称为提问”+“问题名称或者关键词,我们会在后期的推文里给予解答

长按二维码关注公众号

微信扫一扫
关注该公众号