大大大大大新闻————爬虫俱乐部新推出了视频讲解环节。小编突然浮现出一个画面——看着视频嗑着瓜子学着stata,妈妈再也不用担心我的stata了!详情请猛戳文章下面的视频。
生活中充满着比较与对比,我们会对比ios10与ios11界面的异同,对比有滤镜和没有滤镜的差别,对比电动汽车还是烧油汽车更好,你们发现对比后有哪里不同吗?
DuangDuangDuang!楼歪了,进入我们的正题,在研究中我们同样在对比,对比数据中分组样本的差别。大家都知道在企业市场结构的研究中,起关键作用的指标有市场份额、企业规模、资本收益率、总收益增长率等。为了研究市场结构的变动,研究人员通常需要将调查所得的数据与历史数据进行比较。通过均值比较检验,就能比较出现在的市场结构与过去的市场结构是否存在显著性差异。
在临床医学中,医生需要对病人治疗前后的状况进行控制。例如通过对比一组病人使用某种药物后的身体指标,可以判断该药物对病人是否有效,效果是否显著。
学者们和众多研究僧们在做实证论文的时候,会有描述性统计的部分,从而能够概括、表述样本数据的整体状况以及样本间关联、类属关系。为了比较两组变量在基本特征上的差异性,我们能够运用分组均值t检验来进行描述性统计。
下边我们通过文献来举个栗子:
张璇, 周鹏, 李春涛. 卖空与盈余质量——来自财务重述的证据[J]. 金融研究, 2016(8):175-190.
这篇文章在描述性统计以及运用倾向得分匹配中都运用了分组均值t检验来比较不同组观测值各个变量的差异性。
在运用倾向得分匹配方法来对控制组与对照组进行匹配,我们要了解主要变量在匹配前后的样本特征情况以及进行匹配的平衡性检验,同样会用到分组t 检验。
刘晔, 张训常, 蓝晓燕. 国有企业混合所有制改革对全要素生产率的影响——基于PSM-DID方法的实证研究[J]. 财政研究, 2016(10):63-75.
这篇文章在运用倾向得分匹配的时候,同样是通过分组均值t检验来对倾向得分匹配进行平衡性假设检验。
基于分组均值t检验的重要性,以及在论文实证中广泛的运用,我们爬虫俱乐部推出了t2docx命令。该命令能够在Stata15中运行,只需要一行命令,就能够将分组均值t检验的结果导出到word中,可以说是在我们团队之前推出的ttable2上又升华了一步,灰常灰常方便呦!并且与我们团队推出的sum2docx,reg2docx,corr2docx,tab2docx命令遥相呼应,并称为计量实证结果输出的法宝。
我们现在用一个简单的例子来介绍一下t2docx的用法。
这是一个外部命令,我们首先要安装它
ssc install t2docx
2
之后打开系统自带的auto数据,并根据是否是进口车辆将样本分组,比较两组变量price weight length mpg的均值差异
sysuse auto, clear
t2docx price weight length mpg using 1.docx ,replace by(foreign)
shellout 1.docx
我们将样本分为两组变量:Domestic与Foreign 。四个变量price weight length mpg的两组观测值的个数(obs),均值(mean),均值差(mean-diff)以及t值都导出到word中。
3
t2docx命令的多种选项还等待我们探索
(1)加入标题“this is the t-test table”, 缺省情况下标题为“t-test table”
t2docx price weight length mpg using 1.docx ,replace by(foreign) title("this is the t-test table")
(2)更改数字的格式为保留小数点后两位,缺省情况下为保留小数点后三位
t2docx price weight length mpg using 1.docx ,replace by(foreign) fmt(%9.2f) title("this is the t-test table")
(3)运用append选项将输出的表格附加在已有文件之后
t2docx price weight length mpg turn using 1.docx ,append by(foreign) fmt(%9.2f) title("this is the t-test table")
(4)改变显著性水平以及星号,缺省情况下1%的显著性水平为*** ;5%的显著性水平为**;10%的显著性水平为*
t2docx price weight length mpg rep78 headroom trunk using 1.docx ,replace by(foreign) star(* 0.01 ** 0.005 *** 0.001) title("this is the t-test table")
(5)不输出星号,运用nostar选项
t2docx price weight length mpg rep78 headroom trunk using 1.docx ,replace by(foreign) nostar title("this is the t-test table")
(6)不输出t值,缺省情况下存在t值
t2docx price weight length mpg rep78 headroom trunk using 1.docx ,replace by(foreign) not title("this is the t-test table")
以上就是我们对t2docx命令的介绍。关于reg2docx,sum2docx命令介绍可以参考我们公众号往期的推文《用reg2docx报告你的实证结果吧!》《命令sum2docx输出统计量表到docx文件》,此外还有corr2docx命令以及tab2docx命令,等待我们放大招吧!
什么?!没看懂!!不要紧!!戳下面,听爬虫小将的详细讲解,也欢迎大家的批评指正哟!
以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~。
应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~
文字编辑:闫续文
技术总编:刘贝贝
往期推文推荐:
5.爬虫俱乐部又出新命令了——wordconvert转换你的word文件
6.putdocx+wordconvert—将实证结果输出到Word(.docx)文档
7.Stata 15之Markdown——没有做不到,只有想不到!
关于我们
微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。
欢迎关注爬虫俱乐部
微信扫一扫
关注该公众号