绘图两大绝招

2016-12-22 宝宝&王艳艳 爬虫俱乐部 爬虫俱乐部

诸君安!

随着互联网的飞速发展,我们也进入了一个崭新的大数据时代,而且数据更新快、数量大且多样化,所以,图表的使用也是无可避免的,接下来小编就给大家介绍Stata中绘图的两大绝招:

四个图形的叠加以及图形编辑器的使用;

aaplot回归拟合曲线图的奇妙

四个图形叠加以及图形编辑器的使用

第一步:模拟数据

通过Stata程序生成一组随机数,然后将其排序再生成年份变量从1900——2000年,其中数据前55个数据是一个规律后56个数据则进行变换生成方式,以此模拟在1955年发生一次冲击并作为实验组,最后将数据按year排序保存到D:\爬虫俱乐部/temp,replace

clear

set obs 101

gen treat = cond(_n<=55,3*runiform(20,25),4*runiform(20,30))

sort treat

gen a=_n

gen year =_n+1899

sort year

save D:\爬虫俱乐部/temp,replace

模拟一组数据为对照组而且对照组的数据趋势与实验组前55个数据趋势相同,以便对两组数据进行比较

clear

set obs 101

gen control=3*runiform(15,25)

sort control

gen a=_n

gen year =_n+1899

sort year

通过merge语句与实验组拼接

merge 1:1 year using D:\爬虫俱乐部/temp

drop _merge

构造diff观察两组数据的差异

gen diff=treat-control

第二步:绘制图形

twoway (line control year)( line treatyear)( line diff year)(lfit diff year)

其中Fitted valuesdiffyear的拟合曲线

如果给图形添加参考线,我们可以使用line或者scatter绘图命令,在命令中加入yline() xline()

第三步:优化图形

针对上述例子在1955年加一个参考线,使用xline()命令

line control year,lwidth( medthick)yaxis(1) xline(1955) xaxis(1) lwidth(medium) || line treat year ,lwidth(medthick)||line diff year,lwidth( medthick)||lfit diff year,lwidth( medthick)

这样可以更加清楚地看见1955年曲线发生的变动

通过上述两个方法绘图我们可以轻松将四条曲线绘制在同一张图表中

如果您嫌背景色不好看,可以通过以下方法修改底色,大家可以自行尝试:

执行完 do 文档图片显示出来后,在图片上点右键,然后可以选择编辑图片(点 preferences),里面可以在 scheme 里调主题颜色,默认的是 s2color。不过调完之后,则需要在下次执行 do 文档的时候才会生效,而且是今后一直生效,要想用默认颜色需要自己再改回来。例如:

我们也可以看一下scheme的值换为s2manual-mono,图形变为

大家可以根据自身喜好选择Scheme的类型

如果想继续对图片进行编辑也可以右键Start Graph Editor

如果对图形背景颜色进行选择应对Color进行选择,图形边界修改则是Margin,如果想修改更多则选择more,如图:

对曲线进行修改只需双击此条曲线

如果读者想添加辅助线可以选择Reference lines


aaplot回归拟合曲线图的奇妙

强大的aaplot命令可以画线性和二次拟合以及两者的叠加。并给出了方程表达式、R^2(显示在图的顶部)、观测值的个数和RMSE(显示在图的底部)。

第一步:模拟数据

clear

set obs 100

gen a=_n

gen x=a*runiform(2,3)

gen y=x^2+x+10+runiform(1,40000)

第二步:绘制线性拟合直线图

aaplot y x, name(a1)  //a1是所绘制图形的名称

由图可以得出线性拟合的的回归方程以及R^2,以及图下方的观测值和RMSE均方根误差

第三步:绘制二次拟合曲线

aaplot y x, quadratic qopts(lc(pink)) name(a2)

lc(pink)是定义二次拟合曲线为粉红色,大家可以根据自己喜好自行定义

根据图形我们可以通过判定系数R^2观测二次曲线拟合的更好

第四步:线性与非线性的比较

aaplot y x, both name(a3)

通过使用both我们将线性和非线性图组合到一起,且同时给出两次拟合的回归方程

为了更方便观察小编对命令进行了修饰

aaplot y x, both backdrop(lfitci y x,color(gs12)) name(a4)

对线性拟合曲线的背景进行定义,可以更加明显区分线性和非线性拟合的不同

如果大家想进一步了解aaplothelp一下你就知道!

以上数据均为小编随机生成的,希望通过使用上述命令可以对大家处理数据绘图有所帮助。

今天分享的内容就是这些啦

接下来让我们关注一下空气质量情况

全国空气质量如下

天津南部的朋友

出门不要忘了带口罩哦!

以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~,点赞打赏随您心意,么么哒~

应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~

编辑 by 张欢


往期推文推荐:

1.火锅和肥羊,啤酒和炸鸡,cnstock和chinafin

2.天路——chinafin与cntrade命令

3.用subinfile修改文件,滚蛋吧,繁琐的命令君!

4.分时数据,从此唾手可得

5.爬虫俱乐部周末送大礼——chinagcode提取中文地址经纬度

6.esttab功能挖掘:“Yes”or“No”

7.用“套路”处理数据

8.厉害了,我stata哥

9.众里寻她千百度,synth命令来帮助!

10.I have a Stata, I have a python




关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:xueyuan19920310@163.com

投稿要求:

1)必须原创,禁止抄袭;

2)必须准确,详细,有例子,有截图;

注意事项:

1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。

2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。

3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


欢迎关注爬虫俱乐部

微信扫一扫
关注该公众号