12
月
18
日
周
一
有问题,不要怕!点击推文底部“阅读原文”下载爬虫俱乐部用户问题登记表并按要求填写后发送至邮箱statatraining@163.com,我们会及时为您解答哟~
ps:(1)爬虫俱乐部将于2018年1月20日至28日在武汉举行两期Stata编程技术定制培训。详情请戳《爬虫俱乐部Stata编程技术定制培训班——2018年1月武汉专场》
(2)喜大普奔,爬虫俱乐部的github主站正式上线了!我们的网站地址是:https://stata-club.github.io,粉丝们可以通过该网站访问过去的推文哟~
hello诸君,暖阳高照,午间一杯清茶,又到了爬虫俱乐部向大家种草新命令新方法的时候啦!
许多同学学到的第一个Stata绘图命令想必就是 scatter 命令,该命令用于生成观测样本的散点图,但scatter命令存在一个缺点:当我们的数据集存在重复观测值时,scatter生成的图中不能体现那些“重合的散点”。而今天我们要介绍的命令专门用于解决这一问题——neat命令,它可以微调重复观测样本的变量值。使得其在散点图上清晰可见。
01
安装
你可以使用github 命令直接安装neat命令
github install haghish/neat
关于如何使用github命令下载github站点上的Stata命令,可以详见爬虫俱乐部推文《SSC的好兄弟“github”》
02
scatter散点图
首先我们加载命令的作者提供给我们的示例数据集,使用它来绘制散点图。
use "https://raw.githubusercontent.com/haghish/neat/master/test/neat3.dta", clear
查看数据集大致情况
可以看到,这个数据集有60个观测值,两个变量v1 v2 值均为正整数,并且存在重复观测值。如第1个观测值与第6个观测值是重复的。
首先使用scatter命令绘制散点图
scatter v1 v2
得到图片如下
散点图已经绘制出来了,但咱们仔细数一数发现,图中只有29个散点,而数据集却有60个观测值,这是因为存在很多重复观测值的情况,这些重复观测值“挤”在了一起,我们看不到,那么怎样可以在图中直观地看到这些重复观测值呢。这就要用到我们今天的主角:neat命令。
03
neat命令绘制重合散点图
使用neat命令绘制可以显示重复观测值的散点图,其实非常地简单,只需要在scatter命令之前,加上一句neat命令即可。完整代码如下:
use "https://raw.githubusercontent.com/haghish/neat/master/test/neat3.dta", clear
neat v1 v2
scatter v1 v2
得到如图所示的新散点图
04
neat的两个小选项
neat命令内置了两个小选项用以调整图片整体外观及散点大小。
msize() 改变散点的大小
msize() 的默认值为1.5 ,如果你设置了一个比1.5小的数字,那么生成的散点就会变小
xsize() 伸缩横坐标轴
通过xsize()选项,可以“压缩”或“拉伸”横坐标轴
现在我们将散点重绘一遍,两个选项在neat命令和scatter命令中都要写一遍。
use "https://raw.githubusercontent.com/haghish/neat/master/test/neat3.dta", clear
neat v1 v2 , msize(1.1) xsize(6.5)
scatter v1 v2, msize(1.1) xsize(6.5)
这样一个小巧方便的命令完美地解决了一个绘制散点图时遇到的烦恼。
注:此推文中的图片及封面(除操作部分的)均来源于网络!如有雷同,纯属巧合!
以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~。另外,我们开通了苹果手机打赏通道,只要扫描下方的二维码,就可以打赏啦!
应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~
文字编辑/徐露露
技术总编/刘贝贝
往期推文推荐:
5.爬虫俱乐部又出新命令了——wordconvert转换你的word文件
6.putdocx+wordconvert—将实证结果输出到Word(.docx)文档
关于我们
微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。
欢迎关注爬虫俱乐部
微信扫一扫
关注该公众号