朝花夕拾 | 如何查看数据缺失值?

2017-05-04 爬虫俱乐部 爬虫俱乐部 爬虫俱乐部

     

今天是朝花夕拾板块的不定期更新时间。不管你是想温习我们之前推送的命令,还是要学习新的技巧,都且听小编慢慢道来。



当我们得到一份数据的时候,我们通常会先看数据有多少,缺失多少。那么,如何快速查看数据的缺失值呢?可以用命令nmissing来查看。


1

下载命令

ssc install nmissing


2

导入数据

use 分析师预测数据.dta,clear


3

查看数据

br 


count

可以看出数据一共有1129913


4

查看所有变量的缺失数

nmissing

可以看到每个变量对应的缺失值个数都显示出来了。

5

查看特定变量的缺失数

比如查看变量分析师(analyst)和本期评级(_CurRat)的缺失值个数
nmising analyst _CurRat


6

查看缺失数大于特定值的变量

比如想查看缺失值个数大于1000000个的变量
nmissing ,min(1000000)


注意:查看缺失值个数小于某一值的变量的缺失值,使用nmissing,max()得到的结果是有问题的。

五四青年节也请大家不要放弃学习,快来试试这个小清新命令吧!祝青年节快乐,撸起袖子加油干。

以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~。

应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~

                       文字编辑:强宇曦

技术总编:刘贝贝



往期推文推荐:

1.中国高校财经、管理与综合类期刊灌水排行榜

2.关于RTF你不知道的命令

3.关于RTF你不知道的命令之番外篇

4.免费事件研究,一片片从邮局寄来

5.免费的股价同步性,一片片从邮局寄来

6.Stata叫你回家听音乐了!

7.一言不合就用stata写邮件(Outlook/Foxmail)

8.听说你想知道怎么用stata画地图?

9.I have a Stata, I have a python

10.I have a Stata, I have a Python之二——pdf转word




关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:statatraining@163.com

投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


欢迎关注爬虫俱乐部

微信扫一扫
关注该公众号