诸君安。
之前曾有一个朋友在处理数据时遇到一个很有意思的小问题,问题是这样的,他在用bysort求最大最小值时,求出的最大值和最小值是错误的!
bysort GENE:egen max=max(START)
bysort GENE:egen min=min(START)
大家发现错误了么?AAAS组的最大值为53715207,可求出来的是53715208,大1!AAAS组的最小值为53701482,可求出来的是53701480,小2!
诊断与化解
这个问题出现的原因是什么呢?这位朋友强调,他考虑过是否是科学计数法的问题,也调整过数据格式,但问题依旧没有解决。
就在他怀疑自己是不是用了假的命令,求出了假的最大最小值时,爬虫酱只做了一点点变化,便解决了这个问题!
bysort GENE:egen long max=max(START)
bysort GENE:egen long min=min(START)
这样我们发现生成的最大最小值没有问题,而这一切,都只是因为在egen后面加了个long。
这 位朋友的问题确实是科学计数法导致的,虽然修改了数据的格式,但是是在已经生成了数据之后才用format来修改的,而在egen的时候,生成的数据是 float浮点型,已经受到了科学计数法的影响了。所以我们只需要在egen后面跟上long,设定生成的变量的格式是长整型的数值型变量就可以解决问 题。
注意事项
需要注意的是,长整型数据的范围是-2,147,483,647到2,147,483,620,在这个范围内可以调成长整型,超出这个范围必然会成为科学计数法,就不可以用长整型了。
接下来报告空气质量
全国空气质量如下图
青海的朋友们请保重
以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~,点赞打赏随您心意,么么哒~
应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~
编辑by梅洁瓷傲
往期推文推荐:
1.合并输出回归结果和其他检验结果——esttab和estadd
7.一言不合就用stata写邮件(Outlook/Foxmail)
9.I have a Stata, I have a python
10.I have a Stata, I have a Python之二——pdf转word
关于我们
微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:xueyuan19920310@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。
欢迎关注爬虫俱乐部
微信扫一扫
关注该公众号