一.labone
我 们在使用数据时,标签是帮助我们迅速了解数据的一个很好途径,很多数据库导出的数据,前面几行都是变量说明,适合作为Label。比如:Wind数据库、 国泰安数据库等。如何将前面几行作为变量的label?stata中也有专门定义标签的命令——label,但是当需要定义的标签比较多时,这个命令就会 显得有些繁琐,一般需要借助循环。之前的推文“用套路处理数据”中我们用了excel批量定义标签,但其实有个命令比这方法更简单——labone
(1)准备工作
labone是外部命令,需要事先下载,命令为:
ssc install labone,replace
(2)命令格式
这个命令是把某行数据作为变量的标签,命令格式为
labone [varlist] [,options]
小贴士:
(1)如果没有指定特定的变量varlist,则默认值为全部变量
(2)Options选项有几个常用的:
nrow(numlist) :这个选项是指定把哪一行数据的内容变成某个变量或全部变量的标签, 例如,labone ,nrow(1)是把第一行作为变量标签;labone ,nrow(1 2)是把第一、二行作为变量标签,两行内容之间用空格连接;如果没有指定,默认把第一行数据作为标签
concat(concat_strings):通过某个特定字符, 把不同行的数据内容连接起来,如果没有指定,默认通过空格连接
nospace :在把某两行内容一起作为标签时,中间没有空格
我们以从国泰安数据库下载的数据为例,首先把数据导入stata中,
import excel using F:\国泰安数据库\上市公司财务报表数据库\资产负债表\FS_Combas.xls, //
firstrow case(lower) clear
导入的数据格式如下:
我们想把第一行作为变量的标签,命令为:
labone,nrow(1) //把第一行作为变量标签
如果想把第一行和第二行的内容作为变量标签,命令如下:
labone,nrow(1 2) //把第一、二行作为变量标签
可以看到两行内容之间用空格作为分隔,如果不想要空格,可以几个nospace选项,也可以用concat选项指定特定的分隔符,比如,我想用”/”作为分隔符,命令为:
labone,nrow(1 2) concat(/) //把第一、二行作为变量标签,其中这两行之间用/连接
二.nrow
这个命令是把某一行的内容作为变量名称,与labone一样是外部命令,使用前需要安装:
ssc install nrow,replace
它的命令格式为: nrow [row#] [, keep varlist(varlist)]
下面通过例子来感受一下这个命令带来的方便。
1.有一个数据如下,我想把第一行作为变量名,可以借助nrow命令
nrow //把第一行作为变量名,且把原来的第一行删除
2.我们发现,进行上述操作之后,原来的第一行被删除了,那如果我想保留原来的第一行,可以加上keep选项
nrow,keep//把第一行作为变量名,并保留原来的第一行
3.如果我只想把第一行作为前两个变量的变量名,第二行作为第三个变量的变量名,可以借助varlist选项
nrow, varlist(A B) keep //把第一行作为变量A、B的名称,且保留原来的第一行
nrow 2,varlist(C ) keep //把第二行作为变量C的名称,且保留原来的第二行
今天给大家介绍的两个小命令是处理从一些数据库中下载的数据的一个非常好用的利器,这两个命令把很多繁琐的程序变得非常简单,大家不妨试试吧!
接下来报告空气质量
全国空气质量如下
今天
且看京都
绿意盎然
以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~,点赞打赏随您心意,么么哒~
应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~
编辑 by司海涛
往期推文推荐:
1.合并输出回归结果和其他检验结果——esttab和estadd
7.一言不合就用stata写邮件(Outlook/Foxmail)
9.I have a Stata, I have a python
10.I have a Stata, I have a Python之二——pdf转word
关于我们
微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:xueyuan19920310@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。
欢迎关注爬虫俱乐部
微信扫一扫
关注该公众号