命令tips(二):数据批量合并与缩尾

2016-09-20 尹兴强 爬虫俱乐部 爬虫俱乐部

在之前的推文中,我们为大家介绍了如何用“套路”批量导入数据文件。那么问题来了,我们要如何对数据进行一些批量处理呢?今天小编又要送大家干货了,跟大家说说如何对数据进行批量合并与缩尾!


1)数据批量合并forvalues


原始数据情况(Excel格式)

*批量另存为dta数据

forvalues i=1/9{

clear

import excel 200`i'年行业收入`i'.xls,firstrow clear

save 200`i'年行业收入`i',replace

}

 

forvalues i=10/13{

clear

import excel 20`i'年行业收入`i'.xls,firstrow clear

save 20`i'年行业收入`i',replace

}

处理后的情况

*批量合并

单个的数据情况

2001为例,年度数据为5662个观测值:

clear

use 2001年行业收入1,clear

 forvalues i=2/9{

 append using 200`i'年行业收入`i',force

 }

save part,replace

use part,clear

 forvalues i=10/13{

 append using 20`i'年行业收入`i',force

 }

整合的情况

01-13年的数据整合后为99340

进一步,删除缺失值情况:


(2)批量缩尾:foreach


处理之前:


foreach v of varlist  Cfo  Worcpa1  Asset  Liabilities  Tp  Lev{

local a: var lab `v'  // 记录变量的标签

winsor `v', gen(`v'_w)  p(0.01)

label var `v' "`a'"   // 定义变量标签

}  //当然stata13stata14有更新的winsor2,也可实现批量缩尾,详见help文档。

处理之后:


今天的分享就到此了,小编再次感觉到Stata的基础命令功能强大啊,而自己却还是没有好好掌握,不知道你有没有这样的感慨?如果有的话就快关注我们的“爬虫俱乐部”吧! 每天都有新鲜干货等着大家!快关注,快关注,快关注!重要的事情说三遍!


我们团队原来的微信公众号是“数据处理援助中心”,现在正式搬家到“爬虫俱乐部”,欢迎关注。新的公众号开始,我们推出有问必答栏目,对您提出的问题,我们会尽力回答,并通过推文的形式进行发布。我们也欢迎各位粉丝向公众号投稿。

(编辑 @强宇曦)


欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:xueyuan19920310@163.com 

投稿要求:

1)必须原创,禁止抄袭;

2)必须准确,详细,有例子,有截图;

注意事项:

1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名。

2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”

3)如果大家遇到关于stata处理分析数据的问题,也可以给该邮箱写邮件,邮件名称为“提问”+“问题名称或者关键词”,我们会在后期的推文里给予解答

长按二维码关注公众号


微信扫一扫
关注该公众号