在之前的推文中,我们为大家介绍了如何用“套路”批量导入数据文件。那么问题来了,我们要如何对数据进行一些批量处理呢?今天小编又要送大家干货了,跟大家说说如何对数据进行批量合并与缩尾!
(1)数据批量合并:forvalues
原始数据情况(Excel格式)
*批量另存为dta数据
forvalues i=1/9{
clear
import excel 200`i'年行业收入`i'.xls,firstrow clear
save 200`i'年行业收入`i',replace
}
forvalues i=10/13{
clear
import excel 20`i'年行业收入`i'.xls,firstrow clear
save 20`i'年行业收入`i',replace
}
处理后的情况
*批量合并
单个的数据情况
以2001为例,年度数据为5662个观测值:
clear
use 2001年行业收入1,clear
forvalues i=2/9{
append using 200`i'年行业收入`i',force
}
save part,replace
use part,clear
forvalues i=10/13{
append using 20`i'年行业收入`i',force
}
整合的情况
把01-13年的数据整合后为99340:
进一步,删除缺失值情况:
(2)批量缩尾:foreach
处理之前:
foreach v of varlist Cfo Worcpa1 Asset Liabilities Tp Lev{
local a: var lab `v' // 记录变量的标签
winsor `v', gen(`v'_w) p(0.01)
label var `v' "`a'" // 定义变量标签
} //当然stata13和stata14有更新的winsor2,也可实现批量缩尾,详见help文档。
处理之后:
今天的分享就到此了,小编再次感觉到Stata的基础命令功能强大啊,而自己却还是没有好好掌握,不知道你有没有这样的感慨?如果有的话就快关注我们的“爬虫俱乐部”吧! 每天都有新鲜干货等着大家!快关注,快关注,快关注!重要的事情说三遍!
我们团队原来的微信公众号是“数据处理援助中心”,现在正式搬家到“爬虫俱乐部”,欢迎关注。新的公众号开始,我们推出有问必答栏目,对您提出的问题,我们会尽力回答,并通过推文的形式进行发布。我们也欢迎各位粉丝向公众号投稿。
(编辑 @强宇曦)
欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:xueyuan19920310@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”
3)如果大家遇到关于stata处理分析数据的问题,也可以给该邮箱写邮件,邮件名称为“提问”+“问题名称或者关键词”,我们会在后期的推文里给予解答
长按二维码关注公众号
微信扫一扫
关注该公众号