你会用saveascii保存数据吗?

2017-02-22 李子健 爬虫俱乐部 爬虫俱乐部

还记得之前我们介绍的saveold命令吗?能够将stata14储存的文件,用stata13或者更低版本打开并使用。但是如果文件中变量、标签以及观测值包含中文,我们还能够用低版本的stata软件浏览高版本的stata存储的文件吗?答案就在这篇推文里。

我们以 行政区划.dta 文件为例,其变量、标签以及观测值包含中文。

当我们使用之前介绍过的saveold命令,将以stata14储存的文件保存为可以用stata13版本乃至更低的版本打开,输入命令:

saveold C:\Users\李子健\Desktop\行政区划.dta,replace

我 们用stata13打开,发现所有的中文变量标签以及观测值都成为了乱码。因此我们不仅仅需要将其由高版本转换为低版本可打开的文件,还需要转码。由于在 stata14中我们的中文字符是以Unicode编码,而stata13以及更低版本识别以GB18030编码,所以转码能够将文件拓展为以ASCII 编码的数据。

现在就该是命令saveascii闪亮登场的时候啦!该命令在更高版本的stata软件使用,能够将文件保存为更低版本的软件识别并打开,同时能够转码。

首先需要安装命令saveascii:

ssc install saveascii

saveascii命令在stata14中使用,能够将文件保存为stata13以及更低的版本中(stata12/stata11),并将其中所有的unicode字符扩展为ASCII编码的字符。

我们查看下saveascii命令的help文件:

saveascii命令与saveold命令用法相似,后跟需要命名的dta文件名字(filename),并且saveascii命令有几个高级选项,需要强调的是encoding选项。转码需要用到该选项,encoding后加需要转换的编码。

这里我们再次将 行政区划.dta 的文件保存为可以用stata13版本乃至更低的版本中(stata12/stata11)打开:

saveascii C:\Users\李子健\Desktop\行政区划.dta,enc(gb18030) replace

现在我们看到数据中中文字符变量以及标签能够在stata13中显示出来啦。命令虽小,却很是实用哟~


接下来是空气质量报告

全国空气质量如下

山西的朋友们出门记得戴口罩哟


以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~,点赞打赏随您心意,么么哒~

应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~


文字编辑:徐苾雯

技术总编:刘贝贝



往期推文推荐:

1.合并输出回归结果和其他检验结果——esttab和estadd

2.关于RTF你不知道的命令

3.关于RTF你不知道的命令之番外篇

4.免费事件研究,一片片从邮局寄来

5.免费的股价同步性,一片片从邮局寄来

6.Stata叫你回家听音乐了!

7.一言不合就用stata写邮件(Outlook/Foxmail)

8.玩转stata之调用浏览器

9.I have a Stata, I have a python

10.I have a Stata, I have a Python之二——pdf转word



关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:

xueyuan19920310@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

欢迎关注爬虫俱乐部

微信扫一扫
关注该公众号