大 大大大大新闻————自公众号推送视频讲解环节以来,深受广大读者朋友的喜爱。近日向我们提问的粉丝也是大幅增加呐!为了便捷管理相关信息,提高工作效 率,我们对提问方式做了略微调整哟~提问者需点击推文底部“阅读原文”下载爬虫俱乐部用户问题登记表并按要求填写后发送至邮箱 statatraining@163.com,我们会及时为您解答哟~
表情包乃居家暖群水群必备之物,每当你换手机时最心疼的是什么,不是照片不是文件,而是珍藏多年价值几个亿的表情包。让小编用tokenize带大家定制属于自己独一无二的表情包吧!
一、tokenize作用和语法
我们可以看出tokenize后面可以加字符串,它的作用是默认以空格分隔放入自然数的宏里。tokenize还有个parse()的选项,小编将会在后面的例子中展示parse()的具体用法和作用。
二、tokenize实例展示
赶紧进入跟着小编进入tokenize的世界。键入以下命令:
clear
tokenize "爬虫俱乐部, very good, number 1"
di `"1=|`1'|, 2=|`2'|, 3=|`3'|, 4=|`4'|, 5=|`5'|
运行结果如下:
从上图可以看出tokenize默 认以空格分隔,并消耗空格。把字符串“爬虫俱乐部, very good, number 1”按空格分成“爬虫俱乐部,”,“very”,“good,”,“number”,“1”五个部分分别放入宏 `1’,`2’,`3’,`4’,`5’。在我们后面的程序中我们就可以调用这些宏了。
接下来,我们就把字符串放入宏里,键入以下命令:
local str "爬虫俱乐部, very good, number 1"
tokenize "`str'"
di `"1=|`1'|, 2=|`2'|, 3=|`3'|, 4=|`4'|, 5=|`5'|,6=|`6'|, 7=|`7'|"'
运行结果如下:
可以看出,我们把字符串“爬虫俱乐部, very good, number 1”放入宏`str’中,然后通过tokenize命令放入宏`1’,`2’,`3’,`4’,`5’中,得到的结果是一样的。
接下来,让我们看看parse()这个选项的妙用吧!键入以下命令
tokenize "`str'",parse(",")
di `"1=|`1'|, 2=|`2'|, 3=|`3'|, 4=|`4'|, 5=|`5'|,6=|`6'|, 7=|`7'|"'
tokenize "`str'",parse(" ,")
di `"1=|`1'|, 2=|`2'|, 3=|`3'|, 4=|`4'|, 5=|`5'|,6=|`6'|, 7=|`7'|"'
运行结果如下:
可以看出,如果选择以字符“,”分隔的话,并不会消耗字符“,”;如果以“ ,”(空格+逗号)作为分隔,意思就是说用“ ”(空格)和“,”进行分隔。选项parse()的意思是用里面每一个字符进行分隔。
三、用tokenize生成表情包
各位读者是不是看的不过瘾。笔者有一个非常喜欢的表情包。如下图:
不就表情包吗?小case,笔者这就教你用tokenize做表情包。键入以下命令:
clear
local a "你 不 要 乱 来"
tokenize `a'
local num `=wordcount("`a'")'
set obs `num'
gen v = "`a'" in 1
在程序里,tokenize和wordcount就像一对情侣,是不分家的,tokenize把字符串放入自然数的宏里,命令wordcount()是算出以空格为分隔的字符串个数。然后方便后面加入循环。
客官不用急,这就给大家带来神奇的循环,感受程序的精彩之处.我们的想法是,把字符串“你 不 要 乱 来”每次去掉第一个字,你就能感受到中文的博大精深之处。键入以下命令:
forvalues i = 2(1)`num'{
replace v = ustrregexra(v[`i'-1],"``=`i'-1'' ","") in `i' //在上一行的基础上,把第一个字和空格替换成空
}
format v %-19s
list,sep(0)
运行结果如下:
你们还在qq、微信斗图吗?太low了!赶紧和小编用stata斗图把!领略高端大气上档次的stata斗图世界。
什么?!没看懂!!不要紧!!戳下面,听爬虫小将的详细讲解,也欢迎大家的批评指正哟!
以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~。另外,我们开通了苹果手机打赏通道,只要扫描下方的二维码,就可以打赏啦!
应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~
文字编辑:王 悦
技术总编:刘贝贝
往期推文推荐:
5.爬虫俱乐部又出新命令了——wordconvert转换你的word文件
6.putdocx+wordconvert—将实证结果输出到Word(.docx)文档
7.Stata 15之Markdown——没有做不到,只有想不到!
关于我们
微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。
欢迎关注爬虫俱乐部
微信扫一扫
关注该公众号