本文作者:宁刘莹

文字编辑:李婷婷

技术总编:张计宝

Stata云端培训课程在腾讯课堂上线啦!

爬虫俱乐部于2020年7月中旬在线上举行的Stata编程技术培训课程在腾讯课堂上线啦!课程通过案例教学模式,帮助学员在短期内掌握Stata的基本命令、编程、数据处理以及结果输出等技术,并对Stata16的实用新功能做了详细介绍。

现在关注公众号并在朋友圈转发推文,即可获得600元课程优惠券,集赞50个再领200元课程优惠!(截图发至本公众号后台领取)原价2400元的课程,现在只要1600元!

导读

股票代码是上市公司股票的编码,通常以六位数的格式显示,但在实际研究过程中,我们时常会遇到数据中股票代码并不是六位数的情况,这时我们可以用Stata在数字前面补0直到补齐六位数为止。根据不同的情形,使用的方法也是不同的,本文将根据几种不同的需求介绍不同的方法。(一) cntrade和cnstock命令自动帮忙补全首先,如果使用cntrade或者cnstock命令来直接获取上市公司交易数据或股票代码时,股票代码会自动在Stata内存中显示为六位数的格式,即使你输入cntrade 1,Stata也会了解你想下载的是股票代码为000001的交易数据。

(二) 数据库中下载的数据

如果从数据库中下载的数据导入Stata后发现不足六位,根据数值型和字符型两种需求,有这样三种方法:1.若想将股票代码保存为六位数的数值型变量,最简便也是最容易想到的,就是使用format命令:

format stkcd %06.0f

百分号后面的第一个零表示如果数字不足六位,则在数字前面补0。2.若想将股票代码保存为六位数的字符型变量,有两种方法:第一种是使用string函数:

replace stkcd = string(stkcd, "%06.0f")

第二种是使用tostring命令并配合format选项:

tostring stkcd,format(%06.0f) replace

(三) 在爬虫中的具体案例

以爬取新浪公告为例,我们观察新浪财经网页上市公司公告的页面链接发现,通过对股票代码和页码分别进行循环,就可以抓取不同上市公司每一页的公告了。

我们使用cnstock命令获取上市公司股票代码并随机保留十家,通过定义局部宏来储存这十个股票代码,并查看一下我们储存在宏里的代码:

clear allcnstock allerase cnstock.dtasample 10, countlevelsof stkcd, local(stkcd) foreach i in `stkcd' {    di `i'}

可以发现,并不是所有数字都是以六位数的格式显示的,那么直接循环抓取的话,多半是会发生错误的。我们知道,levelsof命令有一个返回值r(levels),里面存储着所遍历变量的值。因此我们也可以通过定义局部宏的方法,对返回值r(levels)里储存的股票代码进行补全:

clear allcnstock allerase cnstock.dtasample 10, countlevelsof stkcd disp `"`r(levels)'"'foreach stk in `r(levels)' {while length("`stk'")<6{ local stk 0`stk'} //这个while循环的作用是:长度不足六位的数字,就在面前补0,直到补足六位为止forvalue p=1/3 { //假定对于每家上市公司,我们只爬取前三页的公告disp `p'qui copy "http://vip.stock.finance.sina.com.cn/corp/view/vCB_AllBulletin.php?stockid=`stk'&Page=`p'" temp.txt, replace qui infix strL v 1-20000 using temp.txt, clear //将爬取的公告读入stata内存中save `stk'_`p', replace}}

这样,每家上市公司前三页的公告,都被成功抓取了下来。如果您还知道更多补齐股票代码的方法,欢迎在评论区留言交流~对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!往期推文推荐

明星闪闪亮:各校高被引论文

高校经管类核心期刊发文排行榜|2010-2019

PDF图片提取PDF文档转换成图片

split和nsplit助你轻松拆分

集成学习介绍之三——Stacking算法

PyMuPDF提取文本信息

Mylabels命令介绍

用WordStat看中国日报新闻  

数据集的划分——交叉验证法

大数据视角下的大学录取分数排行集成学习介绍之二——Boosting算法

PDF文本信息提取(二)

取长补短、互通有无 ——集成学习介绍之Bagging &随机森林PDF表格信息提取神经网络——brainmarktouse标记使用变量

关于我们

微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。投稿邮箱:statatraining@163.com投稿要求:1)必须原创,禁止抄袭;2)必须准确,详细,有例子,有截图;注意事项:1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。2)邮件请注明投稿,邮件名称为“投稿+推文名称”。3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

代码补全_补全股票代码位数的一百种姿势相关推荐

  1. python股票代码示例_补全股票代码位数的一百种姿势

    本文作者:宁刘莹 文字编辑:李婷婷 技术总编:张计宝Stata云端培训课程在腾讯课堂上线啦!爬虫俱乐部于2020年7月中旬在线上举行的Stata编程技术培训课程在腾讯课堂上线啦!课程通过案例教学模式, ...

  2. Unity3dRPG 相机跟随player旋转_运动相机支架设计的16种姿势,必能拍好小片!

    短视频火热的当下, 身边的朋友都开始用视频app, 来记录生活中的点点滴滴, 甚至开始营销自己. 短视频除了软件操作并不繁琐, 而且还有很多简单易用的设备及配件. 今天苏苏要介绍的, 就是一款便携小巧 ...

  3. dev c++代码自动补全_让代码自动补全的全套流程

    作者: 熊唯,黄飞 ,腾讯 PCG/QQ研发中心/CV应用研究组 AI 如果真的可以写代码了,程序员将何去何从?近几年,NLP 领域的生成式任务有明显的提升,那通过 AI 我们可以让代码自动完成后续补 ...

  4. 【IDEA快捷键】IntelliJ IDEA 设置代码提示或自动补全的快捷键 (附IntelliJ IDEA常用快捷键)-2018.12.18-#转#

    –[转]:原博主博客链接_@jiaxian17 IntelliJ IDEA 设置代码提示或自动补全的快捷键 (附IntelliJ IDEA常用快捷键) 修改方法如下: 点击 文件菜单(File) –& ...

  5. python sublime 提示补全_【原创】Sublime+Verilator建立强大的verilog编写环境

    前言(没必要看) --子曰:工欲善其事,必先利其器. 写个水文不容易,转载请注明,谢谢了... 在写这篇水文之前,我一直在用UE(UtralEdite)编写Verilog代码,使用习惯了之后,感觉很方 ...

  6. android 自动补全方法,# AndroidStudio代码块的自动补全

    AndroidStudio代码块的自动补全 settings --> Editor --> Live Templates * 定义一个私有的内部类,在第一次用这个嵌套类时,会创建一个实例. ...

  7. IDEA 设置代码提示或自动补全的快捷键

    IDEA 设置代码提示或自动补全的快捷键 (附IntelliJ IDEA常用快捷键) 修改方法如下: 点击 文件菜单(File) –> 点击 设置(Settings- Ctrl+Alt+S), ...

  8. vim插件自动补齐_(转)Vim自动补全神器:YouCompleteMe

    原文出处:http://blog.jobbole.com/58978/ 第一次听说这个插件还是在偶然的情况下看到别人的博客,听说了这个插件的大名.本来打算在实训期间来完成安装的,无奈网实在不给力,也就 ...

  9. 安装vimplus实现c++代码高亮与自动补全功能的若干问题

    安装vimplus实现c++代码高亮与自动补全功能的若干问题 1.按照vimplus官方的手册安装 git clone https://github.com/chxuan/vimplus.git ~/ ...

最新文章

  1. Java中的intern变量的讲解
  2. 微信小程序开发系列一:微信小程序的申请和开发环境的搭建
  3. AI:大力出奇迹?Bigger is better?AI下一代浪潮?—人工智能的大语言模型(LLMs)的简介、发展以及未来趋势
  4. 使用FlowDroid生成Android应用程序的函数调用图
  5. 2019牛客暑期多校训练营(第九场)
  6. 【BZOJ4554】游戏(二分图匹配,网络流)
  7. Caffe学习:Blobs, Layers, and Nets
  8. 点云数据处理实现Qt界面常用功能
  9. 2014Esri全球用户大会之ArcGIS Online
  10. Unity3D游戏开发中相见恨晚的动画插件
  11. list之按照中文拼音首字母排序
  12. ajax批量上传数据,Ajax上传数据和上传文件(三种方式)
  13. 经纬度转换 gcj02转wgs84
  14. 【CGAL_几何内核】2D和3D线性几何内核
  15. 杭电出了“王炸班”!考研3个清北8个浙大,就业人均起薪30万+
  16. python求主析取范式_求公式q→(r∧p)的析取范式。
  17. kafka-分区重分配及相关源码分析
  18. 【tensorflow学习之路】如何使用gpu进行运算
  19. Windows查看网络连接并清理缓存
  20. Python正则匹配一招完整去除文本中的各类表情符号

热门文章

  1. 同一个SQL语句,为啥性能差异咋就这么大呢?
  2. 数据智能知多少?(超大礼包等你拿)
  3. 我用MRS-ClickHouse构建的用户画像系统,让老板拍手称赞
  4. 如果云是水滴,Kubernetes就是水滴管理平台
  5. 【华为云技术分享】如何用交互式特征工程工具进行数据分析处理
  6. 【华为云技术分享】Linux内核发展史 (2)
  7. 即将到来的“分布式云”(DPaaS):分布式计算+ DB +存储即服务
  8. 弹性文件服务解密 -- 块存储、文件存储、对象存储的区别
  9. linux查进程内存问题,关于linux下内存问题排查的工具
  10. go实现文件服务器,golang文件服务器的两种方式(可以访问任何目录)