前言:

编写一个爬虫脚本,用于爬取东方财富网的上海股票代码,并通过爬取百度股票的单个股票数据,将所有上海股票数据爬取下来并保存到本地文件中

系统环境:

64位win10系统,64位python3.6,IDE位pycharm

预备知识:

BeautifulSoup的基本知识,re正则表达式的基本知识

代码:

代码解释:

第一个getHTMLText函数的作用是获得所需的网页源代码

第二个getStockList函数的作用是获得东方财富网上面上海股票的全部代码,查看网页源代码可知,股票代码的数据放在'a'标签里面,如下图所示:

因此,首先用find_all方法遍历所有'a'标签,然后在'a'标签里面提取出href部分信息,在提取出来的href信息里面,用正则表达式匹配所需的信息,“shd{6}”,即徐亚匹配例如sh200010的信息

第三个函数需要根据第二个函数得到的股票代码,拼接出一个url,在这个特定的url的网页里,使用第一个函数解析网页,首先加一个判断,如果遇到html为空,那么要继续执行下去,同样,我们也需要再加一个判断(关键之处),遇到网页不存在,

但html源代码仍然是存在的,因此接下去这个命令

stockInfo = soup.find('div',attrs = {'class':'stock-bets'})

可能为空,如果不加判断,程序执行到这里就会报错而无法继续执行,因此添加:

if stockInfo == None:

continue

mysql 数据为空 none 网页显示空白_用python爬虫爬取股票数据相关推荐

  1. python如何爬虫股票数据_用python爬虫爬取股票数据

    前言: 编写一个爬虫脚本,用于爬取东方财富网的上海股票代码,并通过爬取百度股票的单个股票数据,将所有上海股票数据爬取下来并保存到本地文件中 系统环境: 64位win10系统,64位python3.6, ...

  2. python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一)

    python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二.数据清洗及存储) 爬起疫情数据,有两个网址: 1.百度:链接 2.丁香园疫情:链接 在这两个中,丁香园的爬虫相对简单一点,所以今天就展示一 ...

  3. python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二)

    上一章: python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一.爬虫思路及代码) 第三步:数据清洗 清洗数据很简单,就是数据太乱的话,就得花些时间,所以一定要有一个好的方法,才能避免在清洗数据 ...

  4. python爬虫数据分析可以做什么-python爬虫爬取的数据可以做什么

    在Python中连接到多播服务器问题,怎么解决你把redirect关闭就可以了.在send时,加上参数allow_redirects=False 通常每个浏览器都会设置redirect的次数.如果re ...

  5. Python爬虫爬取疫情数据并可视化展示

    这篇文章主要介绍了Python利用爬虫爬取疫情数据并进行可视化的展示,文中的示例代码讲解清晰,对工作或学习有一定的价值,需要的朋友可以参考一下.编程资料点击领取 目录 知识点 开发环境 爬虫完整代码 ...

  6. MATLAB爬虫爬取股票数据

    近年来,大数据盛行,有关爬虫的教程层次不穷.那么,爬虫到底是什么呢? 什么是爬虫? 百度百科是这样定义的: 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种 ...

  7. java爬虫抓取nba_利用Python爬虫爬取NBA数据功能实例分享

    Python实现爬虫爬取NBA数据功能示例 本文实例讲述了Python实现爬虫爬取NBA数据功能.分享给大家供大家参考,具体如下: 爬取的网站为:stat-nba.com,这里爬取的是NBA2016- ...

  8. 知识星球《玩转股票量化交易》之 爬虫爬取股票数据

    量化交易是一个多技术综合的项目,学习完书籍<Python股票量化交易从入门到实践>我们再次升级学习的内容--知识星球<玩转股票量化交易> 在星球中我们会深入分享包括Python ...

  9. python爬网站数据实例-利用Python爬虫爬取NBA数据功能实例分享

    Python实现爬虫爬取NBA数据功能示例 本文实例讲述了Python实现爬虫爬取NBA数据功能.分享给大家供大家参考,具体如下: 爬取的网站为:stat-nba.com,这里爬取的是NBA2016- ...

最新文章

  1. RedHat的yum源修改为CentOS的yum源
  2. PHP7 - MongoDB Driver 使用心得
  3. Gartner发布2021年低代码魔力象限,Mendix名列前位
  4. 局域网不能进入别人的共享
  5. SimpleDet: 一套简单通用的目标检测与物体识别框架
  6. 数据库运作实践三三之歌(秘制口诀)
  7. [Rust]cargo run时error: linker `link.exe` not found
  8. ​iPhone 12全线跌破发行价;三星扩大众包定位网络;Fedora 33发布|极客头条
  9. 面试指南(二):想跳槽,这些技术点你会了吗?
  10. mac 启用root用户
  11. 1. 其他的一些加速 性能提升模式 1 2. 乱序执行技术 2 2.1. 处理器乱序执行 2 2.2. 编译器指令重排 3 2.3. 乱序的分类 3 2.4. 允许程序员显式的告诉处理器对某些地方禁止
  12. Beyond compare vs kdiff3
  13. JAVA MONGODB 查询时间段
  14. SkyForm CMP同Mirantis OpenStack兼容测试
  15. 2021年中国医药工业经济运行现状及行业发展建议:主营业务收入、利润总额整体递增,建议加大监管,引导产业良性发展[图]
  16. Adobe Illustrator CC 关于路径查找器的使用
  17. 用#define宏实现Add函数
  18. centOS7,vsftpd,更改默认目录后nginx访问失败,403forbidden解决
  19. 专访机器学习祖师爷 Tom Mitchell:带着理性拥抱机器学习的热潮
  20. windows10计算机无法启动不了,win10无法启动

热门文章

  1. 思科推出EnergyWise合作伙伴计划
  2. 配置Git绑定Git@OSC
  3. 我的Java开发学习之旅------Base64的编码思想以及Java实现
  4. AngularJS开发指南4:指令的详解
  5. 解决SpringMVC中的 Could not find acceptable represent
  6. 负载均衡故障诊断:一个MSS值引发的疑案
  7. 802.11 Power Save(节电/省电/节能)机制总结
  8. CSP认证201604-2 俄罗斯方块[C++题解]:模拟、枚举
  9. opencv鼠标操作,画矩形
  10. java条件配置,三、使用JAVA必备条件—环境配置