python 使用 selenium 爬取中国福利彩票双色球历史中奖号码

前期准备
版本:python3
模块:selenium、time、pprint
一开始使用的是 tree 的方式获取数据,但发现数据获取为空,中奖号码为动态生成数据,无法直接获取,使用采用selenium的方式获取数据。

from selenium import webdriver
import time
import pprint
browser = webdriver.Chrome()
browser.get('http://www.cwl.gov.cn/kjxx/ssq/kjgg/')
clicks = browser.find_element_by_xpath('/html/body/div[1]/div/div[2]/div[2]/dl/dd/ul/li[3]')
time.sleep(1)
clicks.click()
time.sleep(1)
arr = []
for i in range(90):text = browser.find_element_by_xpath('/html/body/div[1]/div/div[3]/table/tbody/tr[{}]'.format(i+1))arr.append(text.text.split(' '))
toArr = []
for list in arr:obj = {'red': list[2],'blue': list[3]}toArr.append(obj)pprint.pprint(toArr)

代码很简单,没有多少行,主要目的是搞清楚 selenium 的使用方法。下面是效果图:

可以把数据写入到 excel 表格,方法很简单,这里就不描述了

python 使用 selenium 爬取中国福利彩票双色球历史中奖号码相关推荐

  1. python使用selenium爬取联想官网驱动(一):获取遍历各驱动的下载网址

    python使用selenium爬取联想官网驱动(一):获取遍历各驱动的下载网址然后wget命令试验下载 由于初期学习,所以先拿一个型号的产品驱动试验. (1)以下为在联想某型号产品获取相关驱动下载的 ...

  2. python爬取本地天气信息_用Python写一个爬取中国天气网的终端版天气预报爬虫

    导语 前几篇文章介绍了爬取静态网站的主要方法.今天写一个小项目实践一下.本项目可以在终端窗口查询全国3400多个区县的当日天气信息和近七天天气信息. 实现效果 [Python爬虫]写一个爬取中国天气网 ...

  3. [python爬虫] Selenium爬取内容并存储至MySQL数据库

    前面我通过一篇文章讲述了如何爬取CSDN的博客摘要等信息.通常,在使用Selenium爬虫爬取数据后,需要存储在TXT文本中,但是这是很难进行数据处理和数据分析的.这篇文章主要讲述通过Selenium ...

  4. Python爬虫——selenium爬取网易云评论并做词云

    大家好!我是霖hero 到点了上号网易云,很多人喜欢到夜深人静的时候,在网易云听音乐发表评论,正所谓:自古评论出人才,千古绝句随口来,奈何本人没文化,一句卧槽行天下!评论区集结各路大神,今天我们来爬取 ...

  5. python用selenium爬取b站评论并制作词云图

    文章目录 前言 一.爬取b站评论 1.selenium配置 2.代码 二.制作词云图 1.下载停用词 2.代码 3.注意事项 三.制作成品 1.初期成品 2.成品 前言 b站视频下的评论是下拉加载的. ...

  6. [python爬虫] selenium爬取局部动态刷新网站(URL始终固定)

    在爬取网站过程中,通常会遇到局部动态刷新情况,当你点击"下一页"或某一页时,它的数据就进行刷新,但其顶部的URL始终不变.这种局部动态刷新的网站,怎么爬取数据呢?某网站数据显示如下 ...

  7. python用selenium爬取网页数据_Python项目实战:使用selenium爬取拉勾网数据

    " 一切不经过项目验证的代码都是耍流氓,今天我们就通过一个简单的招聘网站的数据归档进行当前热门岗位的大数据分析,最后以wordcloud进行显示.本文为数据爬取篇." 项目准备: ...

  8. python中国大学排名爬虫写明详细步骤-Python爬虫——定向爬取“中国大学排名网”...

    内容整理自中国大学MOOC--北京理工大学-蒿天-Python网络爬虫与信息提取 相关实战章节 我们预爬取的url如下 网页节选 在浏览器中读取网页源代码 可以 发现表格数据信息是直接写入HTML页面 ...

  9. Python爬虫-selenium爬取网易云歌单

    文章目录 (一)工欲善其事必先利其器-安装工具 Selenium 浏览器 (二)实战 (一)工欲善其事必先利其器-安装工具 Selenium Selenium是一个强大的网络数据采集工具,其最初是为网 ...

最新文章

  1. debian虚拟机装上后开机不行_华为MT9进水不开机, 一步一个“坑”把掌柜修的也是无语,想发火...
  2. 关于全国大学生智能汽车竞赛有关问题的建议
  3. 转】R利剑NoSQL系列文章 之 Hive
  4. 【SVM】A Practical Guide to Support Vector Classication
  5. [BZOJ1030] [JSOI2007]文本生成器
  6. linux执行指定程序的命令,linux 下使用指定的用户来执行命令
  7. 【渝粤教育】广东开放大学 国际私法 形成性考核 (41)
  8. 前端学习入门,如何系统的学习前端?
  9. java解析ceb文件_什么是Java的平台无关性
  10. 主席树初探--BZOJ1901: Zju2112 Dynamic Rankings
  11. 基于httpd的mod_deflate模块
  12. sublime Text2 2.0.2 build 2221 64位 破解(已测试)
  13. ubuntu 中安装 Redis
  14. ftp服务器查看所有文件夹,查看ftp服务器所有文件夹
  15. python计算bmi的编程_Python学习-计算BMI的小程序
  16. 深入探究js中无所不在的this
  17. 交换a,b值的三种方法
  18. Java抽奖小游戏(包含代码)
  19. Linux实用的快捷键
  20. 力扣刷题-python-回溯算法-1(回溯算法模板、题型)

热门文章

  1. 进程程序替换((>_<)子进程跑了),模拟编写一个入门shell
  2. 程序员每天必逛的5个技术网站,你用过几个?
  3. 网络编程-Socket套接字(TCP、UDP、广播和组播通信)
  4. perc s100 linux,PERC S100_S300 配置手册
  5. MySQL-select-视图-函数-事务-存储方式
  6. 三谈exception——错误处理
  7. 【PC工具】在线格式转换工具,在线智能抠图工具,在线视频、图片、音频等转换工具,绿色免安装抠图神奇抠图工具
  8. 如何使3dMax运行的更快、更稳?
  9. python canny 保留指定区域的轮廓线_opencv python:Canny边缘提取
  10. 动态渲染select下拉框选中状态