python爬虫抓取双色球_Python爬虫练习:爬取双色球每期的中奖号码,看能不能中奖...
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
以下文章来源于CSDN ,作者嗨学编程
确定URL 请求网页
http://www.cwl.gov.cn/cwl_admin/kjxx/findDrawNotice?name=ssq&issueCount=100
import requests
url = 'http://www.cwl.gov.cn/cwl_admin/kjxx/findDrawNotice?name=ssq&issueCount=100'
headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}response = requests.get(url=url, headers=headers)print(response)'''
运行结果:
'''
print(reponse.text)'''
发现并没有数据返回,所有headers的参数改加的都要加
'''
headers = {
'Host': 'www.cwl.gov.cn',
'Referer': 'http://www.cwl.gov.cn/kjxx/ssq/kjgg/',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
解析数据
解析json数据就和剥洋葱一样,根据字典的取值方法来,非常的简单
result = html_data['result']
dit = {}for i in result:
dit['期号'] = i['code']
dit['开奖日期'] = i['date']
dit['红球'] = i['red']
dit['蓝球'] = i['blue']
dit['中奖纪录'] = i['content']
print(dit)'''
运行结果:
{'期号': '2019142', '开奖日期': '2019-12-10(二)', '红球': '08,14,24,27,29,33', '蓝球': '09', '中奖纪录': '河北1注,江苏1注,浙江1注,福建5注,广西1注,新疆5注,共14注。其中一等奖特别奖为:河北1注,江苏1注,福建5注,广西1注,新疆5注;一等奖普惠奖为:浙江1注。'}
'''
数据保存
咱们把要的数据保存到csv文件里面,方便做数据分析
import csv
f = open('双色球.csv', mode='a', encoding='utf-8', newline='')
csv_write = csv.DictWriter(f, fieldnames=['期号', '开奖日期', '红球', '蓝球', '中奖纪录'])
csv_write.writeheader() # 写入表头
csv_write.writerow()
本文分享 CSDN - 松鼠爱吃饼干。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
python爬虫抓取双色球_Python爬虫练习:爬取双色球每期的中奖号码,看能不能中奖...相关推荐
- python根据关键字爬取微博_Python 超简单爬取微博热搜榜数据
微博的热搜榜对于研究大众的流量有非常大的价值.今天的教程就来说说如何爬取微博的热搜榜.热搜榜的链接是: https://s.weibo.com/top/summary/ 用浏览器浏览,发现在不登录的情 ...
- python提取支付宝的账单_python通过adb爬取支付宝移动端账单信息
python通过adb连接爬取支付宝移动端的账单信息,操作过程如下: 于是此文件就可以分解为如下四个主要功能: 1.图片识别;2.模拟点击;3.模拟滑动;4.截图功能 一.对账单详情页的处理: 对账单 ...
- python携程酒店评论_Python基于selenium爬取携程酒店评论信息
爬取站点 任意一个携程酒店的详细链接,这里给出了四个,准备开四个线程爬取: https://hotels.ctrip.com/hotel/6278770.html#ctm_ref=hod_hp_hot ...
- python模拟登录爬取数据_python 模拟登录爬取淘宝数据
淘宝现在需要登录才能爬取搜索商品,首先在登录页面登录chrome F12 开发者模式抓包 登录请求 发现有一个post请求,这个就是登录的请求了,看下面的from data 登录信息 由from da ...
- python自动抓包手机_Python爬虫入门:教你通过Fiddler进行手机抓包!
哟哟哟~ hi起来 everybody Python爬虫入门:教你通过Fiddler进行手机抓包! 今天要说说怎么在我们的手机抓包 进群:700341555获取Python爬虫入门学习资料! Pyth ...
- python自动抓包手机_python爬虫入门02:教你通过 Fiddler 进行手机抓包-Go语言中文社区...
哟~哟~哟~ hi起来 everybody 今天要说说怎么在我们的手机抓包 通过 我们知道了 HTTP 的请求方式 以及在 Chrome 中摸清了一些套路 但是 除了对数据进行解析之外 有时候我们想 ...
- python自动抓包手机_python爬虫入门02:教你通过 Fiddler 进行手机抓包
哟~哟~哟~ hi起来 everybody 今天要说说怎么在我们的手机抓包 通过 我们知道了 HTTP 的请求方式 以及在 Chrome 中摸清了一些套路 但是 除了对数据进行解析之外 有时候我们想 ...
- python批量下载静态页面_Python静态网页爬取:批量获取高清壁纸
前言 在设计爬虫项目的时候,首先要在脑内明确人工浏览页面获得图片时的步骤 一般地,我们去网上批量打开壁纸的时候一般操作如下: 1.打开壁纸网页 2.单击壁纸图(打开指定壁纸的页面) 3.选择分辨率(我 ...
- python爬虫今日头条_python爬虫—分析Ajax请求对json文件爬取今日头条街拍美图
python爬虫-分析Ajax请求对json文件爬取今日头条街拍美图 前言 本次抓取目标是今日头条的街拍美图,爬取完成之后,将每组图片下载到本地并保存到不同文件夹下.下面通过抓取今日头条街拍美图讲解一 ...
- python爬取网页内容_Python爬虫原理解析
笔者公众号:技术杂学铺 笔者网站:mwhitelab.com 本文将从何为爬虫.网页结构.python代码实现等方面逐步解析网络爬虫. 1. 何为爬虫 如今互联网上存储着大量的信息. 作为普通网民,我 ...
最新文章
- linux中实现pxe的自动安装
- spark并发读mysql_spark jdbc(mysql) 读取并发度优化
- 转自JIM Wang:把 isv.config.xml 按钮事件移动到 entity.onload()
- 服务器用户连接数设置
- 逆置单链表c语言程序,(数据结构C语言版)顺序表和单链表的逆置
- mysql的索引的作用_数据库索引的作用,优点和缺点
- .NET Conf 2020 - 基于ASP.NET Core构建可热插拔的插件化系统
- JMetro版本5.2已发布
- linux 7 定时任务设置,centos7 配置crontab定时任务
- linux 命令速查手册之十
- SMT32H743+CubeMX-配置MPU后,在Keil上的程序卡死
- 基于JAVA+SpringBoot+Mybatis+MYSQL的工资管理系统
- GIT上传代码Enumerating objects:类型报错解决,实测可用
- ADO.NET数据集的工作原理(DataSet)
- linux go 连接oracle,Ubuntu14下golang连接oracle11g (OCI12.1方式)
- oracle分析函数sum() over()
- SpringCloud Day05---服务网关(Gateway)
- 倪光南院士:网络安全和信息化要同步推进
- 【笔记】CMake构建C++工程
- 42-表格表单和简单CSS引用