2019.6.11更新

  • 今天查看发现网站用上了瑞数MmEwMD加密,本文已经不起作用了,就随便看看思路好了。

网址

  • 中国福彩网: http://www.cwl.gov.cn/kjxx/ssq/kjgg/

环境

  • win10, python 3.6, pycharm

干货

import requests
import json
import pandas as pd
import csvcookies = {'UniqueID': 'xfxbgZKQTNlC0laj1534566549004','Sites': '_21','_ga': 'GA1.3.1038745649.1534566546','_gid': 'GA1.3.1604362988.1534566546','21_vq': '15',
}headers = {'Accept-Encoding': 'gzip, deflate','Accept-Language': 'zh-CN,zh;q=0.9','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36','Accept': 'application/json, text/javascript, */*; q=0.01','Referer': 'http://www.cwl.gov.cn/kjxx/ssq/kjgg/','X-Requested-With': 'XMLHttpRequest','Connection': 'keep-alive',
}# 处理三位数的补零
def add_zero(n):if len(str(n)) == 1:return '00' + str(n)elif len(str(n)) == 2:return '0' + str(n)elif len(str(n)) == 3:return str(n)# 写入标题
with open('C:\\ssq.csv', 'w', encoding='utf-8-sig', newline='') as f:  # newline防止产生一行隔一行有空行的情况csv.writer(f).writerow(['期号', '开奖日期', '红球', '蓝球', '总销售额(元)', '奖池(元)', '一等奖中奖情况', '本期中奖情况'])for q in range(1, 161):  # 每年基本在154期左右for y in range(2013, 2019):  # 从2013年到2018年params = (('name', 'ssq'),('issueCount', ''),('issueStart', str(y) + add_zero(q)),('issueEnd', str(y) + add_zero(q)),('dayStart', ''),('dayEnd', ''),('pageNo', ''))url = 'http://www.cwl.gov.cn/cwl_admin/kjxx/findDrawNotice'response = requests.get(url=url, headers=headers, params=params, cookies=cookies)result = json.loads(response.text)['result']  # 得到返回的json数据df = pd.DataFrame(result, columns=['code', 'date', 'red', 'blue', 'sales', 'poolmoney', 'content', 'prizegrades'])if df.empty == 0:df.to_csv('C:\\ssq.csv', mode='a', encoding='utf_8_sig',index=0, header=0)print("历年第" + str(q) + "期抓取完成")

End

走过路过,有任何问题,请不吝赐教。

用requests和pandas爬取中国福彩网官网 双色球 历年全部彩票数据相关推荐

  1. python爬虫遇到验证码的处理方法(以爬取中国执行信息公开网为例)

    朋友们大家好,python爬虫是在学习python时比较容易上手的学习方式,爬虫的思路简要以下几点: 1.获取需要爬取页面的网址,并且对网页内容进行分析.(主要就源代码讨论,如果我们需要的内容没有在源 ...

  2. Python实战案例:爬取中国执行信息公开网

    从面试题谈起 谈到这个项目的爬虫,就要从一道面试题谈起了. 这道面试题是: 请写一个爬虫从网址 http://zxgk.court.gov.cn/shixin/,检索被执行人姓名:"阿里&q ...

  3. 数据藏在json文件中,如何爬取---以王者荣耀官网为例

    此前写了一个爬虫基础案例---爬取王者荣耀英雄与技能介绍 python爬虫------王者荣耀英雄及技能爬取并保存信息到excelhttps://blog.csdn.net/knighthood200 ...

  4. python爬取饿了么评论_爬取饿了么官网数据 scrapy

    展开全部 Scrapy框架的初步运用 上午刚配置好scrapy框架,32313133353236313431303231363533e58685e5aeb931333363393734下午我就迫不及待 ...

  5. 爬取中国福彩网并做可视化分析

    一.问题: 利用python的matplotlib和requestss两个库对中奖号码进行可视化分析.经过分析可以知道中奖号码为红色和蓝色两种,数据是以json进行存储. 二.方法: 1.首先:mat ...

  6. python爬取率_[新手]python爬虫爬取中证指数官网数据

    想用python爬虫获取中证指数官网上的几个主要指数的每日估值更新,但是下载下来的页面内容却没有想要的数据.想要的数据前面有个JavaScript标签,是不是光靠python没办法获取这个数据?求大神 ...

  7. python爬取javascript变量数据_javascript - [新手]python爬虫爬取中证指数官网数据

    问 题 想用python爬虫获取中证指数官网上的几个主要指数的每日估值更新,但是下载下来的页面内容却没有想要的数据.想要的数据前面有个JavaScript标签,是不是光靠python没办法获取这个数据 ...

  8. scrapy-redis案例(一)爬取中国红娘相亲网站

    前言:本案例将分为三篇. 第一篇,使用scrapy框架来实现爬取中国红娘相亲网站. 第二篇,使用scrapy-redis 简单的方式爬取中国红娘相亲网站.(使用redis存储数据,请求具有持续性,但不 ...

  9. scrapy-redis案例(三)爬取中国红娘相亲网站

    前言:本案例将分为三篇. 第一篇,使用scrapy框架来实现爬取中国红娘相亲网站. 第二篇,使用scrapy-redis 简单的方式爬取中国红娘相亲网站.(使用redis存储数据,请求具有持续性,但不 ...

最新文章

  1. 亏本也要抢市场!谷歌亚马逊一路死磕到CES,争夺语音入口之路,谁都不是吃素的
  2. 聊聊rocketmq的ProducerImpl
  3. WebRTC各种资料集合
  4. 201621123065《JAVA程序设计》第11周学习总结
  5. 绿网天下:上云解决系统安全和安全合规
  6. 网易易盾的“外挂对抗战”,游戏出海之路如何走得更安全?
  7. nodejs系列笔记02---模块路径解析
  8. openCVPracticalExercise学习笔记03
  9. Ehcache 3.7文档—基础篇—XML Configuration
  10. linux打包根目录
  11. Python实现离线字典+听写单词(二):字典数据写进sqlite
  12. 微信游戏奇迹暖暖选取服务器失败,奇迹暖暖微信登录授权失败
  13. 一张图慢慢转换成下一张图_给一张照片做一个视频 如何把一张图片制作成几分钟的视频|图片做成视频软件...
  14. NASA电池数据集内容说明
  15. android动态请求权限
  16. SSL数字证书下载流程是怎么样的
  17. Shopee大促爆单?从这些营销工具切入,订单一爆再爆
  18. eclipse changer value
  19. Android项目内简单集成微信和支付宝支付功能
  20. Office_Professional_Plus_2010 with sp1 简体中文VOL版下载地址

热门文章

  1. 高德地图哪个语音包最好_高德地图app怎么录制语音包?高德地图将自己的语音用作导航语音包的方法介绍...
  2. 由ThinkServer RQ940死机到系统无法引导带来的感想
  3. vue一些比较重要知识点的复习
  4. 日志分析工具mysqldumpslow
  5. java报错--java.io.IOException: Server returned HTTP response code: 502
  6. 最新系统漏洞--git tar.git内存泄露漏洞
  7. 电脑python如何下载_Python for Windows 32位 v3.7.2下载|Python 3.7.2免费电脑版
  8. 编程题——扑克牌大小
  9. Linux欧姆单位怎么打,万用表如何进行欧姆校零
  10. 蓝桥杯 我们的征途是星辰大海 Java