探索:爬取双色球开奖历史数据,高准确度预测下一期开奖号码。
最近在学习ML,本人偶尔喜欢买点彩票,经常觉得选号码是件困难的事,而且总是不中奖,那么有没有捷径,让计算机帮我去选号码,或者帮我选择中奖率高的号码。
一、让计算机帮我选取号码,随机选取。python代码如下:
import randomdef ball():ball_list=[]while 1:a=random.randint(1,33)if a not in ball_list:ball_list.append(a)if len(ball_list)==6:breakball_list.sort()ball_list.append(random.randint(1,16))print(ball_list) ball()
这是运行效果:
缺点:中奖率特别低,自己试过,经常是一个号码都不中,哈哈哈哈。
二、爬取双色球开奖历史数据,使用一些算法预测下一期中奖号码,希望能提升中奖率,但是能不能中奖就不清楚了。
先爬取数据保存在ssq.csv文件中,然后看看统计效果。
# coding=utf-8 import requests,csv import pandas as pd import matplotlib.pyplot as plt import seaborn as sn from lxml import etree #lxml最新版本没有etree功能,3.7.2有,使用:pip install lxml==3.7.2 def csv_w(filename,content):'用于csv格式文件,写入数据。数据用列表形式。'#打开文件,追加afile = open(filename,'a',newline="")#设定写入模式csv_write = csv.writer(file,dialect='excel')#写入具体内容csv_write.writerow(content)file.close()print ("write over") def ssq(filename): #爬取双色球历史数据,写入到ssq.csv文件中url = "http://datachart.500.com/ssq/history/newinc/history.php?start=00001&end=18081" #数据来源response = requests.get(url)response = response.textselector = etree.HTML(response)for i in selector.xpath('//tr[@class="t_tr1"]'):datetime = i.xpath('td/text()')[0]red = i.xpath('td/text()')[1:7]blue = i.xpath('td/text()')[7]need=[]need.append(datetime)for j in red:need.append(j)need.append(blue)csv_w(filename, need) if __name__=='__main__':one=['id','red_one','red_two','red_three','red_four','red_five','red_six','blue'] #制作好表头。csv_w("ssq.csv",one) #写入表头ssq('ssq.csv')data=pd.read_csv("ssq.csv") #pandas读取csv格式文件数据。print(data.info()) #查看每列的大致信息sn.countplot(data.blue) #统计蓝色球情况plt.show() #显示出直方图。
运行效果:
可以看出,在蓝球中,12号的中奖概率是最高的。
算法预测部分待研究···············
探索:爬取双色球开奖历史数据,高准确度预测下一期开奖号码。相关推荐
- python 爬取中彩网双色球开奖数据,预测下一期开奖号码
爬取中彩网双色球开奖数据: import requests from bs4 import BeautifulSoup from collections import Counter# 获取内容 re ...
- 带你爬取双色球历史开奖信息并作可视化分析
爬取双色球历史开奖 + 可视化分析 更 多 爬 虫 教 程 请 移 步 \color{red}更多爬虫教程请移步 更多爬虫教
- 【Python】爬虫初体验,40行代码爬取双色球2003年至今的开奖号码
爬虫爬取的双色球开奖号码 按我目前的理解,爬虫的工作原理大致是: 获取目标网页,在网页(html文件)中筛选目标数据,最后把数据导出 利用爬虫爬取数据看似很"高深莫测",只需几分钟 ...
- 爬取双色球的历史记录
爬取双色球的历史记录 1.项目简介 双色球是由中国福利彩票的一种玩法.双色球投注区分为红色球号码区和蓝色球号码区,红色球号码区由1-33共三十三个号码组成,蓝色球号码区由1-16共十六个号码组成. ...
- 爬虫攻守道 - 2023最新 - JS逆向 - Python Scrapy实现 - 爬取某天气网站历史数据
目录 背景介绍 网站分析 第1步:找到网页源代码 第2步:分析网页源代码 Python 实现 成果展示 后续 Todo 背景介绍 今天这篇文章,3个目的,1个是自己记录,1个是给大家分享,还有1个是向 ...
- 5分钟python爬虫案例,手把手教爬取国内外最新疫情历史数据
俗话说的好,"授之以鱼不如授之以渔",所以小编今天就把爬疫情历史数据的方法分享给你们. 基本思路:分析腾讯新闻"抗肺炎"版块,采用"倒推法" ...
- 运用python爬取彼岸桌面所有关键字高清壁纸
运用python爬取彼岸桌面所有关键字高清壁纸 第一次在csdn写博客, 个人技术并不成熟, 还是学生, 高手轻喷菜鸡勿啄 就是心血来潮想要换桌面壁纸, 存在一个文件夹自动更换, 但是从网站上一个一个 ...
- 一键爬取王者荣耀全皮肤高清图片【方法一】
文章目录 前言 一.爬虫是什么? 二.使用步骤 1.引入库 2.访问的URL 3.爬取思路 三.皮肤URL(需要手动找出) 完整代码 四.效果展示 总结 前言 相信很多小伙伴们都喜欢玩王者荣耀这款MO ...
- scrapy图片爬取(爬取站长素材中的高清图片)
- ImagesPipeline:-只需要将img的src的属性值进行解析,提交到管道,管道就会对图片的src进行请求发送获取图片的二次请求 -需求:爬取站长素材中的高清图片-使用流程:-数据解析(图 ...
- Python零基础之爬取王者荣耀官方网站高清壁纸(普通版)
Python零基础之爬取王者荣耀官方网站高清壁纸 目标: 分析过程: 1. 确定目标url 2. 解决url解析问题 3. 图片下载解析 4. 多页面的处理 代码示例 需要注意的问题: 目标: 1.下 ...
最新文章
- limma包分析差异表达基因
- 牛津书虫系列双语读物
- DHCP服务搭建(1)
- spring整合mybatis采坑
- bool类型_Python基本数据类型之Number
- php获得6个月以前的日期,请问下使用PHP如何获取某个月的所有日期
- ant指定servlet版本_[转载]程序开发常见错误
- 福禄克OptiFiber® Pro OTDR光线测试仪
- 最全经典 | 机器视觉基础知识汇总
- learn words by steps 8 英语单词
- 小米手机扩容教程_小米笔记本硬盘扩容教程:5分钟搞定,存储容量瞬间翻倍...
- 计算机联锁与全电子执行单元,计算机联锁全电子执行单元.docx
- 高电平和低电平 到底是啥?
- 解决微信内置浏览器tel:手机号不能打电话的问题
- Python语法--Mooc七月
- Android仿学习强国填空题考试界面
- 不重启JVM,对未添加日志的方法添加日志!
- Revit建模弹窗警告:图元稍微偏离了轴,可能会导致不精确
- 电子商城后台系统(一):使用eclipse构建web项目
- Android电视kodi安装失败,电视提示“解析包出现错误” ?四种方法教你轻松解决...
热门文章
- 数字逻辑educoder实训项目 logisim实现 交通灯系统设计超详细实验步骤,绝对完整
- L-TAGE预测器 “A 256 Kbits L-TAGE branch predictor”
- TortoiseSVN—Repo-browser,打开你要比较的两个版本所在的地址,选择一个版本做为比较的基础(单击右键—选择mark for comparison),再选择另外一个版本(单击右键—选
- android 蓝牙设备 ota dfu升级实录
- matplotlib 全局字体改为 Times New Roman
- win7空文件夹删不掉的原因及解决方法
- Driverjs-前端引导页组件
- Crashing Robots
- matlab 周期卷积,matlab连续时间信号卷积和离散时间信号卷积程序
- Python从RGBD数据进行3D场景重建