探索：爬取双色球开奖历史数据，高准确度预测下一期开奖号码。

最近在学习ML，本人偶尔喜欢买点彩票，经常觉得选号码是件困难的事，而且总是不中奖，那么有没有捷径，让计算机帮我去选号码，或者帮我选择中奖率高的号码。

一、让计算机帮我选取号码，随机选取。python代码如下：

import randomdef ball():ball_list=[]while 1:a=random.randint(1,33)if a not in ball_list:ball_list.append(a)if len(ball_list)==6:breakball_list.sort()ball_list.append(random.randint(1,16))print(ball_list)
ball()

这是运行效果：

缺点：中奖率特别低，自己试过，经常是一个号码都不中，哈哈哈哈。

二、爬取双色球开奖历史数据，使用一些算法预测下一期中奖号码，希望能提升中奖率，但是能不能中奖就不清楚了。

先爬取数据保存在ssq.csv文件中，然后看看统计效果。

# coding=utf-8
import requests,csv
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sn
from lxml import etree  #lxml最新版本没有etree功能，3.7.2有，使用：pip install lxml==3.7.2
def csv_w(filename,content):'用于csv格式文件，写入数据。数据用列表形式。'#打开文件，追加afile = open(filename,'a',newline="")#设定写入模式csv_write = csv.writer(file,dialect='excel')#写入具体内容csv_write.writerow(content)file.close()print ("write over")
def ssq(filename): #爬取双色球历史数据，写入到ssq.csv文件中url = "http://datachart.500.com/ssq/history/newinc/history.php?start=00001&end=18081" #数据来源response = requests.get(url)response = response.textselector = etree.HTML(response)for i in selector.xpath('//tr[@class="t_tr1"]'):datetime = i.xpath('td/text()')[0]red = i.xpath('td/text()')[1:7]blue = i.xpath('td/text()')[7]need=[]need.append(datetime)for j in red:need.append(j)need.append(blue)csv_w(filename, need)
if __name__=='__main__':one=['id','red_one','red_two','red_three','red_four','red_five','red_six','blue']  #制作好表头。csv_w("ssq.csv",one) #写入表头ssq('ssq.csv')data=pd.read_csv("ssq.csv")  #pandas读取csv格式文件数据。print(data.info())  #查看每列的大致信息sn.countplot(data.blue) #统计蓝色球情况plt.show() #显示出直方图。

运行效果：

可以看出，在蓝球中，12号的中奖概率是最高的。

算法预测部分待研究···············

探索：爬取双色球开奖历史数据，高准确度预测下一期开奖号码。相关推荐

python 爬取中彩网双色球开奖数据，预测下一期开奖号码
爬取中彩网双色球开奖数据: import requests from bs4 import BeautifulSoup from collections import Counter# 获取内容 re ...
带你爬取双色球历史开奖信息并作可视化分析
爬取双色球历史开奖 + 可视化分析更多爬虫教程请移步 \color{red}更多爬虫教程请移步更多爬虫教
【Python】爬虫初体验，40行代码爬取双色球2003年至今的开奖号码
爬虫爬取的双色球开奖号码按我目前的理解,爬虫的工作原理大致是: 获取目标网页,在网页(html文件)中筛选目标数据,最后把数据导出利用爬虫爬取数据看似很"高深莫测",只需几分钟 ...
爬取双色球的历史记录
爬取双色球的历史记录 1.项目简介双色球是由中国福利彩票的一种玩法.双色球投注区分为红色球号码区和蓝色球号码区,红色球号码区由1-33共三十三个号码组成,蓝色球号码区由1-16共十六个号码组成. ...
爬虫攻守道 - 2023最新 - JS逆向 - Python Scrapy实现 - 爬取某天气网站历史数据
目录背景介绍网站分析第1步:找到网页源代码第2步:分析网页源代码 Python 实现成果展示后续 Todo 背景介绍今天这篇文章,3个目的,1个是自己记录,1个是给大家分享,还有1个是向 ...
5分钟python爬虫案例，手把手教爬取国内外最新疫情历史数据
俗话说的好,"授之以鱼不如授之以渔",所以小编今天就把爬疫情历史数据的方法分享给你们. 基本思路:分析腾讯新闻"抗肺炎"版块,采用"倒推法" ...
运用python爬取彼岸桌面所有关键字高清壁纸
运用python爬取彼岸桌面所有关键字高清壁纸第一次在csdn写博客, 个人技术并不成熟, 还是学生, 高手轻喷菜鸡勿啄就是心血来潮想要换桌面壁纸, 存在一个文件夹自动更换, 但是从网站上一个一个 ...
一键爬取王者荣耀全皮肤高清图片【方法一】
文章目录前言一.爬虫是什么? 二.使用步骤 1.引入库 2.访问的URL 3.爬取思路三.皮肤URL(需要手动找出) 完整代码四.效果展示总结前言相信很多小伙伴们都喜欢玩王者荣耀这款MO ...
scrapy图片爬取（爬取站长素材中的高清图片）
- ImagesPipeline:-只需要将img的src的属性值进行解析,提交到管道,管道就会对图片的src进行请求发送获取图片的二次请求 -需求:爬取站长素材中的高清图片-使用流程:-数据解析(图 ...
Python零基础之爬取王者荣耀官方网站高清壁纸(普通版)
Python零基础之爬取王者荣耀官方网站高清壁纸目标: 分析过程: 1. 确定目标url 2. 解决url解析问题 3. 图片下载解析 4. 多页面的处理代码示例需要注意的问题: 目标: 1.下 ...

探索：爬取双色球开奖历史数据，高准确度预测下一期开奖号码。

探索：爬取双色球开奖历史数据，高准确度预测下一期开奖号码。相关推荐

最新文章

热门文章