我用Python爬虫获取数据,分析双色球中奖概率,差点就中了
很多人喜欢买彩票,但是经常买彩票的人要么想着一夜暴富,要么想着改变命运,要么是娱乐娱乐,但是小编也要提醒大家一句,哪里能赚钱,哪里就有奸商,做事须谨慎。
前两天,在网上看到一个有意思的问题:彩票预测靠谱么?为什么还有那么多的人相信彩票预测?
暂且不说,彩票预测是否靠谱?彩票预测也分人而异,江湖上骗术很多,有些甚至会误以为彩票预测的准确度可以很高,这些操盘手法,让不知原理的彩民心甘情愿地掏钱买料。
我们今天就利用Python的爬虫技术爬取近16年来所有的双色球数据,看看这些年哪些数字出现的次数比较高。有的小伙伴可能不知道双色球是什么?双色球顾名思义就是两种颜色的球,一个红色,一个蓝色。红球从1-33中取出6个,篮球从1-16取出1个,如果你买的跟开奖号码一样,恭喜你几百万到手。
爬虫的部分程序如下图所示:
爬虫的思路很简单,主要是遍历爬取120几页的数据,GetPage函数取逐页解析,然后用bs取解析一些,并把数据保存在lottery文件里面。
用requests取伪装一个header取请求数据,这些都是非常基本的爬虫知识,这里就不过多描述。
小编一共爬取到了2441条数据,包含了从2003年2月到2019年7月的所有中奖彩票数据。有了数据之后,小编先进行了一下数据的分析,看看红色球和蓝色球当中,究竟哪些数字出现的频率较高。红色球的各个数字出现频率如下图所示。
从图上可以看出来,数字1出现的次数最高,而数字33出现的频率最低。蓝色球数字出现的频率如下图所示。
可以看出,蓝色球当中数字12出现的频率最高,而数字8出现的频率最低。所以按照各个数字的出现频率,小编统计了一下。按照出现的频率来买,总比随机买让我感到安心。概率统计的部分代码如下图所示。
下面小编利用线性回归来进行预测。小编对每个位置上的数字都分别训练一个模型。如下图所示:
绿色数字代表的是中奖号码的每一个位置,黄色数字就代表着每一个位置下的编号,小编就是将每个位置上的号码分别存储,以每个中奖号码作为Y值,而其每个编号作为X值,以此构成X、Y训练数据,而我们只需要预测每一个位置上的下一期中奖号码,然后将其拼接起来,就可以构成我们的下一期预测号码。部分程序如下图所示:
小编首先是将各个位置上的中奖号码分别存储到csv文件当中,然后从各个csv文件中读取数据,作为X、Y训练数据进行返回。
最后再针对每个位置上的中奖号码训练各自的模型即可得到我们的下一期预测号码,结果如下图所示。
上面的预测号码只是一个小小的预测,结果不一定准确,致富其实还是需要靠好好学习,靠努力去赢得未来。所以大家把彩票当做娱乐就可以了,千万别迷信。
结尾
最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“01”即可领取。
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了相关推荐
- Python爬虫获取数据保存到数据库中(超级详细,保证一看就会)
1.简介介绍 -网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引. ...
- python双色球的开发原理_我用Python爬虫获取数据,分析双色球中奖概率,差点就中了...
很多人喜欢买彩票,但是经常买彩票的人要么想着一夜暴富,要么想着改变命运,要么是娱乐娱乐,但是小编也要提醒大家一句,哪里能赚钱,哪里就有奸商,做事须谨慎. 前两天,在网上看到一个有意思的问题:彩票预测靠 ...
- python爬虫获取肯德基门店信息
python爬虫获取肯德基门店信息 1.在谷歌浏览器中打开肯德基官网,进入餐厅查询页面 2.在搜索框中输入地区并按f12打开开发者工具 发现已经抓取到了一条Ajax请求,可以从中获取请求的url,以及 ...
- python爬虫获取基金数据2
用sklearn分析基金数据<1> python爬虫获取基金数据<2> 数据预处理:数据清洗.生成样本数据<3> 用sklearn训练样本数据<4> 用 ...
- Python爬虫以及数据可视化分析
Python爬虫以及数据可视化分析之Bilibili动漫排行榜信息爬取分析 简书地址:https://www.jianshu.com/u/40ac87350697 简单几步,通过Python对B站番剧 ...
- Python爬虫+数据分析+数据可视化(分析《雪中悍刀行》弹幕)
Python爬虫+数据分析+数据可视化(分析<雪中悍刀行>弹幕) 哔哔一下 爬虫部分 代码部分 效果展示 数据可视化 代码展示 效果展示 视频讲解 福利环节 哔哔一下 雪中悍刀行兄弟们都看 ...
- Python爬虫获取基金持仓股票数据
Python爬虫小实战 . 通过Python爬虫获取基金持仓股票数据,按照基金持仓金额对股票进行排行,并储存在本地数据库. from urllib import request from bs4 im ...
- 编写python爬虫 获取中华英才网全网工资数据
做数据分析 数据挖掘,第一步是获取数据,在这里,我们要分析现今全国各地各个职业的工资情况. 我们选择较为权威的'中华英才网',编写python爬虫获取该网站上的各个招聘信息说给出的工资,再取其行业工资 ...
- Python爬虫获取简书的用户、文章、评论、图片等数据,并存入数据库
Python爬虫获取简书的用户.文章.评论.图片等数据,并存入数据库 爬虫定义:网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维 ...
- Python爬虫获取文章的标题及你的博客的阅读量,评论量。所有数据写入本地记事本。最后输出你的总阅读量!
Python爬虫获取文章的标题及你的博客的阅读量,评论量.所有数据写入本地记事本.最后输出你的总阅读量!还可以进行筛选输出!比如阅读量大于1000,之类的! 完整代码在最后.依据阅读数量进行降序输出! ...
最新文章
- 位域(bit fields)简介
- windoes 远程桌面时出现“没有远程桌面授权服务器可以提供的许可证”解决方法
- svn提交错误file is scheduled for addition, but is missing
- 工业级PoE交换机的分类知识详解
- 每日一题(42)—— 已知一个数组table,用一个宏定义,求出数据的元素个数
- make install到指定安装目录
- SVN记录转excel文件的小程序
- ssfn授权_Steam盗号木马窃取授权文件,360安全大脑强力拦截
- apicloud 请删除手机中的apploader后在尝试
- java robot识别验证码,robotframework处理登录验证码
- 计算机管理用户拒绝访问,win10系统打不开管理员账户 administrator拒绝访问的解决方法...
- php繁体转为简体的函数,繁体中文转换为简体中文的PHP函数_php
- Java 线程池配置的常见误区
- Windows网络诊断和配置常用命令详解
- 对 捕鱼达人1.01 的全程破解分析
- 284、超详细的光纤熔纤、盘纤教程,值得收藏
- 选择背光需要对比哪些因素呢?
- 云原生在京东丨揭秘五大云原生项目在京东的落地实践
- 《未来已来- 马云》笔记
- EXCEL骨灰级玩家必备技能,学会后年薪翻倍!年轻人耗子尾汁
热门文章
- 数据库系统---数据挖掘
- 【智能车学习】FTM模块
- 在Arduino和ESP32-s2环境下,测试WiFi Fine Time Measurement (FTM) Round Trip Time (RTT) 的定位和测距
- java swing 图片gif_Java swing显示gif
- 初识Java反序列化
- SparkSQL和HiveSql的对比
- 2022考研资料每日更新(2021.07.28)
- allure如何定制Pytest自动化测试报告样式
- mysql error 1236_MySQL Got fatal error 1236原因和解决方法
- 程序设计思维与实践 Week7 作业 A TT的魔法猫