12306抢票爬虫

先直接上一下效果图吧:

图片上信息是抢票成功后的界面

1、技术路线

selenium + chromedriver

2、思路分析

(1)、模拟浏览器登录抢票界面,手动进行登录

(2)、登录完成后让浏览器跳转到购票界面

(3)、手动输入出发地、目的地、 出发日,检查上面三个信息输入完成后,找到查询按钮,进行车次查询

(4)、查找我们需要的车次,看下是否有余票(显示有或数子),找到车次的预定的按钮,进行点击,如果没有以上两种情况出现,就循环查询

(5)、一旦检查到有票,执行预定按钮的点击事件,找到乘客信息,执行点击事件,再找到提交订单按钮,执行点击事件

(6)、点击完提交订单按钮,会弹出确认的对话框,找到确认按钮,执行点击事件,完成抢票

(7)、之后完成付款操作

3、直接上代码

# coding=utf8from selenium import  webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC #期望的条件
from selenium.webdriver.common.by import Byclass Qiangpiao(object):# 初始化函数def __init__(self):self.login_url = "https://kyfw.12306.cn/otn/resources/login.html"self.initmy_url = "https://kyfw.12306.cn/otn/view/index.html"self.search_url = "https://kyfw.12306.cn/otn/leftTicket/init?linktypeid=dc"self.passenger_url ="https://kyfw.12306.cn/otn/confirmPassenger/initDc"# 驱动chrome浏览器进行操作self.driver = webdriver.Chrome(executable_path="D:\Pycharm2017\chromedriver.exe")def wait_input(self):self.from_station = input("起始站:")self.to_station = input("目的地:")# 出发时间必须严格和网上格式保持一致:yyyy-mm-ddself.depart_time = input("出发时间:")self.passengers = input("乘客姓名(如果有多名乘客,请用逗号(英文)隔开:").split(",")self.trains = input("乘车车次(如果有多趟车次,请用逗号(英文)隔开:").split(",")def _login(self):self.driver.get(self.login_url)# 显示等待(解释:你与心上人约会,以对方来或不来为等待条件即事件是否发生为条件)# 隐示等待(解释:你与心上人约会,以等待时间为条件)WebDriverWait(self.driver,1000).until(EC.url_to_be(self.initmy_url))print("登录成功!")def _order_ticket(self):# 1、跳转到查余票的界面self.driver.get(self.search_url)# 2、等待出发地是否输入正确WebDriverWait(self.driver,1000).until(EC.text_to_be_present_in_element_value((By.ID,"fromStationText"),self.from_station))# 3、等待目的地输入是否正确WebDriverWait(self.driver,1000).until(EC.text_to_be_present_in_element_value((By.ID,"toStationText"),self.to_station))# 4、等待出发日期是否输入正确WebDriverWait(self.driver,1000).until(EC.text_to_be_present_in_element_value((By.ID,"train_date"),self.depart_time))# 5、等待查询按钮是否可用WebDriverWait(self.driver,1000).until(EC.element_to_be_clickable((By.ID,"query_ticket")))# 6、如果可以点击找到查询按钮执行点击事件searchBtn = self.driver.find_element_by_id("query_ticket")searchBtn.click()# 7、点击查询按钮之后等待车票信息页面被加载完成WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH, ".//tbody[@id = 'queryLeftTable']/tr")))# 8、找到所有没有datatrain属性的tr标签tr_list = self.driver.find_elements_by_xpath(".//tbody[@id ='queryLeftTable']/tr[not(@datatran)]")# 9、遍历所有满足条件的tr标签for tr in tr_list:train_number = tr.find_element_by_class_name("number").textif train_number in self.trains:left_ticket = tr.find_element_by_xpath(".//td[4]").text #找到第四个td标签下的文本if left_ticket == "有" or left_ticket.isdigit: #判断输入的车次是否在列表中orderBotton = tr.find_element_by_class_name('btn72')orderBotton.click()# 等待是否来到了确认乘客的页面WebDriverWait(self.driver, 1000).until(EC.url_to_be(self.passenger_url))# 等待所有乘客信息是否被加载进来了WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH, ".//ul[@id = 'normal_passenger_id']/li")))# 获取所有乘客信息passanger_labels = self.driver.find_elements_by_xpath(".//ul[@id = 'normal_passenger_id']/li/label")for passanger_label in passanger_labels:  # 遍历所有的label标签name = passanger_label.textif name in self.passengers:  # 判断名字是否与之前输入的名字重合passanger_label.click()  # 执行点击操作# 获取提交订单的按钮submitBotton = self.driver.find_element_by_id("submitOrder_id")submitBotton.click()# 显示等待确人订单对话框是否出现WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.CLASS_NAME, "dhtmlx_wins_body_outer")))# 显示等待确认按钮是否加载出现,出现后执行点击操作WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.ID, "qr_submit_id")))confirmBtn = self.driver.find_element_by_id("qr_submit_id")confirmBtn.click()while confirmBtn:confirmBtn.click()confirmBtn = self.driver.find_element_by_id("qr_submit_id")returndef run(self):self.wait_input()self._login()self._order_ticket()if __name__ == '__main__':spider = Qiangpiao()spider.run()

​​​4、运行效果图就是最上面那一张图片

5、配置说明

请使用前确保已安装好一个python编译器并完成pyhon的配置windows下推荐使用pycharm,并下载chrome的chromedriver驱动,并将chromedriver配置进python包(如果没配置只要指定路径亦可!)

复制代码按命令行提示操作即可完成抢票

爬虫实战篇---12306抢票爬虫相关推荐

  1. Python爬虫实战之12306抢票

    12306抢票 前言 一.爬虫是什么? 二.使用步骤 1.引入库 2.爬虫代码 3.城市编码 4.主程序 总结 前言 提示:用python实现简单的12306余票查询 提示:以下是本篇文章正文内容,下 ...

  2. Python爬虫实战之12306抢票开源

    今天就和大家一起来讨论一下python实现12306余票查询(pycharm+python3.7),一起来感受一下python爬虫的简单实践 我们说先在浏览器中打开开发者工具(F12),尝试一次余票的 ...

  3. python 12306抢票_Python爬虫实战:12306抢票开源!

    今天就和大家一起来讨论一下python实现12306余票查询(pycharm+python3.7),一起来感受一下python爬虫的简单实践 我们说先在浏览器中打开开发者工具(F12),尝试一次余票的 ...

  4. 12306抢票爬虫selenium+Chromedriver(需手动完成支付)

    先看动态结果:只能到预定锁定车票,30分钟内手动付款,车票会被自动取消. 如果是暂无余票,就会一直查询余票信息,直到有余票时,自动预定,比如G7暂无余票,为了防止反爬虫,设置的刷票间隔时间长一点,这样 ...

  5. python爬虫抢火车票_如何用python写一个简单的12306抢票软件|python 爬火车票 教程...

    python 如果抓取验证码图片 类似12306的登录验证码图片 这个以前做次.最大的麻烦是码的识别算法的识别率太低.12306那种网站登陆错3次就限制你20分钟.所以除非你有33%以上的识别率否则不 ...

  6. 如何定制一款12306抢票浏览器——完结篇

    差不多花了一个星期的业余时间去完成了相关的编码.最后也只是使用了5篇文章将整个大题流程和使用的关键技术介绍了一下.其中有很多酸甜苦辣,其中记忆最为深刻的就是我对图像做了处理后,tesseract-oc ...

  7. 分享12306抢票心得-终极秒杀思路篇

    12306抢票的关键拼的就是整点出票的速度,快的几秒钟,慢的几分钟,本文提供终极抢票攻略,通过多线程扫描上万个CDN,来大幅度提升出票速度. 准备一:需要了解CDN和切站的机制,请参考: 分享1230 ...

  8. python爬虫——实战篇

    python爬虫--实战篇 2021.7.20晚已更新 注:注释和说明已在代码中注释 python爬虫实战篇 笔趣阁小说及其网址爬取 4k图片网站图片爬取 简历模板爬取 自动填体温小程序 待补充 笔趣 ...

  9. 爬虫实战篇(模拟登录)

    爬虫实战篇(模拟登录) 阅读目录 (1).登录实质 (2).什么是模拟登陆 (3).实现方式 (4).实例讲解(模拟登录去哪儿网)–这里我们用第二种实现方式 (1).登录实质 互联网上的部分网站需要登 ...

最新文章

  1. Spring Cloud Alibaba 高级特性 基于 Sleuth+Zipkin 实施链路跟踪体系
  2. 上线。我都惊呆了。。。
  3. (转)HLSL,函数列表
  4. CakePHP 2.x CookBook 中文版 第二章 安装
  5. VBA and Access
  6. Greenplum-概念篇
  7. iOS开发——高级技术通讯录功能的实现
  8. OEL6.1下oracle 11gr2 ASM安装
  9. 这类程序员成为百度、阿里宠儿,分分钟秒杀众应届毕业生
  10. iwlist/iwconfig/iw命令
  11. 【心电信号】基于matlab NLM时间序列心电信号去噪【含Matlab源码 1547期】
  12. 汇编语言指令大全(详细)
  13. 永中office之在线预览(vue/js版)
  14. 陶哲轩实分析 3.1节 习题试解
  15. Android 圆形头像实现
  16. 代数系统,二元运算,半群,含幺半群,群
  17. c#中获得windows、system、system32等一些系统文件夹的路径
  18. 为什么大部分企业面试官都会问GMV,GMV是什么?
  19. iOS-APP包的瘦身之旅(从116M到现在的36M的减肥之路)
  20. html字两边的横线_css实现中间文字两边横线效果

热门文章

  1. 外贸业务数据BI可视化分析
  2. 深度访谈:智能家居这么火,该怎么赚钱?
  3. 爬虫初体验-- 爬取当当书籍
  4. 让Mac OS X的终端多姿多彩
  5. 【我的笔记】VScode遇到的小问题以及个人配置代码记录
  6. 量子技术实现穿墙术,理论是否可行
  7. eclipse php 代码补全,Eclipse的代码自动补全插件CodeMix发布CI 2019.8.21|优化性能
  8. 帆软Java报表软件
  9. H2数据库缓存设置上限
  10. 一场婚礼上,新郎的话(经典)