准备目标网站 :https://kyfw.12306.cn/otn/login/init安装PIL模块: pip3 install pillow 或 pip3 --default-timeout=100 install -U pillow 第三方图像处理库(图片定位裁剪)准备一个浏览器驱动(版本不要差太多) chromedriver.exe  下载:https://npm.taobao.org/mirrors/chromedriver/验证码识别网站(超级鹰):http://www.chaojiying.com/ 需要注册,使用方法 参考#页面中验证码识别;https://www.cnblogs.com/guokaifeng/p/11536706.html需求分析通过selenium模块来实现模拟登录- 难点:对验证码的自动识别(验证码要一次获取,刷新的话会更改验证码)- 解决方案:对验证码区域进行截取(使用PIL模块的Image),用超级鹰来获取正确验证码的坐标,然后由selenium实现登录

实现代码from PIL import Image #导入Image截图from time import sleep from selenium importwebdriverfrom Cjy import Chaojiying_Client # 导入超级鹰验证码识别from selenium.webdriver importActionChains # 导入ActionChains动作链bro = webdriver.Chrome(executable_path='chromedriver.exe') # 指定浏览器驱动bro.get('https://kyfw.12306.cn/otn/login/init')sleep(3) # 防止网络(慢)原因图片加载失败bro.save_screenshot('main.png') # 截取显示页面# 对页面中的验证码图片做定位code_img_tag = bro.find_element_by_xpath('//*[@id="loginForm"]/div/ul[2]/li[4]/div/div/div[3]/img') # 定位到验证码图片的标签location = code_img_tag.location # 图片坐标(左下,右上) {'x':274,'y':293}size = code_img_tag.size # 图片的宽高 {'height':190,'width':293}# 裁剪的区域范围 (矩获取验证码的图片)rangle = (int(location['x']),int(location['y']),int(location['x']+size['width']),int(location['y']+size['height']))# 使用Image裁剪出验证码图片 code.pngi = Image.open('./main.png')frame = i.crop(rangle)frame.save('code.png')# 调用超级鹰对图片进行识别def get_text(imgPath,imgType):    chaojiying = Chaojiying_Client('账户', '密码', '软件id')#超级鹰的账户密码软件码 注意最少要充1元才能使用    im = open(imgPath, 'rb').read()    returnchaojiying.PostPic(im, imgType)['pic_str']result = get_text('./code.png',9004) # 传入验证码与验证码类型  返回值为正确图片的坐标55,70|267,133 (账户不对或没有余额 会报错)# 把图片坐标转换为 55,70|267,133 ==[[55,70],[267,133]]all_list = []lis = result.split('|')   #['55,70', '267,133']all_list.append([int(a) for a inlis[0].split(',')])all_list.append([int(a) for a in lis[-1].split(',')])# 让动作链去指定验证码区域模拟鼠标点击for a inall_list:    x = a[0]    y = a[1]    ActionChains(bro).move_to_element_with_offset(code_img_tag,x,y).click().perform()    breakbro.find_element_by_id('username').send_keys('123456') # 输入12306账户bro.find_element_by_id('password').send_keys('67890000000') # 输入密码bro.find_element_by_id('loginSub').click() # 点击登录sleep(5)bro.quit() #退出# 超级鹰代码    importrequestsfrom hashlib import md5class Chaojiying_Client(object):    def __init__(self, username, password, soft_id):        self.username = username        password =  password.encode('utf8')        self.password = md5(password).hexdigest()        self.soft_id = soft_id        self.base_params = {            'user': self.username,            'pass2': self.password,            'softid': self.soft_id,        }        self.headers = {            'Connection': 'Keep-Alive',            'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0)',        }    def PostPic(self, im, codetype):        """        im: 图片字节        codetype: 题目类型 参考 http://www.chaojiying.com/price.html        """        params = {            'codetype': codetype,        }        params.update(self.base_params)        files = {'userfile': ('ccc.jpg', im)}        r = requests.post('http://upload.chaojiying.net/Upload/Processing.php', data=params, files=files, headers=self.headers)        return r.json()    def ReportError(self, im_id):        """        im_id:报错题目的图片ID        """        params = {            'id': im_id,        }        params.update(self.base_params)        r = requests.post('http://upload.chaojiying.net/Upload/ReportError.php', data=params, headers=self.headers)        return r.json()

模拟登陆 12306网站相关推荐

  1. 使用Python模拟登陆12306并全自动下单

    最近一段时间一直在研究用Python模拟登陆12306网站并自动刷票下单,经过一段时间的摸索,终于完成了代码,实现了12306刷票的功能.话不多说,先给大伙儿看看成果.我录制了一段时间,展示了自动刷票 ...

  2. Python3 爬虫实战 — 模拟登陆12306【点触验证码对抗】

    登陆时间:2019-10-21 实现难度:★★★☆☆☆ 请求链接:https://kyfw.12306.cn/otn/resources/login.html 实现目标:模拟登陆中国铁路12306,攻 ...

  3. php selenium模拟登陆,12306 的selenium实现模拟登陆

    # 下面是12306 实现的模拟登陆 # 解码 应用超级鹰,注册用户,左侧栏软件ID进去,开启一个新软件,拿到软件ID # 下面测试都在jupyter里面实现 # 超级鹰类 cell import r ...

  4. python爬虫登录12306失败_Python网络爬虫(selenium模拟登录12306网站)

    一.通过selenium自动登录12306官网 1.1 超级鹰打码平台API,创建chaojiyin.py文件 #!/usr/bin/env python#coding:utf-8 importreq ...

  5. 模拟登录12306网站

    首先用火狐浏览器进入12306网站的登录界面,F12获取登录界面的url地址. 再获取验证码图片的链接及其验证码校正所post的数据 最后获取用户名和密码的登录链接及其post的数据 # coding ...

  6. php模拟登陆360网站 爬取360指数

    爬取360指数三部曲 获取360用户的token 通过账号.密码.token模拟登陆,获取cookie 设置cookie,爬取360指数 代码实现 <?phpclass CrawlerOf360 ...

  7. Mac 模拟登陆12306

    模拟登录12306 结构 1.访问首页,将浏览器窗口最大化 2.找到并点击账号登录,截取全局图片,获得验证码位置坐标,通过该坐标从全局图片里截取验证码图片 3.调用识别平台,返回结果 4.拆分坐标,找 ...

  8. 以selenium模拟登陆12306

    初级模拟,速度有点慢,后期有时间再优化 1 # -*- coding:utf-8 -*- 2 # author:zxy 3 # date:2018-12-23 4 5 from selenium im ...

  9. 使用python3登陆12306网站

    一.一些用到的技术 1.1解析验证码(联众-收费,两分钱一个) 验证码识别设计机器学习,没有耗费时间去实现,所以采用了第三方(联众)的在线打码,注册充值便可使用,识别率挺高的,验证码识别种类不少,充了 ...

最新文章

  1. 【错误记录】VMware 虚拟机报错 ( 无法连接网络 | VMWare 中打开已经连接好的虚拟机 | 选择 “ 在图形功能不兼容情况下, 车行是恢复虚拟机 “ 选项 )
  2. java 中调用docker_如何通过Java程序执行docker命令
  3. yolov4论文_YOLOv4论文详细解读
  4. Java Spring初学者之调试器里括号包含的类含义
  5. php crc32 作用,php的crc32函数使用时需要注意的问题(不然就是坑)
  6. HttpServletResponse说明
  7. CVPR 2019 论文大盘点-人脸技术篇
  8. PowerBI Report Server 自定义视图无法显示故障解决
  9. Java数据结构与算法解析(二)——栈
  10. CXF入门教程(一)
  11. oracle帮助文档_Spring Boot Config文档,使用IntelliJ IDEA的两种方法
  12. FZU 2129 子序列个数(DP)题解
  13. OpenCV自带的CamShift算法解读
  14. 带农历日期的html代码,网页日历代码 包含日期时间 阴历
  15. Introduction to Computer Networking学习笔记(二十):TCP拥塞控制-基本方法 AIMD
  16. 基于Vue的标尺插件(刻度尺)
  17. i5 6600 HD530联想扬天S5250黑苹果
  18. 互联互通-标准化成熟度指标分析(更新中)
  19. 移动web——微金所实战项目
  20. 格林深瞳一面、二面、hr

热门文章

  1. RHEL7系统的MBR引导记录损坏后对grub进行修复
  2. 如何实现生产者消费者模式
  3. 我与前端 | 视野的重要性
  4. 数据结构--二叉树--详解
  5. 使用腾讯云服务器快速搭建网站教程
  6. 站在时代风口,AI和区块链哪一个会是大势所趋?文末免费送书哦
  7. 服务器系统盘 FOREIGN,DELL服务器raid盘foreign问题
  8. python电脑下载什么软件-Python编程软件(专业电脑编程工具)V3.9.1 最新版
  9. Javascript(es2016) import和require用法和区别
  10. 异步电机的无传感器矢量控制,matlab,仿真模型,控制算法为MRAS模型参考自适应。