淘宝登录是爬虫的一个老大难的问题,因为淘宝有那么一群人专门针对爬虫客们下足了功夫,无论你是selenium模拟点击登录,还是利用cookies登录,都会被识别出来,验证码验证始终通过不了,其后台可能采取了有些机器学习的识别手段。

那么我们又有这个需要去登录淘宝然后获取数据,该怎么做呢???

下面给出四种解决方案:

1.手动扫码登录
既然模拟登录做不了,selenium也会被识别出来,那就手动扫码登录吧,使用selenium打开淘宝登录页面,再手机打开千牛app扫码登录,方便快捷,永远不怕反爬。代码如下:

# -*- encoding: utf-8 -*-
from selenium import webdriver
import timedef login():"""login"""loginURL = 'https://login.taobao.com/member/login.jhtml'browser = webdriver.Chrome()browser.maximize_window()browser.get(loginURL)print('\nPlease scan code...')time.sleep(10)browser.get('https://zizhanghao.taobao.com/subaccount/monitor/chat_record_query.htm')  # 进入卖家中心return browserlogin()

2.微博登录
淘宝对微博登录的限制较小,可以实现自动登录,前提是需要绑定微博。代码如下:

# -*- encoding: utf-8 -*-
import time
from selenium import webdriver
import numpy as npurl = 'https://login.taobao.com/member/login.jhtml'
driver = webdriver.Chrome()
driver.get(url)
driver.maximize_window()
time.sleep(np.random.randint(1, 3))change = driver.find_element_by_id('J_Quick2Static')
time.sleep(np.random.randint(1, 3))
change.click()weibo = driver.find_element_by_class_name('weibo-login')
time.sleep(np.random.randint(1, 3))
weibo.click()
time.sleep(np.random.randint(1, 3))
name = driver.find_element_by_name('username')
name.send_keys('xxxxxx')      # 微博账号
time.sleep(np.random.randint(1, 3))
passwd = driver.find_element_by_name('password')
passwd.send_keys('xxxxxx')    # 微博密码
time.sleep(np.random.randint(1, 3))
submit = driver.find_element_by_class_name('W_btn_g')
submit.click()

不排除频繁登录跳出验证码的情况,可能就需要识别验证码了,所以需要限制登录次数,或更换IP。

3.使用模拟器登录
亲测可用,运行良好。

4.PC端模拟登录
亲测可用,运行良好。

————————————————————————————————————————————
微信关注号:python爬虫机器学习深度学习

关于淘宝登录的四种解决方案相关推荐

  1. python模拟淘宝登陆_【Python】selenium模拟淘宝登录

    # -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.common.by import By f ...

  2. selenium 成功绕过淘宝登录反爬机制

    前言 selenium + webdriver 在登录淘宝时会出现反爬滑块,该滑块无论怎么滑也滑不成功,只会出现 哎呀,出错了,点击刷新再来一次 有两个问题存在,导致 selenium + webdr ...

  3. selenium成功绕过淘宝登录反爬机制!

    userAgent 信息与正常模式不一致 Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Hea ...

  4. 模拟支付宝、淘宝登录1

    1.进入支付宝首页 GET https://auth.alipay.com/login/index.htm HTTP/1.1 Accept: */* Accept-Language: zh-CN Ac ...

  5. python爬虫淘宝登录_python爬虫实现模拟淘宝登录

    就算所有人都不支持你.这条路会很曲折,你也会一度认为是不是自己选错了,但只要坚持,就算最后没有成功,但努力了就不会有遗憾. python爬虫模拟淘宝登录 小贴士 这个爬虫和搜索引擎的爬虫是有区别的.搜 ...

  6. 如何取淘宝登录的完整cookies

    本人不提供任何服务器端程序,也不提供任何收费抢购软件.该文章仅作为学习软件开发思想的一个思路分析框架.该思路可运用到其他任何网站,京东,天猫,淘宝均可使用,如有侵犯到任何公司的合法权益,请加Q联系删除 ...

  7. python模拟淘宝登录后上下架商品_Python 淘宝系列(三): 模拟登陆成功后获取购物车信息...

    依然采用IE的F12开发者工具分析抓取到的数据. 关键问题 获取token后,重定向地址的获取 一般网站登录成功后,跳转方式主要有两种:(1)服务器返回的响应头中包含 location header, ...

  8. 突破淘宝登录滑块验证反爬,防止识别为Chrome自动控制

    文章首发于慕课网手记,已同步到个人博客:https://www.donlex.cn 上次的文章<在爬100万数据的时候,我发现了爬虫的进阶之路> ,有"怂恿"大家伙去突 ...

  9. 最新突破“淘宝”登录接口方法,隐藏selenium,攻克滑块验证码

    今日因为工作需要,需要抓取淘宝上一些商品详情信息,而商品详情信息必须要在登陆以后才能进行访问,所以想要抓取商品信息,模拟登陆是第一个必须要解决的问题. 淘宝的模拟登陆说难也不难,说不难,也蛮多坑的.今 ...

最新文章

  1. C/C++语言参数传递----函数/方法 参数的指针引用传递
  2. 流量低峰也烦人-lighttpd耗时长问题追查
  3. 实现同步请求_Redis的复制是如何实现的?
  4. 咸宁书写桂花产业-国情研究·万祥军:特色农业谋定大健康
  5. Velocity - 单例还是非单例
  6. C++ std::move/std::forward/完美转发
  7. spark配置lzo
  8. Apple 隐私政策
  9. 第9章 逻辑回归 学习笔记 下
  10. 帮您管好云:阿里云混合云管理平台发布 | 凌云时刻
  11. 蓝桥杯 C语言 试题 历届试题 高僧斗法
  12. java 代码统计工具_java代码行数统计工具
  13. ssdp协议 upnp_【零知ESP8266】教程:SSDP简单服务发现协议示例
  14. Xmanager4注册码
  15. 镭速——FTP服务器概念详解
  16. 本站视频相关的C++新经典系列书籍出版
  17. 推荐 C++图书三人谈
  18. 传统大数据平台的一些常见问题
  19. 使用easyexcel从浏览器下载excel
  20. 无线数字平板探测器维修Mars1717XU-VSI故障分析

热门文章

  1. Python的字典类型实现统计文件字符个数和出现次数
  2. DellOptiPlex 5060台式机WinServer2012系统安装网卡驱动回顾
  3. 【逻辑题】三个日本人
  4. 我用Python制作整蛊软件发送给女友,结果.......我单身了!!
  5. Nutanix荣膺 “超融合基础架构领导者” 称号
  6. 炸弹人游戏(DFS||BFS)
  7. Python-base编码和解码方法
  8. 迁移系统激活已有的正版windows11专业版及office家庭学生版步骤
  9. 区块链系统:公钥和地址
  10. IT培训机构有哪些坑?