关于淘宝登录的四种解决方案

淘宝登录是爬虫的一个老大难的问题，因为淘宝有那么一群人专门针对爬虫客们下足了功夫，无论你是selenium模拟点击登录，还是利用cookies登录，都会被识别出来，验证码验证始终通过不了，其后台可能采取了有些机器学习的识别手段。

那么我们又有这个需要去登录淘宝然后获取数据，该怎么做呢？？？

下面给出四种解决方案：

1.手动扫码登录
既然模拟登录做不了，selenium也会被识别出来，那就手动扫码登录吧，使用selenium打开淘宝登录页面，再手机打开千牛app扫码登录，方便快捷，永远不怕反爬。代码如下：

# -*- encoding: utf-8 -*-
from selenium import webdriver
import timedef login():"""login"""loginURL = 'https://login.taobao.com/member/login.jhtml'browser = webdriver.Chrome()browser.maximize_window()browser.get(loginURL)print('\nPlease scan code...')time.sleep(10)browser.get('https://zizhanghao.taobao.com/subaccount/monitor/chat_record_query.htm')  # 进入卖家中心return browserlogin()

2.微博登录
淘宝对微博登录的限制较小，可以实现自动登录，前提是需要绑定微博。代码如下：

# -*- encoding: utf-8 -*-
import time
from selenium import webdriver
import numpy as npurl = 'https://login.taobao.com/member/login.jhtml'
driver = webdriver.Chrome()
driver.get(url)
driver.maximize_window()
time.sleep(np.random.randint(1, 3))change = driver.find_element_by_id('J_Quick2Static')
time.sleep(np.random.randint(1, 3))
change.click()weibo = driver.find_element_by_class_name('weibo-login')
time.sleep(np.random.randint(1, 3))
weibo.click()
time.sleep(np.random.randint(1, 3))
name = driver.find_element_by_name('username')
name.send_keys('xxxxxx')      # 微博账号
time.sleep(np.random.randint(1, 3))
passwd = driver.find_element_by_name('password')
passwd.send_keys('xxxxxx')    # 微博密码
time.sleep(np.random.randint(1, 3))
submit = driver.find_element_by_class_name('W_btn_g')
submit.click()

不排除频繁登录跳出验证码的情况，可能就需要识别验证码了，所以需要限制登录次数，或更换IP。

3.使用模拟器登录
亲测可用，运行良好。

4.PC端模拟登录
亲测可用，运行良好。

————————————————————————————————————————————
微信关注号：python爬虫机器学习深度学习

关于淘宝登录的四种解决方案相关推荐

python模拟淘宝登陆_【Python】selenium模拟淘宝登录
# -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.common.by import By f ...
selenium 成功绕过淘宝登录反爬机制
前言 selenium + webdriver 在登录淘宝时会出现反爬滑块,该滑块无论怎么滑也滑不成功,只会出现哎呀,出错了,点击刷新再来一次有两个问题存在,导致 selenium + webdr ...
selenium成功绕过淘宝登录反爬机制！
userAgent 信息与正常模式不一致 Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Hea ...
模拟支付宝、淘宝登录1
1.进入支付宝首页 GET https://auth.alipay.com/login/index.htm HTTP/1.1 Accept: */* Accept-Language: zh-CN Ac ...
python爬虫淘宝登录_python爬虫实现模拟淘宝登录
就算所有人都不支持你.这条路会很曲折,你也会一度认为是不是自己选错了,但只要坚持,就算最后没有成功,但努力了就不会有遗憾. python爬虫模拟淘宝登录小贴士这个爬虫和搜索引擎的爬虫是有区别的.搜 ...
如何取淘宝登录的完整cookies
本人不提供任何服务器端程序,也不提供任何收费抢购软件.该文章仅作为学习软件开发思想的一个思路分析框架.该思路可运用到其他任何网站,京东,天猫,淘宝均可使用,如有侵犯到任何公司的合法权益,请加Q联系删除 ...
python模拟淘宝登录后上下架商品_Python 淘宝系列(三)：模拟登陆成功后获取购物车信息...
依然采用IE的F12开发者工具分析抓取到的数据. 关键问题获取token后,重定向地址的获取一般网站登录成功后,跳转方式主要有两种:(1)服务器返回的响应头中包含 location header, ...
突破淘宝登录滑块验证反爬，防止识别为Chrome自动控制
文章首发于慕课网手记,已同步到个人博客:https://www.donlex.cn 上次的文章<在爬100万数据的时候,我发现了爬虫的进阶之路> ,有"怂恿"大家伙去突 ...
最新突破“淘宝”登录接口方法，隐藏selenium，攻克滑块验证码
今日因为工作需要,需要抓取淘宝上一些商品详情信息,而商品详情信息必须要在登陆以后才能进行访问,所以想要抓取商品信息,模拟登陆是第一个必须要解决的问题. 淘宝的模拟登陆说难也不难,说不难,也蛮多坑的.今 ...

关于淘宝登录的四种解决方案

关于淘宝登录的四种解决方案相关推荐

最新文章

热门文章