python京东注册账号_Python爬虫模拟登录京东获取个人信息
先上我的代码。参考了上面链接的文章# -*- coding: utf-8 -*-
# !/usr/bin/python
import os
import urllib2
import urllib
import cookielib
import re
import sys
from bs4 import BeautifulSoup
‘‘‘
编码方式的设置,在中文使用时用到中文时的处理方式
‘‘‘
default_encoding = "utf-8"
if sys.getdefaultencoding() != default_encoding:
reload(sys)
sys.setdefaultencoding("utf-8")
def getHtml(url,data={}):
if(data=={}):
req=urllib2.Request(url)
else:
req=urllib2.Request(url,urllib.urlencode(data))
html=urllib2.urlopen(req).read()
return html
try:
cookie = cookielib.CookieJar()
cookieProc = urllib2.HTTPCookieProcessor(cookie)
except:
raise
else:
opener = urllib2.build_opener(cookieProc)
opener.addheaders = [(‘User-Agent‘,‘Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11‘)]
urllib2.install_opener(opener)
auth_url=‘https://passport.jd.com/uc/loginService‘
#auth_url = ‘http://www.nowamagic.net/‘
home_url=‘http://usergrade.jd.com/user/consume‘
#home_url = ‘http://www.nowamagic.net/librarys/nmra/‘;
url = "https://passport.jd.com/uc/login"
login=getHtml(url)
#print login
loginSoup = BeautifulSoup(login,‘html.parser‘)
#查找登陆参数中的uuid
uuid = loginSoup.find_all("form")[0].find_all("input")[0][‘value‘]
print uuid
clrName=loginSoup.find_all("form")[0].find_all("input")[6][‘name‘]
clrValue=loginSoup.find_all("form")[0].find_all("input")[6][‘value‘]
‘‘‘这俩参数不是必须。。。。
eid=loginSoup.find_all("form")[0].find_all("input")[4][‘value‘]
fp=loginSoup.find_all("form")[0].find_all("input")[5][‘value‘]
‘‘‘
#下载验证码图片:
checkPicUrl = loginSoup.find_all("div",id="o-authcode")[0].find_all("img")[0][‘src2‘]
req = getHtml(checkPicUrl)
checkPic = open("checkPic.jpg","w")
checkPic.write(req)
checkPic.close()
#调用mac系统的预览(图像查看器)来打开图片文件
os.system(‘open /Applications/Preview.app/ checkPic.jpg‘)
checkCode = raw_input("请输入弹出图片中的验证码:")
#登录URL
url = "http://passport.jd.com/uc/loginService"
# 登陆用户名和密码
postData = {
‘loginname‘:‘你自己的账号‘,
‘nloginpwd‘:‘你自己的密码‘,
‘loginpwd‘:‘你自己的密码‘,
# ‘machineNet‘:‘‘,
# ‘machineCpu‘:‘‘,
# ‘machineDisk‘:‘‘,
str(clrName):str(clrValue),
‘uuid‘:uuid,
‘authcode‘: checkCode
}
passport=getHtml(url,postData)
print passport
# 初始化一个CookieJar来处理Cookie
‘‘‘
cookieJar=cookielib.CookieJar()
# 实例化一个全局opener
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))
# 获取cookie
req=urllib2.Request(auth_url,post_data,headers)
result = opener.open(req)
# 访问主页 自动带着cookie信息
‘‘‘
result = opener.open(‘http://i.jd.com/user/info‘)
# 显示结果
#print result.read()
soup=BeautifulSoup(result,‘html.parser‘)
#昵称
nickName = soup.find_all("input", id="nickName")[0]["value"]
print "nickName:",
print nickName
其实在第一次爬的时候确实是成功返回了{“success”:“http://www.jd.com”}。
但是当我回到寝室再次测试的时候却给我返回了“请刷新页面后重新提交”,暂时还没有解决。
python京东注册账号_Python爬虫模拟登录京东获取个人信息相关推荐
- python 网站发送验证码_Python爬虫模拟登录带验证码网站
爬取网站时经常会遇到需要登录的问题,这是就需要用到模拟登录的相关方法.python提供了强大的url库,想做到这个并不难.这里以登录学校教务系统为例,做一个简单的例子. 首先得明白cookie的作用, ...
- python过京东app图形验证勾股定理_Python爬虫模拟登录京东获取个人信息
先上我的代码.参考了上面链接的文章 # -*- coding: utf-8 -*- # !/usr/bin/python import os import urllib2 import urllib ...
- python爬_python爬虫--模拟登录知乎
1.处理登录表单 处理登录表单可以分为2步: 第一.查看网站登录的表单,构建POST请求的参数字典: 第二.提交POST请求. 打开知乎登录界面,https://www.zhihu.com/#sign ...
- python模拟登录qq获取好友信息_使用Python模拟登录QQ邮箱获取QQ好友列表
最近因开发项目的需要,有一个需求,就是很多SNS网站都有的通过 Email地址 导入好友列表,不过这次要导入的不是Email 列表,而是QQ的好友列表. 实现方式: 通过google一搜,实现的方式大 ...
- Python爬虫模拟登录京东获取个人信息
http://www.xgezhang.com/python_crawler_jingdong.html 先上我的代码.参考了上面链接的文章 1 2 3 4 5 6 7 8 9 10 11 12 13 ...
- python抓取京东联盟优惠券_python 爬虫爬取京东ps4售卖情况
#!/usr/bin/env python # -*- coding: utf-8 -*- # @File : HtmlParser.py # @Author: 赵路仓 # @Date : 2020/ ...
- python二手房使用教程_python爬虫爬取链家二手房信息
#coding=utf-8 import requests from fake_useragent import UserAgent from bs4 import BeautifulSoup imp ...
- python模拟登录网站_Python爬虫实战之(四)| 模拟登录京东商城
作者:xiaoyu 微信公众号:Python数据科学 知乎:Python数据分析师 前两篇和大家分享了爬虫中http的一些概念和使用方法,基础篇我们主要介绍了http的请求头,高级篇我们主要介绍了co ...
- 【Python技能树共建】Python爬虫模拟登录
Python 爬虫模拟登录 Python 爬虫模拟登录是使用脚本实现自动登录,部分站点需要逆向加密逻辑,更多的站点会采用验证码进行鉴权验证. 本文为大家带来最简单的登录,其核心用到的是 request ...
最新文章
- 八大操作系统掌门人齐聚 1024 程序员节,千年岳麓见证开源新时代
- cmd命令行修改windows虚拟内存pagefile.sys
- mysql六:索引原理与慢查询优化
- qwidget多个窗口同步_Linux命令screen—终端切换,工作环境保存,画面同步,防断网...
- JavaScript中使用Json
- cmd进入到python安装目录下_在python中安装basemap
- 2152:聪聪可可(点分治)
- jQuery 3 有哪些新东西
- mysql单表大小限制
- 计算机二级数据库题库百度云,计算机二级数据库试题及答案
- CentOS8.3部署GlusterFS
- 关于C#项目开发梳理
- word如何用制表符对齐公式
- 计算机组成:真正理解“乘法器”和“除法器”
- H3C交换机如何查环路
- 线上运行的项目突然变得很卡如何排查?
- 什么是ETL,ETL是什么技术?
- 阿里专家20讲,玩转一站式实时数仓Hologres训练营(限量免费)
- portal无线认证服务器,无线AC配置portal认证功能portal 认证服务器问题
- YY视频直播体验优化实践
热门文章
- Eclipse 里找不到 Servers 面板的原因和处理办法
- 如何修改微软share point site 的页面风格
- SAP Spartacus shipping address页面请求2 - Put Address
- 我的工作日报 - 2020-9-15 星期二
- SAP Fiori Elements - how to create annotation for a property
- SAP CRM webclient ui help link超链接的生成逻辑
- SAP ABAP Netweaver系统的传输请求类型和原始系统的含义
- 一个SAP Marketing Cloud和Kyma的集成
- SAP OData Service group - get entity set
- 使用postman创建Marketing Cloud的Contact