Python爬虫模拟登录京东获取个人信息

http://www.xgezhang.com/python_crawler_jingdong.html

先上我的代码。参考了上面链接的文章

# -*- coding: utf-8 -*-

# !/usr/bin/python

import os

import urllib2

import urllib

import cookielib

import re

import sys

from bs4 import BeautifulSoup

'''

编码方式的设置,在中文使用时用到中文时的处理方式

'''

default_encoding = "utf-8"

if sys.getdefaultencoding() != default_encoding:

reload(sys)

sys.setdefaultencoding("utf-8")

def getHtml(url,data={}):

if(data=={}):

req=urllib2.Request(url)

else:

req=urllib2.Request(url,urllib.urlencode(data))

html=urllib2.urlopen(req).read()

return html

try:

cookie = cookielib.CookieJar()

cookieProc = urllib2.HTTPCookieProcessor(cookie)

except:

raise

else:

opener = urllib2.build_opener(cookieProc)

opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11')]

urllib2.install_opener(opener)

auth_url='https://passport.jd.com/uc/loginService'

#auth_url = 'http://www.nowamagic.net/'

home_url='http://usergrade.jd.com/user/consume'

#home_url = 'http://www.nowamagic.net/librarys/nmra/';

url = "https://passport.jd.com/uc/login"

login=getHtml(url)

#print login

loginSoup = BeautifulSoup(login,'html.parser')

#查找登陆参数中的uuid

uuid = loginSoup.find_all("form")[0].find_all("input")[0]['value']

print uuid

clrName=loginSoup.find_all("form")[0].find_all("input")[6]['name']

clrValue=loginSoup.find_all("form")[0].find_all("input")[6]['value']

'''这俩参数不是必须。。。。

eid=loginSoup.find_all("form")[0].find_all("input")[4]['value']

fp=loginSoup.find_all("form")[0].find_all("input")[5]['value']

'''

#下载验证码图片：

checkPicUrl = loginSoup.find_all("div",id="o-authcode")[0].find_all("img")[0]['src2']

req = getHtml(checkPicUrl)

checkPic = open("checkPic.jpg","w")

checkPic.write(req)

checkPic.close()

#调用mac系统的预览(图像查看器)来打开图片文件

os.system('open /Applications/Preview.app/ checkPic.jpg')

checkCode = raw_input("请输入弹出图片中的验证码：")

#登录URL

url = "http://passport.jd.com/uc/loginService"

# 登陆用户名和密码

postData = {

'loginname':'你自己的账号',

'nloginpwd':'你自己的密码',

'loginpwd':'你自己的密码',

# 'machineNet':'',

# 'machineCpu':'',

# 'machineDisk':'',

str(clrName):str(clrValue),

'uuid':uuid,

'authcode': checkCode

}

passport=getHtml(url,postData)

print passport

# 初始化一个CookieJar来处理Cookie

'''

cookieJar=cookielib.CookieJar()

# 实例化一个全局opener

opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))

# 获取cookie

req=urllib2.Request(auth_url,post_data,headers)

result = opener.open(req)

# 访问主页自动带着cookie信息

'''

result = opener.open('http://i.jd.com/user/info')

# 显示结果

#print result.read()

soup=BeautifulSoup(result,'html.parser')

#昵称

nickName = soup.find_all("input", id="nickName")[0]["value"]

print "nickName:",

print nickName

其实在第一次爬的时候确实是成功返回了{“success”：“http://www.jd.com”}。

但是当我回到寝室再次测试的时候却给我返回了“请刷新页面后重新提交”，暂时还没有解决。

本文转自努力的C 51CTO博客，原文链接:http://blog.51cto.com/fulin0532/1748590

Python爬虫模拟登录京东获取个人信息相关推荐

python京东注册账号_Python爬虫模拟登录京东获取个人信息
先上我的代码.参考了上面链接的文章# -*- coding: utf-8 -*- # !/usr/bin/python import os import urllib2 import urllib i ...
python过京东app图形验证勾股定理_Python爬虫模拟登录京东获取个人信息
先上我的代码.参考了上面链接的文章 # -*- coding: utf-8 -*- # !/usr/bin/python import os import urllib2 import urllib ...
【Python技能树共建】Python爬虫模拟登录
Python 爬虫模拟登录 Python 爬虫模拟登录是使用脚本实现自动登录,部分站点需要逆向加密逻辑,更多的站点会采用验证码进行鉴权验证. 本文为大家带来最简单的登录,其核心用到的是 request ...
python爬虫模拟登录人人网过程解析
这篇文章主要介绍了python爬虫模拟登录人人网过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 equests 提供了一个叫做sessio ...
python登录教务系统_强智科技教务系统python爬虫模拟登录分析(湖南)
强智科技教务系统python爬虫模拟登录分析(湖南) 本文章仅用作于学习前提:最近期末到来,想第一时间看到新出成绩的,于是就有了爬取学校教务系统自己的成绩并通过Qmsg酱推送到自己QQ上的想法,目前 ...
python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例
转载请注明出处:python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例我们在前面的文章中已经学习了如果使用python进行数据抓取. 但我们常常会遇到一种场景,就是想要获取的页面内容或者接 ...
python爬虫登陆教程_(python模拟登陆教程)python爬虫模拟登录是什么意思
python爬虫模拟登录是什么意思网站需要登录后才能所需要的信息,此时可以设计爬虫进拟登录,原理是利用浏cookie. 一.浏览器访问服务器的过程: (1)浏览器(客户端)向Web服务器发出一个HT ...
枯燥的寒假生活(一) python爬虫模拟登录whu老教务系统获取期末考试成绩(已失效 , 老教务系统增加了新的反爬, 老教务系统已停用)
python模拟登录老教务系统(2021.6.24更新) 一.写在前面之前用爬虫爬取的都是静态网页html中的内容,但是大多数时候需要动态处理网页爬取数据.因为学校出成绩太慢了,每次都自己打开浏览器 ...
python模拟登录qq获取好友信息_使用Python模拟登录QQ邮箱获取QQ好友列表
最近因开发项目的需要,有一个需求,就是很多SNS网站都有的通过 Email地址导入好友列表,不过这次要导入的不是Email 列表,而是QQ的好友列表. 实现方式: 通过google一搜,实现的方式大 ...

Python爬虫模拟登录京东获取个人信息

Python爬虫模拟登录京东获取个人信息相关推荐

最新文章

热门文章