http://www.xgezhang.com/python_crawler_jingdong.html

先上我的代码。参考了上面链接的文章

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
# -*- coding: utf-8 -*-
# !/usr/bin/python
import os
import urllib2
import urllib
import cookielib
import re 
import sys
from bs4 import BeautifulSoup
'''
编码方式的设置,在中文使用时用到中文时的处理方式
'''
default_encoding = "utf-8"
if sys.getdefaultencoding() != default_encoding:
  reload(sys)
  sys.setdefaultencoding("utf-8")
def getHtml(url,data={}):
    if(data=={}):
        req=urllib2.Request(url)
    else:
        req=urllib2.Request(url,urllib.urlencode(data))
    html=urllib2.urlopen(req).read()
    return html
try:
    cookie = cookielib.CookieJar()
    cookieProc = urllib2.HTTPCookieProcessor(cookie)
except:
    raise
else:
     opener = urllib2.build_opener(cookieProc)
     opener.addheaders = [('User-Agent','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11')]
     urllib2.install_opener(opener)
auth_url='https://passport.jd.com/uc/loginService'
#auth_url = 'http://www.nowamagic.net/'
home_url='http://usergrade.jd.com/user/consume'
#home_url = 'http://www.nowamagic.net/librarys/nmra/';
url = "https://passport.jd.com/uc/login"
login=getHtml(url)
#print login 
loginSoup = BeautifulSoup(login,'html.parser')
#查找登陆参数中的uuid
uuid = loginSoup.find_all("form")[0].find_all("input")[0]['value']
print uuid
clrName=loginSoup.find_all("form")[0].find_all("input")[6]['name']
clrValue=loginSoup.find_all("form")[0].find_all("input")[6]['value']
'''这俩参数不是必须。。。。
eid=loginSoup.find_all("form")[0].find_all("input")[4]['value']
fp=loginSoup.find_all("form")[0].find_all("input")[5]['value']
'''
#下载验证码图片:
checkPicUrl = loginSoup.find_all("div",id="o-authcode")[0].find_all("img")[0]['src2']
req = getHtml(checkPicUrl)
checkPic = open("checkPic.jpg","w")
checkPic.write(req)
checkPic.close()
#调用mac系统的预览(图像查看器)来打开图片文件
os.system('open /Applications/Preview.app/ checkPic.jpg')
checkCode = raw_input("请输入弹出图片中的验证码:"
#登录URL
url = "http://passport.jd.com/uc/loginService"
# 登陆用户名和密码
postData = {
    'loginname':'你自己的账号',
    'nloginpwd':'你自己的密码',
    'loginpwd':'你自己的密码',
    # 'machineNet':'',
    # 'machineCpu':'',
    # 'machineDisk':'', 
    str(clrName):str(clrValue),
    'uuid':uuid,
    'authcode': checkCode
}
passport=getHtml(url,postData)
print passport
# 初始化一个CookieJar来处理Cookie
'''
cookieJar=cookielib.CookieJar()
# 实例化一个全局opener
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookieJar))
# 获取cookie
req=urllib2.Request(auth_url,post_data,headers)
result = opener.open(req)
# 访问主页 自动带着cookie信息
'''
result = opener.open('http://i.jd.com/user/info')
# 显示结果
#print result.read()
soup=BeautifulSoup(result,'html.parser')
#昵称
nickName = soup.find_all("input"id="nickName")[0]["value"]
print "nickName:",
print nickName

其实在第一次爬的时候确实是成功返回了{“success”:“http://www.jd.com”}。

但是当我回到寝室再次测试的时候却给我返回了“请刷新页面后重新提交”,暂时还没有解决。

本文转自 努力的C 51CTO博客,原文链接:http://blog.51cto.com/fulin0532/1748590

Python爬虫模拟登录京东获取个人信息相关推荐

  1. python京东注册账号_Python爬虫模拟登录京东获取个人信息

    先上我的代码.参考了上面链接的文章# -*- coding: utf-8 -*- # !/usr/bin/python import os import urllib2 import urllib i ...

  2. python过京东app图形验证勾股定理_Python爬虫模拟登录京东获取个人信息

    先上我的代码.参考了上面链接的文章 # -*- coding: utf-8 -*- # !/usr/bin/python import os import urllib2 import urllib ...

  3. 【Python技能树共建】Python爬虫模拟登录

    Python 爬虫模拟登录 Python 爬虫模拟登录是使用脚本实现自动登录,部分站点需要逆向加密逻辑,更多的站点会采用验证码进行鉴权验证. 本文为大家带来最简单的登录,其核心用到的是 request ...

  4. python爬虫 模拟登录人人网过程解析

    这篇文章主要介绍了python爬虫 模拟登录人人网过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 equests 提供了一个叫做sessio ...

  5. python登录教务系统_强智科技教务系统python爬虫模拟登录分析(湖南)

    强智科技教务系统python爬虫模拟登录分析(湖南) 本文章仅用作于学习 前提:最近期末到来,想第一时间看到新出成绩的,于是就有了爬取学校教务系统自己的成绩并通过Qmsg酱推送到自己QQ上的想法,目前 ...

  6. python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例

    转载请注明出处:python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例 我们在前面的文章中已经学习了如果使用python进行数据抓取. 但我们常常会遇到一种场景,就是想要获取的页面内容或者接 ...

  7. python爬虫登陆教程_(python模拟登陆教程)python爬虫模拟登录是什么意思

    python爬虫模拟登录是什么意思 网站需要登录后才能所需要的信息,此时可以设计爬虫进拟登录,原理是利用浏cookie. 一.浏览器访问服务器的过程: (1)浏览器(客户端)向Web服务器发出一个HT ...

  8. 枯燥的寒假生活(一) python爬虫模拟登录whu老教务系统获取期末考试成绩(已失效 , 老教务系统增加了新的反爬, 老教务系统已停用)

    python模拟登录老教务系统(2021.6.24更新) 一.写在前面 之前用爬虫爬取的都是静态网页html中的内容,但是大多数时候需要动态处理网页爬取数据.因为学校出成绩太慢了,每次都自己打开浏览器 ...

  9. python模拟登录qq获取好友信息_使用Python模拟登录QQ邮箱获取QQ好友列表

    最近因开发项目的需要,有一个需求,就是很多SNS网站都有的通过 Email地址 导入好友列表,不过这次要导入的不是Email 列表,而是QQ的好友列表. 实现方式: 通过google一搜,实现的方式大 ...

最新文章

  1. 创建线程池的四种方式_创建线程到底有几种方式?
  2. JQuery Smart UI 简介(五) — 框架设计【前篇】(前台UI层架构)
  3. (二)行为化参数传递代码
  4. 16windows_16_combo组合框
  5. Windows Azure 安全最佳实践 - 第 1 部分:深度解析挑战防御对策
  6. 总结:JDK1.5-JDK1.8各个新特性
  7. React系列---Webpack环境搭建(二)不同环境不同配置
  8. 使用百度UMeditor富文本编辑器,修改自定义图片上传,修改源码
  9. 利用 QQWry.Dat 实现 IP 地址高效检索(PHP)
  10. DeepWalk: Online Learning of Social Representations-2
  11. 提高计算机技能操作水平,计算机操作技能比赛方案
  12. 简述vue-router实现原理
  13. 教你如何迅速秒杀掉:99%的海量数据处理面试题 1
  14. eclipse指定jsp的默认打开方式
  15. 钙钛矿型复合氧化物高熵陶瓷/过渡金属碳氮化物高熵陶瓷/固体氧化物燃料电池(SOFC)材料
  16. 大数据信息资料采集:房产链家二手房新房源出售买卖交易信息采集
  17. Lichee_RV学习系列--CoreMark-Pro移植
  18. java8421码,关于用Java程序实现8421码权限管理 第二部分
  19. PCA和SVD傻傻分不清楚?
  20. Pyecharts绘制日历热力图

热门文章

  1. 微信小程序动态添加Class
  2. Ubuntu18.04下Qt安装
  3. 烙铁头不沾锡原因分析,及烙铁头保养!
  4. 前端进击的巨人(六):知否知否,须知this
  5. 糗事百科 android源码,仿糗事百科Android客户端源码
  6. RFID智能书架,整理图书不再烦恼
  7. Linux内核模块it87出错
  8. 关于计算机网络各层协议
  9. 「停止更新」黑苹果安装教程:联想小新锐7000 i5-7300HQ HD630 GTX1050
  10. s5pv210 android4.0.3调试,如何去掉SGX540硬件加速