好了,最后上完整代码,当当当当~

# -*- coding: utf-8 -*-

import requests

import sys

import urllib2

import re

if __name__ == "__main__":

## 这段代码是用于解决中文报错的问题

reload(sys)

sys.setdefaultencoding("utf8")

posturl = "http://ids.chd.edu.cn/authserver/login?service=http://portal.chd.edu.cn/index.portal"

#保存cookies,不保存cookie很危险,登陆成功后不保存cookie服务器将不知道你已经登录

#或者说服务器不知道你是你,就导致获得页面失败

s = requests.session()

circle = s.get(posturl).text

#查找lt字符串

#长大信息门户中有几个隐藏表单项,lt表单项为一个随机字符串

#其余几个均为固定字符串

#所以我们必须先得到lt字符串

ltString = '

ltAnswer = re.findall(ltString, circle)

lt = ltAnswer[0].replace('

#构造头部信息

head = {

'Accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

'Accept-Encoding' : 'gzip,deflate',

'Accept-Language' : 'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3',

'Host' : 'ids.chd.edu.cn',

'Connection' : 'keep-alive',

#反爬虫技术,这个说明我们是从这个网页进入的

'Referer' : 'http://ids.chd.edu.cn/authserver/login?service=http://portal.chd.edu.cn/index.portal',

'Upgrade-Insecure-Requests' : '1',

#伪装浏览器

'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:50.0) Gecko/20100101 Firefox/50.0'

}

#构造Post数据

postData = {'_eventId' : "submit",

'btn1' : "",

'dllt' : "userNamePasswordLogin",

'execution': "e1s1",

'lt' : lt,

'password' : "*******",

'rmShown' : "1",

'username' : "123456789",

}

loginhtml = s.post(posturl,data=postData,headers=head)

url2 = 'http://portal.chd.edu.cn'

head2 = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:50.0) Gecko/20100101 Firefox/50.0',

'Referer' : 'http://ids.chd.edu.cn/authserver/login?service=http://portal.chd.edu.cn/index.portal'}

scorehtml = s.get(url2,headers=head2)

print scorehtml.text.decode('gbk','ignore')

好了,本次实验到此结束,欢迎一起学习更多知识!

利用python爬虫技术本福特_Python爬虫技术(一)--模拟登陆相关推荐

  1. 利用python爬取租房信息_Python爬虫实战(1)-爬取“房天下”租房信息(超详细)

    #前言html 先看爬到的信息:python 今天主要用到了两个库:Requests和BeautifulSoup.因此我先简单的说一下这两个库的用法,提到的都是此文须要用到的.编程 #Requests ...

  2. 利用python爬取豆瓣音乐_python爬虫之豆瓣音乐top250

    回家很久了,实在熬不住,想起来爬点数据玩一玩,之前自己笔记本是win7加ubuntu16.04双系统,本打算在ubuntu里写代码的,可是回到家ubuntu打开一直是紫屏,百度知乎方法用了也没解决,厉 ...

  3. 利用python爬取豆瓣音乐_Python爬虫小白入门(七)爬取豆瓣音乐top250

    抓取目标: 豆瓣音乐top250的歌名.作者(专辑).评分和歌曲链接 使用工具: requests + lxml + xpath. 我认为这种工具组合是最适合初学者的,requests比python自 ...

  4. python微信爬取教程_PYTHON爬虫之旅系列教程之【利用Python开发微信公众平台一】...

    感谢大家的等待,好啦,都准备好瓜子.板凳,老司机要发车啦-- 本系列课程讲述"PYTHON爬虫之旅",具体大纲可参考:[PYTHON爬虫之旅]概要目录. 本节课讲述如何利用Pyth ...

  5. python什么时候用框架_python爬虫-什么时候选择selenium框架框架?

    不知不觉已经从事Python编程开发5年了,Python刚开始其实不是很起眼,但是随着大数据越来越活,现在Python也越来越火了,但是目前我主要从事的Python工作还是以数据挖掘.数据爬虫技术深度 ...

  6. python爬虫网络数据包_Python爬虫之多线程图虫网数据爬取(十六)

    Python爬虫之多线程图虫网数据爬取(十六) 发布时间:2019-05-14 10:11, 浏览次数:289 , 标签: Python 原创不易,转载前请注明博主的链接地址:Blessy_Zhu h ...

  7. python爬虫爬图片教程_python爬虫实战之爬取京东商城实例教程

    前言 本文主要介绍的是利用python爬取京东商城的方法,文中介绍的非常详细,下面话不多说了,来看看详细的介绍吧. 主要工具 scrapy BeautifulSoup requests 分析步骤 1. ...

  8. python爬虫微博评论图片_python爬虫爬取微博评论

    原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...

  9. python手机壁纸超清_Python爬虫-王者荣耀高清壁纸下载

    绪论 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.python是一种跨平台的计算机程序设计语言.是一种 ...

最新文章

  1. “九头虫”病毒技术分析报告
  2. ALV标准的分类小计功能
  3. SuperMap iDesktop 8C 进行地图SQL查询并显示结果操作示例
  4. Redis之压缩链表ziplist
  5. java 线上运维_一次java应用线上运维实战
  6. 管理Exchange 2003客户端访问
  7. java jar包收集
  8. linux运行程序+后注销,linux – 如果我启动后台进程然后注销,它会继续运行吗?...
  9. ConcurrentHashMapK, V的实现
  10. 面试官:你连 RESTful 都不知道我怎么敢要你?| 原力计划
  11. python subprocess pipe_python类库31[进程subprocess与管道pipe]
  12. 转:浅析C++中的this指针
  13. Linux之touch命令
  14. HDU2046 骨牌铺方格【递推】
  15. 3.4选择性嵌入服务容器
  16. ISA2000资料大全(详细)
  17. 移动平均法,滑动平均模型法(Moving average,MA)
  18. NLP:自然语言处理技术近十年发展技术更迭的简介、案例之详细攻略(持续更新)daiding待更新
  19. 【慕课-湖南大学】服务设计与商业模式
  20. 计算机打印机安装步骤,打印机安装步骤

热门文章

  1. ICCV 2019 COCO Mapillary挑战赛冠军团队技术分享
  2. Byte Cup 2018机器学习大赛进入冲刺阶段,最全资料帮你快速上手!
  3. 重磅 | 带学斯坦福CS231n计算机视觉课+带打全球顶级kaggle大赛
  4. 爬虫笔记10Scrapy-框架
  5. 【Redis系列】深入浅出Redis主从复制之读写分离【一篇搞懂Redis复制】
  6. username is marked non-null but is null
  7. Web安全——服务器端请求伪造(SSRF)
  8. Windows10 家庭版——开启Hyper-V虚拟机
  9. IDEA2021.1.2版创建Java Web项目并配置Tomcat
  10. mysql卸载后root还在_CentoOs7 Mysql卸载后重新安装缺少/root/.mysql_secret