1.    Requests库安装

  Windows平台安装说明:

  直接以管理员身份打开cmd运行界面,使用pip管理工具进行requests库的安装。

  具体安装命令如下:

  >pip install pip

2.    Requests库安装验证

Requests库安装完成后,验证安装是否成功。直接在python IDLE GUI环境下导入requests库,并简单使用requests.get(url)测试。

测试命令如下:

  >>>import requests>>>r = requests.get(“http://www.baidu.com”)>>>r>>>r.status_code>>>r.text>>>r.encode

 3.    HTTP协议

  HTTP是一个机遇“请求”与“响应”模式的、无状态的应用层协议,起采用URL作为定位网络资源的表示,具体的URL格式见以下内容。

3.1.      URL标准格式

  http://host:[:port][path]
host:合法的Internet主机域名或IP地址port:端口号,缺省端口为80path:请求资源的路径

3.2.      HTTP URL实例

  http://www.baidu.com
http://123.234.123.234/study

3.3.      HTTP URL的理解

  URL是通过HTTP协议来存取资源的Internet路径,一个URL对应一个数据资源。

3.4.      HTTP协议资源的操作方法

4.    Requests库7中方法

  

5.    Requests库2个重要对象

  我们首先导入requests库,然后尝试获取http://www.baidu.com网页。

>>>import requests>>>r = requests.get(“http://www.baidu.com”)

  上面这个使用requests库get方法抓取网页的过程,就产生了requests库的2个重要对象,具体对象说明如下。

  r就是“Response响应对象”,而requests.get()就是“Request请求对象”。其中Response对象包含服务返回的所有信息,同时也包含request请求信息内容。

   5.1.      Response对象

 

  Response对象包含了服务返回的所有信息内容,我们通多response这个对象可以获取任何我们想要获取的信息。

  同时Response对象也包含 的request信息内容,如下图所示,通过r.request.headers我们就是可以获取request请求头的信息内容。

 5.2.      Response对象的属性

  以下列表中,罗列出来了Response对象的几个常用属性。

  

5.3.      理解Response编码

  

  r.encoding:如果header中不存在charset,则默认编码方式为ISO-8859-1。

  注:r.text默认是根据r.encoding的编码方式来显示网页的内容。

  r.apparent_encoding:根据网页内容分析出编码的方式,可以看作是r.encoding的备选。

6.    爬取网页通用代码框架

6.1.      理解requests库异常

  r = requests.get(url) 进行网络资源获取的时候,可能会出现这样或者那样的异常请,我们需要有个稳定的处理框架来处理各种请求异常,以保证代码程序处理的稳定性。

  首先,我们学习和了解以下requests库的异常处理7中方式,具体内容如下。

  

  

6.2.      通用代码框架

  

转载于:https://www.cnblogs.com/my1e3/p/6642875.html

python 之Requests库学习笔记相关推荐

  1. 全国计算机等级考试二级Python精品题库学习笔记1

    全国计算机等级考试二级Python精品题库学习笔记1 精品试卷01 精品试卷01程序题 基本操作题 2:随机验证码 基本操作题 3:比赛成绩计算 Turtle 绘图题:同心圆 简单应用题 2:员工工资 ...

  2. Python的matplotlib库学习笔记第一篇

    各位大佬,小松鼠有什么不对的地方,请大家赐教. matplotlib.pyplot是绘制各类可视化图形的命令字库,相当于Matplotlib库的快捷方式 导入:import matplotlib.py ...

  3. python xlwings 切片_Python xlwings库学习笔记(1)

    Python xlwings库学习笔记(1) Python是最近几年很火的编程语言,被办公自动化的宣传吸引入坑,办公自动化必然绕不开Excel的操作,能操作Excel的库有很多,例如: xlrd xl ...

  4. python标准库学习笔记

    原创:python标准库学习笔记 数据结构 bisect 模块里实现了一个向列表插入元素时也会顺便排序的算法. struct - 二进制数据结构:用途:在 Python 基本数据类型和二进制数据之间进 ...

  5. 深度学习常用python库学习笔记

    深度学习常用python库学习笔记 常用的4个库 一.Numpy库 1.数组的创建 (1)np.array() (2)np.zeros() (3)np.ones() (4)np.empty() (5) ...

  6. Python pillow库学习笔记

    Python pillow库学习笔记 PIL( Python Imaging Library)是 Python 的第三方图像处理库,由于其功能丰富,API 简洁易用,因此深受好评. 自 2011 年以 ...

  7. python中requests库的用途-数据爬虫(三):python中requests库使用方法详解

    有些网站访问时必须带有浏览器等信息,如果不传入headers就会报错,如下 使用 Requests 模块,上传文件也是如此简单的,文件的类型会自动进行处理: 因为12306有一个错误证书,我们那它的网 ...

  8. Python 的 requests 库的用法

    Python爬虫利器一之Requests库的用法:http://cuiqingcai.com/2556.html Python利用Requests库写爬虫(一):http://www.jianshu. ...

  9. colly爬虫库学习笔记

    colly爬虫库学习笔记 前言 稍微的学习了一下Go语言的基础知识(错误处理和协程通道这些还没看),想着能不能做点东西,突然想到自己当时学了python之后就是专门为了写爬虫(虽然后来也咕了,只会一个 ...

最新文章

  1. easy_install与pip 区别
  2. 电动力学每日一题 2021/10/15 Fourier变换法计算均匀电流密度产生的磁场
  3. tokudb mysql_【MySQL】TokuDB引擎安装教程
  4. java 实现loading效果_简单实现JS Loading功能
  5. jmeter如何定位网络延时_JMeter用户定义变量和properties变量高级使用
  6. php树形结构数组转化
  7. .net 调用css/javascipt出现的问题及解决
  8. 小白高速变大神,零基础菜鸟应该怎么学编程
  9. python升序和降序排序_sql升序和降序(orderby升序和降序排列显示)
  10. bigdecimal负数变正数_Java中BigDecimal的8种舍入模式
  11. SpringCloud(三)了解了概念,现在来验证一下,玩个小案例
  12. ffiddler抓取手机(app)https包
  13. 金蝉机器人_《金蝉脱壳2》残暴!机器人身份姓名首次曝光监狱更具压迫感
  14. 从零开始之驱动发开、linux驱动(二十九、mmap原理)
  15. 前端基础-TCP/IP 不完全详解
  16. 《机器学习实战》学习第一章
  17. 安卓13开发者模式怎么开?
  18. 集成电路设计学习笔记(二)基于IC617反相器设计之原理图绘制
  19. 阿里云centOS 、linux 常用安全软件
  20. 超静音服务器性能强,静音服务器:最适合办公环境的静音服务器

热门文章

  1. 轻量级PHP接口框架PhalApi开源接口框架 v2.17.1源码
  2. 苹果cms V8模板 黑色自适应电影模板
  3. unity 角度限制_喵的Unity游戏开发之路 推球:游戏中的物理
  4. php callback 多线程,PHP cURL并发里的callback那行是什么效能
  5. 8.8.8.8,Google推出免费DNS解析服务器
  6. 6个重要的.NET概念:栈,堆,值类型,引用类型,装箱,拆箱
  7. 深入了解ASP.NET运行内幕
  8. CSS语法和CSS优先级
  9. Linux运维:cobbler
  10. 【今日CV 计算机视觉论文速览】Fri, 22 Feb 2019