requests是一个很实用的Python HTTP客户端库,编写爬虫和测试服务器响应数据时经常会用到。可以说,Requests 完全满足如今网络的需求

本文全部来源于官方文档 http://docs.python-requests.org/en/master/

安装方式一般采用$ pip install requests。其它安装方式参考官方文档

HTTP - requests

import requests

GET请求

r  = requests.get('http://httpbin.org/get')

传参

>>> payload = {'key1''value1''key2''value2', 'key3': None}
>>> r = requests.get('http://httpbin.org/get'params=payload)

http://httpbin.org/get?key2=value2&key1=value1

Note that any dictionary key whose value is None will not be added to the URL's query string.

参数也可以传递列表

>>> payload = {'key1''value1''key2': ['value2''value3']}

>>> r = requests.get('http://httpbin.org/get'params=payload)
>>> print(r.url)
http://httpbin.org/get?key1=value1&key2=value2&key2=value3

r.text 返回headers中的编码解析的结果,可以通过r.encoding = 'gbk'来变更解码方式

r.content返回二进制结果

r.json()返回JSON格式,可能抛出异常

r.status_code

r.raw返回原始socket respons,需要加参数stream=True

>>> r = requests.get('https://api.github.com/events'stream=True)

>>> r.raw
<requests.packages.urllib3.response.HTTPResponse object at 0x101194810>

>>> r.raw.read(10)
'\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03'

将结果保存到文件,利用r.iter_content()

with open(filename'wb'as fd:
    for chunk in r.iter_content(chunk_size):
        fd.write(chunk)

传递headers

>>> headers = {'user-agent''my-app/0.0.1'}
>>> r = requests.get(urlheaders=headers)

传递cookies

>>> url = 'http://httpbin.org/cookies'

>>> r = requests.get(urlcookies=dict(cookies_are='working'))
>>> r.text
'{"cookies": {"cookies_are": "working"}}'

POST请求

传递表单

r = requests.post('http://httpbin.org/post'data = {'key':'value'})

通常,你想要发送一些编码为表单形式的数据—非常像一个HTML表单。 要实现这个,只需简单地传递一个字典给 data 参数。你的数据字典 在发出请求时会自动编码为表单形式:

>>> payload = {'key1''value1''key2''value2'}

>>> r = requests.post("http://httpbin.org/post"data=payload)
>>> print(r.text)
{
  ...
  "form": {
    "key2": "value2",
    "key1": "value1"
  },
  ...
}

很多时候你想要发送的数据并非编码为表单形式的。如果你传递一个 string 而不是一个dict ,那么数据会被直接发布出去。

>>> url = 'https://api.github.com/some/endpoint'
>>> payload = {'some''data'}

>>> r = requests.post(urldata=json.dumps(payload))

或者

>>> r = requests.post(urljson=payload)

传递文件

url = 'http://httpbin.org/post'
>>> files = {'file'open('report.xls''rb')}

>>> r = requests.post(urlfiles=files)

配置files,filename, content_type and headers

files = {'file': ('report.xls'open('report.xls''rb'), 'application/vnd.ms-excel', {'Expires''0'})}

files = {'file': ('report.csv''some,data,to,send\nanother,row,to,send\n')}

响应

r.status_code

r.heards

r.cookies

跳转

By default Requests will perform location redirection for all verbs except HEAD.

>>> r = requests.get('http://httpbin.org/cookies/set?k2=v2&k1=v1')

>>> r.url
'http://httpbin.org/cookies'

>>> r.status_code
200

>>> r.history
[<Response [302]>]

If you're using HEAD, you can enable redirection as well:

r=requests.head('http://httpbin.org/cookies/set?k2=v2&k1=v1',allow_redirects=True)

You can tell Requests to stop waiting for a response after a given number of seconds with the timeoutparameter:

requests.get('http://github.com'timeout=0.001)

高级特性

来自 <http://docs.python-requests.org/en/master/user/advanced/#advanced>

session,自动保存cookies,可以设置请求参数,下次请求自动带上请求参数

s = requests.Session()

s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
r = s.get('http://httpbin.org/cookies')

print(r.text)
# '{"cookies": {"sessioncookie": "123456789"}}'

session可以用来提供默认数据,函数参数级别的数据会和session级别的数据合并,如果key重复,函数参数级别的数据将覆盖session级别的数据。如果想取消session的某个参数,可以在传递一个相同key,value为None的dict

s = requests.Session()
s.auth = ('user''pass') #权限认证
s.headers.update({'x-test''true'})

# both 'x-test' and 'x-test2' are sent
s.get('http://httpbin.org/headers'headers={'x-test2''true'})

函数参数中的数据只会使用一次,并不会保存到session中

如:cookies仅本次有效

r = s.get('http://httpbin.org/cookies'cookies={'from-my''browser'})

session也可以自动关闭

with requests.Session() as s:
    s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')

响应结果不仅包含响应的全部信息,也包含请求信息

r = requests.get('http://en.wikipedia.org/wiki/Monty_Python')

r.headers

r.request.headers

SSL证书验证

Requests可以为HTTPS请求验证SSL证书,就像web浏览器一样。要想检查某个主机的SSL证书,你可以使用 verify 参数:

>>> requests.get('https://kennethreitz.com'verify=True)
requests.exceptions.SSLError: hostname 'kennethreitz.com' doesn't match either of '*.herokuapp.com', 'herokuapp.com'

在该域名上我没有设置SSL,所以失败了。但Github设置了SSL:

>>> requests.get('https://github.com'verify=True)
<Response [200]>

对于私有证书,你也可以传递一个CA_BUNDLE文件的路径给 verify 。你也可以设置REQUEST_CA_BUNDLE 环境变量。

>>> requests.get('https://github.com'verify='/path/to/certfile')

如果你将 verify 设置为False,Requests也能忽略对SSL证书的验证。

>>> requests.get('https://kennethreitz.com'verify=False)
<Response [200]>

默认情况下, verify 是设置为True的。选项 verify 仅应用于主机证书。

你也可以指定一个本地证书用作客户端证书,可以是单个文件(包含密钥和证书)或一个包含两个文件路径的元组:

>>> requests.get('https://kennethreitz.com'cert=('/path/server.crt''/path/key'))
<Response [200]>

响应体内容工作流

默认情况下,当你进行网络请求后,响应体会立即被下载。你可以通过 stream 参数覆盖这个行为,推迟下载响应体直到访问 Response.content 属性:

tarball_url = 'https://github.com/kennethreitz/requests/tarball/master'
r = requests.get(tarball_urlstream=True)

此时仅有响应头被下载下来了,连接保持打开状态,因此允许我们根据条件获取内容:

if int(r.headers['content-length']) < TOO_LONG:
  content = r.content
  ...

如果设置stream为True,请求连接不会被关闭,除非读取所有数据或者调用Response.close。

可以使用contextlib.closing来自动关闭连接:

import requests

from contextlib

import closing

tarball_url 'https://github.com/kennethreitz/requests/tarball/master'

file r'D:\Documents\WorkSpace\Python\Test\Python34Test\test.tar.gz'

with closing(requests.get(tarball_url, stream=True)) as r:

with open(file'wb'as f:

for data in r.iter_content(1024):

f.write(data)

Keep-Alive

来自 <http://docs.python-requests.org/en/master/user/advanced/>

同一会话内你发出的任何请求都会自动复用恰当的连接!

注意:只有所有的响应体数据被读取完毕连接才会被释放为连接池;所以确保将 stream设置为 False 或读取 Response 对象的 content 属性。

流式上传

Requests支持流式上传,这允许你发送大的数据流或文件而无需先把它们读入内存。要使用流式上传,仅需为你的请求体提供一个类文件对象即可:

读取文件请使用字节的方式,这样Requests会生成正确的Content-Length

with open('massive-body''rb'as f:
    requests.post('http://some.url/streamed'data=f)

分块传输编码

对于出去和进来的请求,Requests也支持分块传输编码。要发送一个块编码的请求,仅需为你的请求体提供一个生成器

注意生成器输出应该为bytes

def gen():
    yield b'hi'
    yield b'there'

requests.post('http://some.url/chunked'data=gen())

For chunked encoded responses, it's best to iterate over the data using Response.iter_content(). In an ideal situation you'll have set stream=True on the request, in which case you can iterate chunk-by-chunk by calling iter_content with a chunk size parameter of None. If you want to set a maximum size of the chunk, you can set a chunk size parameter to any integer.

POST Multiple Multipart-Encoded Files

来自 <http://docs.python-requests.org/en/master/user/advanced/>

<input type="file" name="images" multiple="true" required="true"/>

To do that, just set files to a list of tuples of (form_field_name, file_info):

>>> url = 'http://httpbin.org/post'
>>> multiple_files = [
        ('images', ('foo.png', open('foo.png', 'rb'), 'image/png')),
        ('images', ('bar.png', open('bar.png', 'rb'), 'image/png'))]
>>> r = requests.post(urlfiles=multiple_files)
>>> r.text
{
  ...
  'files': {'images': 'data:image/png;base64,iVBORw ....'}
  'Content-Type': 'multipart/form-data; boundary=3131623adb2043caaeb5538cc7aa0b3a',
  ...
}

Custom Authentication

Requests allows you to use specify your own authentication mechanism.

Any callable which is passed as the auth argument to a request method will have the opportunity to modify the request before it is dispatched.

Authentication implementations are subclasses of requests.auth.AuthBase, and are easy to define. Requests provides two common authentication scheme implementations in requests.auth:HTTPBasicAuth and HTTPDigestAuth.

Let's pretend that we have a web service that will only respond if the X-Pizza header is set to a password value. Unlikely, but just go with it.

from requests.auth import AuthBase

class PizzaAuth(AuthBase):
    """Attaches HTTP Pizza Authentication to the given Request object."""
    def __init__(selfusername):
        # setup any auth-related data here
        self.username = username

def __call__(selfr):
        # modify and return the request
        r.headers['X-Pizza'= self.username
        return r

Then, we can make a request using our Pizza Auth:

>>> requests.get('http://pizzabin.org/admin'auth=PizzaAuth('kenneth'))
<Response [200]>

来自 <http://docs.python-requests.org/en/master/user/advanced/>

流式请求

r = requests.get('http://httpbin.org/stream/20'stream=True)

for line in r.iter_lines():

代理

If you need to use a proxy, you can configure individual requests with the proxies argument to any request method:

import requests

proxies = {
  'http''http://10.10.1.10:3128',
  'https''http://10.10.1.10:1080',
}

requests.get('http://example.org'proxies=proxies)

To use HTTP Basic Auth with your proxy, use the http://user:password@host/ syntax:

proxies = {'http''http://user:pass@10.10.1.10:3128/'}

超时

If you specify a single value for the timeout, like this:

r = requests.get('https://github.com'timeout=5)

The timeout value will be applied to both the connect and the read timeouts. Specify a tuple if you would like to set the values separately:

r = requests.get('https://github.com'timeout=(3.0527))

If the remote server is very slow, you can tell Requests to wait forever for a response, by passing None as a timeout value and then retrieving a cup of coffee.

r = requests.get('https://github.com'timeout=None)

来自 <http://docs.python-requests.org/en/master/user/advanced/>

转载于:https://www.cnblogs.com/linkxu1989/p/9197406.html

python requests用法总结相关推荐

  1. (转)python requests 高级用法 -- 包括SSL 证书错误的解决方案

    (转)python requests 高级用法 -- 包括SSL 证书错误的解决方案 参考文章: (1)(转)python requests 高级用法 -- 包括SSL 证书错误的解决方案 (2)ht ...

  2. requests用法

    # -*- coding: cp936 -*- #xiaodeng #python 27 #requests用法 #获取http://www.weather.com.cn/data/sk/101010 ...

  3. python自动化测试框架开发_Postar 接口自动化测试框架 基于python+requests+pytest实现...

    Postar 接口测试工具,基于python+requests+pytest实现. 特点 Postar makes it easier to interface testing more quickl ...

  4. Python pandas用法

    Python pandas用法 无味之味关注 12019.01.10 15:43:25字数 2,877阅读 91,914 介绍 在Python中,pandas是基于NumPy数组构建的,使数据预处理. ...

  5. python goto 用法

    python goto 用法 pip install goto-statement from goto import with_goto @with_goto def range(start, sto ...

  6. Python SQLite 用法

    Python SQLite 用法 具体可以参考网址 代码: #导入 import sqlite3 #连接库,如果数据库不存在,那么它就会被创建,最后将返回一个数据库对象. # test.db:数据路路 ...

  7. 浅谈python+requests接口自动化框架

    为什么要做接口自动化框架 1.业务与配置的分离 2.数据与程序的分离:数据的变更不影响程序 3.有日志功能,实现无人值守 4.自动发送测试报告 5.不懂编程的测试人员也可以进行测试 正常接口测试的流程 ...

  8. python requests 爬取数据

    python requests 爬取数据 import requests from lxml import etree import time import pymysql import json h ...

  9. Python requests 多线程抓取 出现HTTPConnectionPool Max retires exceeded异常

    Python requests 多线程抓取 出现HTTPConnectionPool Max retires exceeded异常 参考文章: (1)Python requests 多线程抓取 出现H ...

最新文章

  1. EasyExcle使用小结
  2. 德语语言文学考研c1,2015-2016同济大学德语语言文学初试考研经验(下)
  3. s5p4418 Android 4.4.2 驱动层 HAL层 服务层 应用层 开发流程记录(一 硬件驱动层)
  4. numpy——stack
  5. ubuntu php7.4,在Ubuntu 18.04/19.04/16.04版本上安装PHP 7.4的简单方法
  6. [Java基础]接口组成(默认方法,静态方法,私有方法)
  7. 拓端tecdat|使用SAS Enterprise Miner进行数据挖掘:信用评分构建评分卡模型
  8. www.gc.com.cn\/ios\/iphone.html,iOS系统安装gcc
  9. Linux内核编程打印所有线程信息
  10. STM32串口通信实例
  11. 饥荒服务器运行时cpu的占用,饥荒联机版服务器卡顿原因分析及解决教程_饥荒联机版服务器卡顿怎么解决_游戏堡...
  12. 融合零样本学习和小样本学习的弱监督学习方法综述
  13. VMware虚拟机复制文件卡死的问题
  14. Thematic Contests -codeforce
  15. PHP添加文字图片水印
  16. mysql-下划线转驼峰-转载
  17. linux下.exe文件的安装与使用
  18. python棋类项目规划一——五子棋游戏简易版——项目一
  19. c语言怎么进行字符串比较,c语言怎么进行字符串比较
  20. java实现邮件发送_基于JavaMail的Java实现简单邮件发送功能

热门文章

  1. 北大计算机大神,北大数学大神有多强?简直叹为观止
  2. 怎么获取web开发怎么获取手机的唯一标识_PYTHON实现北京住宅小区数据抓取-(Web服务API-地点检索服务)
  3. centos下搭建网站服务器,Centos7搭建web服务器
  4. cnn神经网络可以用于数据拟合吗_代码详解:最全面的卷积神经网络介绍,都在这里了...
  5. eclipse配置java环境_Java工作环境的配置与Eclipse的安装过程
  6. 安徽大学计算机语言学考研真题,安徽大学外国语言学及应用语言学考研经验考研真题考研参考书复试分数线...
  7. 5 华为兼容性 双指缩放_华为EMUI10“滚屏翻译”之背后的学问
  8. java 前端页面传过来的值怎么防止篡改_杂谈!了解一些额外知识,让你的前端开发锦上添花...
  9. mysql安全权限的讲解
  10. vba htm转成图片_提取1000页PPT的图片,同事花了两小时,我只花了两分钟