这篇文章主要介绍了Python requests获取网页常用方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

主要记录使用 requests 模块获取网页源码的方法

class Crawler(object):

"""

采集类

"""

def __init__(self, base_url):

self._base_url = base_url

self._cookie = None

self._getCookie()

def _getCookie(self):

"""

获取站点cookie

:return:

"""

try:

res = requests.get(self._base_url)

res.raise_for_status()

# TODO response.cookies获取到的是一个cookiejar对象,需要使用requests.utils.dict_from_cookiejar来

# TODO 将cookiejar对象转换为一个字典,这个字典后续使用的时候,在请求时直接传入就可以了,

# 如 requests.get(url, cookies=cookies)

self._cookie = requests.utils.dict_from_cookiejar(res.cookies)

print self._cookie

except Exception as e:

print e

def get_html_text(self, url, **kwargs):

"""

爬取网页的通用代码框架

:param url:

:param method:

:param kwargs:

:return:

"""

try:

kwargs.setdefault('cookies', self._cookie)

res = requests.get(url, **kwargs)

# TODO 若响应状态码不是200, 抛出 HTTPError 异常

res.raise_for_status()

res.encoding = res.apparent_encoding

# print requests.utils.dict_from_cookiejar(res.cookies)

return res.text

except Exception as e:

print traceback.print_exc()

return

本文标题: Python requests获取网页常用方法解析

本文地址: http://www.cppcns.com/jiaoben/python/301017.html

python requests.get无法取出网页_Python requests获取网页常用方法解析相关推荐

  1. python requests下载网页_Python requests 获取网页一般的方法

    主要记录使用 requests 模块获取网页源码的方法 class Crawler(object): """ 采集类 """ def __i ...

  2. python获取网页标题_Python2获取网页标题

    Python获取网页标题 使用Python2.x的urllib2和lxml,速度应该还快于BeautifulSoup4(话说回来,为什么大家都要用BS4呢?一个XPATH不就完了吗) 没有安装过的,用 ...

  3. 获取网页源代码 python_python 获取网页源代码

    import re #正则表达式模块 import urllib.request import time #时间模块 import string #字符串模块 def getHtml(url):f=u ...

  4. 爬取网页时自动获取网页编码信息,并对特殊的乱码页面(压缩过的网页内容)用gzip进行解码。...

    gzip的命名空间引用如下:using System.IO.Compression; 获取网页编码和信息 /// <summary>         /// create time 201 ...

  5. 如何用php获取网页表格,PHP获取网页上任意表格中内容的通用程序的制作

    在工作中,经常需要对网页上的表格内容进行处理,但是,由于表格内容制作过程中的随意性,跨行跨列经常发生,所以我作了这几个函数,以获取表格的内容,程序中重要的地方已作了注解,所以在此不再重复说明,经过测试 ...

  6. python谷歌翻译 频率限制_Django限制API访问频率常用方法解析

    需求描述: 平台中需要编写接口供第三方调用,需要控制调用频率,需求为5s内调用一次后不得再次调用. 解决思路 1.Django官方插件库中有个django-ratelimit插件可以满足要求, dja ...

  7. python编写请求参数带文件_python requests 库请求带有文件参数的接口实例

    有些接口参数是一个文件格式,比如fiddler 抓包参数如下显示 这个接口的 form-data fiddler 显示的和不带文件参数的接口有明显区别,显示的不是简单的键值对,所以我们也不能只通过 d ...

  8. python api开发用什么框架_python+requests接口自动化框架

    为什么要做接口自动化框架 1.业务与配置的分离 2.数据与程序的分离:数据的变更不影响程序 3.有日志功能,实现无人值守 4.自动发送测试报告 5.不懂编程的测试人员也可以进行测试 正常接口测试的流程 ...

  9. python excel取数 生成报告_python+requests+excel+unittest+ddt接口自动化数据驱动并生成html报告(二)...

    可以参考 python+requests接口自动化完整项目设计源码(一)https://www.cnblogs.com/111testing/p/9612671.html

最新文章

  1. 旧版Requests库
  2. Reactor三种线程模型与Netty线程模型
  3. 亚马逊S3文件存储的可视化
  4. 按比例切分组合数值(洛谷P1008、P1618题解,Java语言描述)
  5. 字符串,字典,元祖,列表
  6. 蓝桥杯python小学组_蓝桥杯python组如何准备
  7. 深圳市城中村有哪些,在哪里?请知道的朋友告知,谢谢了!
  8. 计算机应用发展史的第四代,1.1.1 计算机的概念及其发展史
  9. 普普通通的算法期末考试试卷
  10. 华为Mate系列主要参数
  11. 宇视录像机轮巡配置步骤
  12. python3.6+PyQt5安装
  13. Android检查GPU呈现模式和过度绘制
  14. python画蛋糕祝福图片_蛋糕祝福语创意幽默 创意卡通生日蛋糕图片
  15. OLED_I2C_3D_Cube
  16. 从blob协议的加密视频地址下载视频
  17. php手册学习记录(入门指引处理表单)
  18. Crosswalk Project for Linux
  19. 客户同情和客户同理心的区别
  20. [MR]曲柄滑块机械臂奇点 Crank-slider mechanism Singularities

热门文章

  1. Android点击通知进入详情,Android 点击通知进入正在运行的程序
  2. 灰色模型 java代码_灰色模型的简单Java实现
  3. Linux查找树莓派ip地址,让树莓派“说”出自己的IP地址
  4. 莫代尔是什么?它有哪些优缺点?
  5. 光源选型的要素有哪些?
  6. 虚拟机网卡的相关知识
  7. 访问通信录 适配iOS7
  8. swift学习之元组
  9. HDU 1874 畅通工程续 最短路
  10. 开心的小明 (NYOJ49) [动态规划.01背包]