requests:HTTP for Humans    http://www.python-requests.org

1. requests 库的安装

  Run => cmd => pip install requests

2. requests 的安装小测试:抓取百度主页内容(IDLE)

>>> import requests
>>> r = requests.get("http://www.baidu.com")
>>> r.status_code
200
>>> r.encoding = 'utf-8'
>>> r.text
'<!DOCTYPE html>\r\n<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8><meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer><link rel=stylesheet type=text/css href=http://s1.bdstatic.com/r/www/cache/bdorz/baidu.min.css><title>百度一下,你就知道</title></head> <body link=#0000cc> <div id=wrapper> <div id=head> <div class=head_wrapper> <div class=s_form> <div class=s_form_wrapper> <div id=lg> <img hidefocus=true src=//www.baidu.com/img/bd_logo1.png width=270 height=129> </div> <form id=form name=f action=//www.baidu.com/s class=fm> <input type=hidden name=bdorz_come value=1> <input type=hidden name=ie value=utf-8> <input type=hidden name=f value=8> <input type=hidden name=rsv_bp value=1> <input type=hidden name=rsv_idx value=1> <input type=hidden name=tn value=baidu><span class="bg s_ipt_wr"><input id=kw name=wd class=s_ipt value maxlength=255 autocomplete=off autofocus></span><span class="bg s_btn_wr"><input type=submit id=su value=百度一下 class="bg s_btn"></span> </form> </div> </div> <div id=u1> <a href=http://news.baidu.com name=tj_trnews class=mnav>新闻</a> <a href=http://www.hao123.com name=tj_trhao123 class=mnav>hao123</a> <a href=http://map.baidu.com name=tj_trmap class=mnav>地图</a> <a href=http://v.baidu.com name=tj_trvideo class=mnav>视频</a> <a href=http://tieba.baidu.com name=tj_trtieba class=mnav>贴吧</a> <noscript> <a href=http://www.baidu.com/bdorz/login.gif?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2f%3fbdorz_come%3d1 name=tj_login class=lb>登录</a> </noscript> <script>document.write(\'<a href="http://www.baidu.com/bdorz/login.gif?login&tpl=mn&u=\'+ encodeURIComponent(window.location.href+ (window.location.search === "" ? "?" : "&")+ "bdorz_come=1")+ \'" name="tj_login" class="lb">登录</a>\');</script> <a href=//www.baidu.com/more/ name=tj_briicon class=bri style="display: block;">更多产品</a> </div> </div> </div> <div id=ftCon> <div id=ftConw> <p id=lh> <a href=http://home.baidu.com>关于百度</a> <a href=http://ir.baidu.com>About Baidu</a> </p> <p id=cp>©2017 Baidu <a href=http://www.baidu.com/duty/>使用百度前必读</a>  <a href=http://jianyi.baidu.com/ class=cp-feedback>意见反馈</a> 京ICP证030173号  <img src=//www.baidu.com/img/gs.gif> </p> </div> </div> </div> </body> </html>\r\n'
>>>

3. requests 库的7个主要方法

  

4. requests库的get()方法

  4.1 requests.get()

    

  4.2 requests.get(url, params=None, **kwargs)

    · url     :拟获取页面的url链接

    · params  :url中的额外参数,字典或字节流格式,可选

    · **kwargs :12个控制访问的参数

  4.3 get()方法的官方定义

    

转载于:https://www.cnblogs.com/wnzhong/p/6503306.html

Python网络爬虫与信息提取 - requests库入门相关推荐

  1. Python网络爬虫与信息提取—requests库入门

    requests的学习笔记 requests库自动爬取HTML页面,自动网络请求提交 此博客为中国大学MOOC北京理工大学<Python网络爬虫与信息提取>的学习笔记 requests库的 ...

  2. Python 网络爬虫笔记2 -- Requests库实战

    Python 网络爬虫笔记2 – Requests库实战 Python 网络爬虫系列笔记是笔者在学习嵩天老师的<Python网络爬虫与信息提取>课程及笔者实践网络爬虫的笔记. 课程链接:P ...

  3. Python 网络爬虫笔记1 -- Requests库

    Python 网络爬虫笔记1 – Requests库 Python 网络爬虫系列笔记是笔者在学习嵩天老师的<Python网络爬虫与信息提取>课程及笔者实践网络爬虫的笔记. 课程链接:Pyt ...

  4. Python网络爬虫与信息提取[request库的应用](单元一)

    ---恢复内容开始--- 注:学习中国大学mooc 嵩天课程 的学习笔记 request的七个主要方法 request.request() 构造一个请求用以支撑其他基本方法 request.get(u ...

  5. python网络爬虫与信息提取(笔记)【未完】

    目录 python网络爬虫与信息提取 Requests库入门 HTTP协议及Requests库方法 Requests库的get()方法 Requests库的安装 Requests库主要方法解析 爬取网 ...

  6. Python网络爬虫与信息提取(17)—— 题库爬取与整理+下载答案

    前言 上一节实现了题目的整理,没整理答案是不完整的,所以这一节加上答案的爬取. 上一节地址:Python网络爬虫与信息提取(16)-- 题库爬取与整理 效果 思路 爬答案有点难搞,像这种题库的答案都是 ...

  7. Python网络爬虫与信息提取

    1.Requests库入门 Requests安装 用管理员身份打开命令提示符: pip install requests 测试:打开IDLE: >>> import requests ...

  8. MOOC《Python网络爬虫和信息提取》(第11次)网络爬虫之框架(第4周)

    MOOC<Python网络爬虫和信息提取>(第11次)网络爬虫之框架(第4周) MOOC–Python网络爬虫和信息提取(第11次开课) 网络爬虫之框架 21.08.10 目录 文章目录 ...

  9. Python网络爬虫与信息提取笔记08-实例2:淘宝商品比价定向爬虫

    Python网络爬虫与信息提取笔记01-Requests库入门 Python网络爬虫与信息提取笔记02-网络爬虫之"盗亦有道" Python网络爬虫与信息提取笔记03-Reques ...

  10. python网络爬虫与信息提取_北京理工大学_Python网络爬虫与信息提取(一)

    学习 北京理工大学 嵩天 课程笔记 课程体系结构: 1.Requests框架:自动爬取HTML页面与自动网络请求提交 2.robots.txt:网络爬虫排除标准 3.BeautifulSoup框架:解 ...

最新文章

  1. Matlab编程与数据类型 -- 开关语句switch/end
  2. poj——3177Redundant Paths
  3. 如果用编程语言参加战争,哪门语言才是程序员的最强武器?
  4. 基于深度学习的图像语义分割技术概述之4常用方法
  5. 要关闭python解释器可使用函数或者快捷键_【判断题】螺旋机构具有结构简单,传动平稳,噪声低等优点,被广泛应用。...
  6. vagrant使用centos的环境安装..
  7. Spring Data JPA 从入门到精通~实际工作的应用场景
  8. 项目管理学习总结(5)——产品开发过程中各角色职责说明和技能要求
  9. mysql-日常命令使用汇总
  10. CDMA关键技术(RAKE、软切换、功率控制
  11. Java中的private关键字
  12. 数据与广告系列三:合约广告与与衍生的第三方广告数据监控
  13. 美团点评2018校园春季招聘后台开发工程师笔试经验
  14. python 进程间同步_python之路29 -- 多进程与进程同步(进程锁、信号量、事件)与进程间的通讯(队列和管道、生产者与消费者模型)与进程池...
  15. 鸿蒙实训(基于智能硬件学习)第二期
  16. 轻量级高性能多维分析套件
  17. 太太太好用了!12款论文润色神器,SCI、EI论文写作必看
  18. IOS发送通知与接收通知
  19. IP地址是如何分配的?
  20. “笨”企业遇到快时代:中兴曾学忠反思中兴

热门文章

  1. java r日历系统_Java GrerorianCalendar 实现日历查询
  2. android 相机权限_暴力破姐权限,吹爆这款软件...
  3. mysql主键外键_MySQL数据库的主键和外键详解3
  4. java中访问权限的设置
  5. Java 8 新日期时间 API ( 上 ) – 本地日期时间
  6. go struct 零值_《Go 语言程序设计》读书笔记 (五) 协程与通道
  7. 7.4通过CRaSH管理Spring Boot和定义远程命令
  8. 【渝粤教育】电大中专职业生涯规划作业 题库
  9. 【sklearn第六讲】特征提取(下)
  10. windows环境下的YOLO3入门,及opencv344配置