urllib是python的一个获取url的模块。它用urlopen函数的形式提供了一个非常简洁的接口。这使得用各种各样的协议获取url成为可能。它同时 也提供了一个稍微复杂的接口来处理常见的状况-如基本的认证,cookies,代理,等等。这些都是由叫做opener和handler的对象来处理的。

urllib


import urllibs = urllib.urlopen('http://tieba.baidu.com/p/3606519228')print s.read()  #将会打印出整个文件的html源代码

s.readline() #打印Html代码的第一行s.getcode()  #返回Http状态码。如果是http请求,200请求成功完成;404网址未找到s.info()     #返回一个httplib.HTTPMessage对象,表示远程服务器返回的头信息s.geturl()   #返回请求的url 

>>> s = urllib.urlopen('http://www.alwme.com/')
>>> byte = s.read()
>>> print("从 %s 上获取了 %s 字节") % (s.geturl(),len(byte))
从 http://alwme.com/ 上获取了 26834 字节

urlretrieve方法将url定位到的html文件下载到你本地的硬盘中,如果不指定filename,则会存为临时文件。

urlretrieve() 返回一个二元组

临时存放:

>>> filename = urllib.urlretrieve('http://www.alwme.com/')
>>> type(filename)
<type 'tuple'>
>>> print filename
('/tmp/tmpaOdE2g', <httplib.HTTPMessage instance at 0x7f1b021e8680>)

存为本地文件:

>>> filename = urllib.urlretrieve('http://www.alwme.com/',filename='/home/zhg/temptest/alwme.html')
>>> type(filename)
<type 'tuple'>
>>> print filename
('/home/zhg/temptest/alwme.html', <httplib.HTTPMessage instance at 0x7f1b021e8a28>)

urllib.urlcleanup()   #清除由于urllib.urlretrieve()所产生的缓存

转载于:https://www.cnblogs.com/zhanhg/p/4378161.html

Python标准库 urllib相关推荐

  1. Python标准库—urllib和urllib3

    一.urllib urllib是Python中请求url连接的官方标准库,在Python2中主要为urllib和urllib2,在Python3中整合成了urllib.urllib中一共有四个模块,分 ...

  2. Python 标准库 —— urllib(下载进度)

    注意:python 3 环境下的 urllib 库,将 urlopen.urlretrieve.quote 等实用函数统一封装在 urllib.request 下. 在可使用的各种网络函数库中,功能最 ...

  3. Python标准库介绍

    1. 关于Python标准库 众所周知,Python是一个依赖强大的组件库完成对应功能的语言,为了便捷实现各项功能,前辈大牛们打造了多种多样的工具库公开提供给大众使用,而越来越多的库已经因为使用的广泛 ...

  4. Python标准库asyncio模块基本原理浅析

    Python标准库asyncio模块基本原理浅析 本文环境python3.7.0 asyncio模块的实现思路 当前编程语言都开始在语言层面上,开始简化对异步程序的编程过程,其中Python中也开始了 ...

  5. python第三方库排行-140种Python标准库、第三方库和外部工具

    导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...

  6. python基本使用-Python标准库详细介绍与基本使用方式,超详细!

    目录: Python 标准库概览概览 操作系统接口 os 模块提供了很多与操作系统交互的函数: 应该用 import os 风格而非 from os import *.这样可以保证随操作系统不同而有所 ...

  7. python标准库有多强大_Python标准库——走马观花

    原文:Python标准库--走马观花 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! Python的一大好处在于它有一套很有用的标 ...

  8. Python学习笔记: Python 标准库概览

    本文来自:入门指南 开胃菜参考:开胃菜 使用Python解释器:使用Python解释器 本文对Python的简介:Python 简介 Python流程介绍:深入Python 流程 Python数据结构 ...

  9. 140种Python标准库、第三方库和外部工具都有了

    导读:Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数和外部工具.其中既有Python内置函数和标准库,又有第三方库和工具. 这些库可用于文件读写.网络抓取和解析.数据连 ...

  10. cassandra可视化工具_耗时1个月整理!160种Python标准库、第三方库和外部工具都有了...

    耗时1个月整理!160种Python标准库.第三方库和外部工具都有了 北京尚学堂 2019-12-09 14:59:15 Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库.函数 ...

最新文章

  1. 目前常用的服务器端网络操作系统有,目前常用的服务器端网络操作系统是()。...
  2. 如何通过其他主机查看Apahce服务器的运行状态
  3. Serverless 的价值
  4. 解决xtraFinder在EI下不能使用问题
  5. mysql日期加一天的公式_2020国考行测冲刺指导:数学运算常用公式大盘点
  6. sed是linux命令吗,Linux命令 sed
  7. 洛谷 P1018乘积最大
  8. 计算机二级旅游推广ppt,计算机二级PPT真题:制作旅游产品推广PPT
  9. 【OJ4976】硬币,神奇的背包
  10. 繁简体(GB-Big5)字符串互转的JAVA方式实现
  11. 北京簋街 美食完全攻略 + 簋街好吃的夜宵去处-----店铺介绍大全
  12. python之列表详解
  13. 入职薪酬谈判技巧_如何谈判你的薪水
  14. 使用IEEE802.1Q VLAN实现单线复用之牛刀小试篇
  15. 论坛社区项目——项目总结
  16. Eclipse在线安装主题(color theme)以及安装color theme第三方主题(图文)
  17. python tkinter stringvar_关于tkinter StringVar()
  18. Qt UI界面美化教程1:【“飞扬青云” Qt精美控件】使用教程1
  19. wps模板服务器无响应,WPS表格无响应
  20. 初学者零基础如何成为漫画师?该怎么做?

热门文章

  1. 海量数据挖掘MMDS week2: Association Rules关联规则与频繁项集挖掘
  2. php 快速路由,基于FastRoute的快速路由(支持RESTful)
  3. php for of,JavaScript中 for、for in、for of、forEach的用法小结(附代码)
  4. 力扣-605 种花问题
  5. 【转】接口测试面试题
  6. Idea集成svn插件
  7. 2017-5-5/PHP实现负载均衡的加权轮询
  8. YYYY-mm-dd HH:MM:SS 备忘录
  9. H3C 初级综合实验
  10. CocosCreator2.3.1切换场景出现Failed to load scene ‘xxx‘ because ‘xxx‘ is already being loaded问题的解决方案