使用Python访问网页主要有三种方式: urllib, urllib2, httplib

urllib比较简单,功能相对也比较弱,httplib简单强大,但好像不支持session

1. 最简单的页面访问

res=urllib2.urlopen(url)

print res.read()

2. 加上要get或post的数据

data={"name":"hank", "passwd":"hjz"}

urllib2.urlopen(url, urllib.urlencode(data))

3. 加上http头

header={"User-Agent": "Mozilla-Firefox5.0"}

urllib2.urlopen(url, urllib.urlencode(data), header)

使用opener和handleropener = urllib2.build_opener(handler)

urllib2.install_opener(opener)

4. 加上session

cj = cookielib.CookieJar()

cjhandler=urllib2.HTTPCookieProcessor(cj)

opener = urllib2.build_opener(cjhandler)

urllib2.install_opener(opener)

5. 加上Basic认证

password_mgr = urllib2.HTTPPasswordMgrWithDefaultRealm()

top_level_url = "http://www.163.com/"

password_mgr.add_password(None, top_level_url, username, password)

handler = urllib2.HTTPBasicAuthHandler(password_mgr)

opener = urllib2.build_opener(handler)

urllib2.install_opener(opener)

6. 使用代理

proxy_support = urllib2.ProxyHandler({"http":"http://1.2.3.4:3128/"})

opener = urllib2.build_opener(proxy_support)

urllib2.install_opener(opener)

7. 设置超时

socket.setdefaulttimeout(5)

参考:http://svn.python.org/projects/python/trunk/Doc/howto/urllib2.rst

python访问web网页_python访问web的利器:urllib2相关推荐

  1. 在联网状态下,有很多网页或者应用无法联网问题,如360安全卫士, Smartscreen筛选器无法访问, 部分网页无法访问等问题的解决方法

    在联网状态下,有很多应用无法联网问题,如360安全卫士, Smartscreen筛选器无法访问, 部分网页无法访问等问题的解决方法 解决方法: 打开IE浏览器 打开设置, 选择Internet选项 找 ...

  2. python如何收集数据库_python 整理web数据库

    从GitHub中整理出来的15个最受欢迎的Python开源框架,你喜欢哪个 从GitHub中整理出的15个最受欢迎的Python开源框架.这些框架包括事件I/O,OLAP,Web开发,高性能网络通信, ...

  3. python网站模板下载_Python 的 Web 应用程序模板 - Visual Studio | Microsoft Docs

    Python Web 应用程序项目模板Python web application project templates 01/28/2019 本文内容 Visual Studio 中的 Python ...

  4. python如何解析网页_Python爬虫入门第一课:如何解析网页

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 以下文章来源于肥宅与画家 ,作者AntzUhl 我们编写网络爬虫最主要的目 ...

  5. web网页的表单排版利器--960css

    表单排版样式 960css 前言 一般web网页的表单排版,大家都习惯用table排版,自己需要根据实际需要去定义TR和TD,很多时候对于TD的高宽度.是否合并行,合并列,都要去做一些处理,这些都是比 ...

  6. python制作简单网页_python 跑服务器,访问自己制作的简单页面

    1 python 跑服务器,访问自己制作的简单页面 2 # win+b出现一个网址http:/0.0.1:5000/复制到浏览器查看 # http://127.0.0.1:5000/home 做这个首 ...

  7. python django flask介绍_Python开发WEB框架Flask详细介绍

    Flask简介 Flask是一个相对于Django而言轻量级的Web框架. 和Django大包大揽不同,Flask建立于一系列的开源软件包之上,这其中 最主要的是WSGI应用开发库Werkzeug和模 ...

  8. python bottle框架搭建_python开发web服务 bottle框架

    开发功能不是特别复杂的web服务,可以考虑使用bottle框架.原因:一.Python开发效率高呀!不信你比比同样的功能Python几行可以搞定?换java试试?换C++试试?作为这几种语言都使用过的 ...

  9. python django前端框架_Python的Web应用框架–Django

    一:简介 python的web框架有很多,个人查了一下,有Django.Pylons. Tornado.Bottle和Flask等,其中使用人数最多的是Django,而我学习Django也是因为ope ...

最新文章

  1. HTML4.0 / XHTML 1.0 Reference Manual
  2. Redis 哨兵模式 带密码单机
  3. boost::function和boost:bind取代虚函数
  4. Firefox 66 将阻止自动播放音频和视频
  5. 存储服务器的操作系统,存储服务器是什么操作系统
  6. java getipaddress_教你java用getAddress方法取得IP地址
  7. Mybatis if标签和where标签结合巧妙使用
  8. 1.2_配置Python基本环境
  9. 安卓自定义注解支持和示例实现
  10. atitit.Atitit.检测文本文件的编码 java  与php版  。Net
  11. 特斯拉-数据分析师-SQL笔试题
  12. 汽车故障检测仪计算机教程,如何使用汽车故障诊断仪进行汽车维修
  13. 中断python快捷键_python的快捷键
  14. 微讲师录课软件下载、录屏软件下载
  15. 萨摩亚峰会全球颂将创建第一个全球海洋超强智慧岛
  16. OPPO员工年薪税后110万,租七百块农民房,被女友数落:太抠了!
  17. Mybatis执行插入语句后并返回主键ID
  18. 爪哇国新游记之二十九----访问URL获取输入流
  19. anna 跨域_认识anna morgiel的Android初级软件工程师和热情的社区组织者
  20. Centos7 安装Chrome浏览器

热门文章

  1. Shell运算符:Shell算数运算符、关系运算符、布尔运算符、字符串运算符等
  2. 网络编程释疑之:TCP连接拔掉网线后会发生什么
  3. 用 70 行代码给你自己写一个 strace
  4. PyCairo 中的文本
  5. LevelDB 源码剖析(一)准备工作:环境搭建、接口使用、常用优化
  6. 大众点评app 数据解密和反序列化
  7. 建议收藏 | 全面解析 50+条 SQL 语句性能优化策略
  8. 超清晰的 DNS 原理入门指南
  9. Django模版(一)
  10. 【城市沙龙】LiveVideoStack Meet|杭州:多媒体新黄金时代