为什么80%的码农都做不了架构师?>>>   

# python 2.7.11import urllib
import urllib2
# 文件编码获取工具
import chardet# 利用请求的url地址,创建一个url对象
url = urllib2.Request('http://www.baidu.com')
# 访问请求的url对象,并获取一个应答对象(应答对象相当于一个文件对象)
response = urllib2.urlopen(url)
# 利用response的read() 方法获取文件内容
htmlConcent = response.read()print htmlConcent#  post 带参数的post请求url = 'https://gpay.gyyx.cn/'
value = {'account': 'da','location': 'SDU','logmain.log': 'python'
}# 参数编码
data = urllib.urlencode(value)
# 发送请求同时传递参数
req  = urllib2.Request(url, data)
# 接受反馈的信息
response = urllib2.urlopen(req)
# 读取反馈的内容
test  = response.read();# get 带参数的get请求data = {}data['name'] = '张三'
data['pass'] = '李四'
# 参数编码
val_values = urllib.urlencode(data)url = 'http://www.baidu.com'
# 参数合进url
full_url = url + "?" + val_values
# 打开url
data = urllib2.urlopen(full_url)# 带header报文头的url 请求
url = 'http://www.someserver.com/cgi-bin/register.cgi'
# 报文头内容
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
values = {'name' : 'WHY','location' : 'SDU','language' : 'Python' }headers = { 'User-Agent' : user_agent }
data = urllib.urlencode(values)
# 创建Request时加入header 报文头
req = urllib2.Request(url, data, headers)
response = urllib2.urlopen(req)
the_page = response.read()

转载于:https://my.oschina.net/myzyq/blog/638967

python 利用urllib2通过指定网页访问url,并捕获内容相关推荐

  1. 利用Crowbar抓取网页异步加载的内容 [Python俱乐部]

    利用Crowbar抓取网页异步加载的内容 [Python俱乐部] 利用Crowbar抓取网页异步加载的内容 [Python俱乐部] 利用Crowbar抓取网页异步加载的内容 在做 Web 信息提取.数 ...

  2. Python爬虫基础 爬取网页 访问网页

    前段时间又被人问了会不会爬虫,然后感觉现在爬取数据好像还是挺有用的,所以就在网上找了课程学习了一下,利用Python对网站进行爬取和解析等等.原来使用过八爪鱼这个软件,不太需要有什么编程基础,但是也已 ...

  3. Python爬虫抓取指定网页图片代码实例

    更多编程教程请到:菜鸟教程 https://www.piaodoo.com/ 友情链接:好看站 http://www.nrso.net/ 高州阳光论坛https://www.hnthzk.com/ 想 ...

  4. [Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容

    版本号:Python2.7.5,Python3改动较大,各位另寻教程. 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地.  类似于使用程序模拟IE浏览器的功能,把URL作 ...

  5. python的urllib2实现登录网页_python模拟网站登录(urllib、urllib2模拟登录)

    使用python模拟登录网站,首先要知道网站登录细节及相应的cookie. 分三步完成: 1,获取一个cookie 2,装载好自己的request 3,发送模拟登录请求 推荐阅读: Python模拟新 ...

  6. 案例逐步演示python利用正则表达式提取指定内容并输出到csv

    背景和目标 这次我想要处理的是一个txt文件,里面的内容是一台机器定时ping另一台机器的输出结果,想要提取出的内容是时间和rtt值,最后还要把结果输出到csv文件. 1. 明确要提取的内容,编写正则 ...

  7. Python使用BeautifulSoup爬取网页中主体部分的内容,并导出为pdf格式

    1.首先,必须下载相关的模块,依次使用以下命令安装相关模块即可: pip install requestspip install html5libpip install beautifulsoup4 ...

  8. python urlopen 乱码_Python 2.7.3 urllib2.urlopen 获取网页出现乱码解决方案

    出现乱码的原因是,网页服务端有bug,它硬性使用使用某种特定的编码方案,而并没有按照客户端的请求头的编码要求来发送编码. 解决方案:使用chardet来猜测网页编码. 1.去chardet官网下载ch ...

  9. Python数据采集与处理之网页爬取

    第1关:request模块的基本使用 任务描述 本关我们将使用 Python 程序,实现通过网页的 url,获得服务器返回的超文本文件,并保存到 txt 文件的功能. 相关知识 下面通过文字进一步详细 ...

  10. 网页访问的服务器和端口怎么查,怎么查看网页访问端口号

    怎么查看网页访问端口号 内容精选 换一换 在开发web服务过程中,您可能需要访问某个http/https端口,来进行开发测试.CloudIDE提供了注册http/https端口的能力,并提供端口开放自 ...

最新文章

  1. Ocelot(二)- 请求聚合与负载均衡
  2. [网鼎杯 2020 青龙组]bang
  3. 第六章 贪心 【完结】
  4. 数据预处理之归一化(normalization)
  5. ListBox类似组件,鼠标右键点击事件得到选中Item
  6. html中panel居中显示图片,editorgridpanel
  7. 联通家庭宽带光猫DDNS设置
  8. 英特尔显卡linux管理_Intel Linux 显卡驱动安装指南
  9. 麒麟子出了一款免费3D角色虚拟摇杆控制器!这也太好用了
  10. ICP备案线下注销 网站域名备案注销
  11. matlab植物大战僵尸小游戏
  12. 疯狂的 Web 应用开源项目
  13. 报错Minimum supported Gradle version is 4.4. Current version is 4.0.
  14. 今日研究UCosiii,研究安富莱电子的示波器程序,
  15. 王者荣耀觉悟系列(简介)
  16. matlab crnd,谁能提供一份用藤copula(c藤和D藤)产生随机数,进而求VaR的matlab程序,谢谢...
  17. Python —— 列表的while循环遍历 、for循环遍历
  18. Ranger 简介与安装
  19. 《赠卫八处士》 作者:杜甫
  20. egg开发笔记(五)egg使用egg-sequelize需要注意的事项

热门文章

  1. jdk从1.8降到1.7的办法
  2. SqlServer2008基础知识:安全与权限
  3. Consistent hashing
  4. Mybatis_3.基于注解的增删改查
  5. 错误处理之异常与返回码
  6. Crowd HDU - 4456 曼哈顿距离转切比雪夫距离的坐标变换与二维坐标离散化
  7. CentOS7环境下在/离线安装GCC与GCC-C++
  8. MVC学习笔记----缓存
  9. android软键盘控制
  10. 美国人竟然是这样教育小学