python 使用代理访问百度网站 ProxyHandler 爬虫

'''
使用代理访问百度网站
-ProxyHandler处理(代理服务器)-使用代理服务器,是爬虫的常用手段-获取代理服务器的地址:-www.xicidaili.com-www.goubanjia.com-代理用来隐藏真实访问中,代理也不允许频繁访问某一固定网站,所以,代理一定要很多很多-基本使用步骤:1.设置代理地址2.创建ProxyHandler3.创建opener4.安装opener'''
from urllib import request,error
if __name__ == '__main__':url="http://www.baidu.com"#1.设置代理地址proxy = {'http':'218.60.8.83:3129'}#2.创建ProxyHandlerproxy_handler = request.ProxyHandler(proxy)#3.创建opener/ 负责打开的opener = request.build_opener(proxy_handler)#4.安装openerrequest.install_opener(opener)#如果访问url,则使用代理服务器try:rsp = request.urlopen(url)html = rsp.read().decode()print(html)except error.URLError as e:print(e)except Exception  as e:print(e)

使用代理访问百度网站 ProxyHandler python 爬虫 入门相关推荐

  1. Python爬虫入门5:模拟浏览器访问网站

    ☞ ░ 前往老猿Python博客 https://blog.csdn.net/LaoYuanPython ░ 一.引言 在前面两节中分别介绍了使用Google浏览器和IE浏览器怎么获取网站访问的htt ...

  2. python爬去百度百科词条_Python爬虫入门学习实践——爬取小说

    本学期开始接触python,python是一种面向对象的.解释型的.通用的.开源的脚本编程语言,我觉得python最大的优点就是简单易用,学习起来比较上手,对代码格式的要求没有那么严格,这种风格使得我 ...

  3. Python 爬虫入门(二)—— IP代理使用 - 不剃头的一休哥 - 博客园

    Python 爬虫入门(二)-- IP代理使用 - 不剃头的一休哥 - 博客园 Python 爬虫入门(二)-- IP代理使用 - 不剃头的一休哥 - 博客园 posted on 2016-01-26 ...

  4. python 爬虫 微博 github_GitHub 热门:各大网站的 Python 爬虫登录汇总

    原标题:GitHub 热门:各大网站的 Python 爬虫登录汇总 (给数据分析与开发加星标,提升数据技能) 转自:机器之心,GitHub 作者:CriseLYJ 不论是自然语言处理还是计算机视觉,做 ...

  5. python入门教程百度云-Python爬虫入门教程 百度云盘下载【传智播客】

    Python爬虫入门教程 中级共10课 对实现疫情爬虫项目使用到每一个模块逐一讲解, 每个模块都伴随一个案例; 最后水到渠成, 轻松完成疫情爬虫项目.提取码:ea1n 180分钟学会爬虫入门: 1. ...

  6. Python爬虫入门系列——Urllib详解

    Python爬虫入门系列--Urllib详解 1.背景 1.1 初识爬虫 1.2 合法性 1.3 robots协议 2.要求 2.1 当前开发环境 2.2 编程基础 3.快速上手Urllib 3.1 ...

  7. Python 爬虫入门四——代理服务器

    Python 爬虫入门<四> 标签:代理服务器 在我们做爬虫的时候,对弈同一个网页,我们爬取次数多了之后,服务器会屏蔽我们的IP,所以,我们要解决这个问题,不然每次访问,就把自己Ip屏蔽了 ...

  8. python爬虫入门代码-Python爬虫入门

    原标题:python爬虫入门 基础知识 HTTP协议 我们浏览网页的浏览器和手机应用客户端与服务器通信几乎都是基于HTTP协议,而爬虫可以看作是一个另类的客户端,它把自己伪装成浏览器或者手机应用客户端 ...

  9. Python爬虫入门(4):Urllib库的高级用法

    Python爬虫入门(1):综述 Python爬虫入门(2):爬虫基础了解 Python爬虫入门(3):Urllib库的基本使用 Python爬虫入门(4):Urllib库的高级用法 Python爬虫 ...

  10. Python爬虫入门四之Urllib库的高级用法

    1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览 ...

最新文章

  1. LeetCode简单题之字符串转化后的各位数字之和
  2. 12bit的图像如何向8bit转化_【福联影像】10bit显示器比8bit专业在哪?想告别色彩断层必须要了解...
  3. RxJava系列6(从微观角度解读RxJava源码)
  4. linux是数据库软件么,什么是适用于Linux的良好数据库ERD工具?
  5. Linux内核中Makefile、Kconfig和.config的关系
  6. 006-Zabbix agent on Zabbix server is unreachable for 5 minutes
  7. 1120 Friend Numbers
  8. 一个简单的c++类的定义和实例化
  9. (转)AI泡沫已现:资金多而项目缺,周期长而营收难
  10. node 多进程 vs java_如何理解node的多进程
  11. 网络通讯协议——TCP/IP协议
  12. matlab orderfields,matlab order
  13. 【控制理论】预测控制分析
  14. Windows下安装PyQt4+python2.7+(nltk+wordcloud+jieba+pyinstaller打包)——词频分析软件
  15. bcdedit添加linux引导,用BCDEdit编辑启动菜单
  16. 计算机图形学:机器人的画法与填充
  17. docker容器状态Exited(1)第一篇
  18. 法猿生存计划-在大选前,该公司希望做一些事情:分类
  19. 使用RestTemplate请求第三方接口出错,没抛出异常?
  20. 禁用Ubuntu 16.04.4 LTS 图形登陆界面只能选择guest账号登陆

热门文章

  1. python教你用骰子拼图
  2. kali下生成木马的工具
  3. 51c语言单片机io口控制实验报告,51单片机实训报告完整版.doc
  4. sphinx PHP win,Sphinx 在 windows 下安装使用
  5. 怎么理解token,tokenize,tokenizer.
  6. 【C认证】对标名企技术标准,大厂不是梦
  7. python如何导入背景图片_背景图片的正确导入方式
  8. Chat Top10 | 实战:参考牛顿冷却定律优化最热问题的排序
  9. 股票数据开源接口-陆股通持股
  10. 全国大学生物联网设计竞赛作品 | 室内消毒机器人-艾盾