刚刚在使用Python写爬虫,但是由于我在公司没有上网权限,所以借别人的账号用(opera 浏览器代理 可有上网),我将代理信息写在python脚本里面但是出现了下面的错误.

代码:

import urllib2

proxy_info = {

'user' : 'xxx' ,

'pass' : 'xxxx' ,

'host' : 'xx.xx.xx.xx' ,

'port' : xx

}

# build a new opener that uses a proxy requiring authorization

proxy_support = urllib2.ProxyHandler({"http" : \

"http://%(user)s:%(pass)s@%(host)s:%(port)d" % proxy_info})

opener = urllib2.build_opener(proxy_support, urllib2.HTTPHandler)

# install it

urllib2.install_opener(opener)

# use it

f = urllib2.urlopen('http://www.baidu.com/')

print f.headers

print f.read()

错误:

Traceback (most recent call last):

File "D:\software\eclipse\workspace\pythonproject\dev\spider\ProxyHandler.py", line 19, in

f = urllib2.urlopen('http://www.baidu.com/')

File "C:\Python27\lib\urllib2.py", line 126, in urlopen

return _opener.open(url, data, timeout)

File "C:\Python27\lib\urllib2.py", line 398, in open

response = meth(req, response)

File "C:\Python27\lib\urllib2.py", line 511, in http_response

'http', request, response, code, msg, hdrs)

File "C:\Python27\lib\urllib2.py", line 436, in error

return self._call_chain(*args)

File "C:\Python27\lib\urllib2.py", line 370, in _call_chain

result = func(*args)

File "C:\Python27\lib\urllib2.py", line 519, in http_error_default

raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)

urllib2.HTTPError: HTTP Error 407: Proxy Authentication Required

( Forefront TMG requires authorization to fulfill the request.

Access to the Web Proxy filter is denied. )

urllib2.HTTPError: HTTP Error 407: Proxy Authentication Required ( Forefront TMG requires authorization to fulfill the request. Access to the Web Proxy filter is denied. )

请问这是什么原因造成的呀,可有什么解决建议啊,谢谢大家了

python 爬虫代理_python 爬虫 使用代理 的问题相关推荐

  1. python爬虫代理服务器_Python爬虫之服务器:代理IP万能

    最近很多同学租服务器用来学习爬虫,对于大部分小白来说,爬虫非常复杂.技术门槛很高.但我们可以通过爬虫获取大量的价值数据,经分析可以发挥巨大的价值,比如:豆瓣.知乎,爬取优质答案,筛选出各话题下热门内容 ...

  2. python爬虫ip代理_python爬虫批量抓取ip代理的方法(代码)

    本篇文章给大家带来的内容是关于python爬虫批量抓取ip代理的方法(代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 使用爬虫抓取数据时,经常要用到多个ip代理,防止单个ip访 ...

  3. python的requests库的添加代理_python爬虫之requests库使用代理

    python爬虫之requests库使用代理 发布时间:2020-03-25 17:00:54 来源:亿速云 阅读:110 作者:小新 今天小编分享的是关于python爬虫的requests库使用代理 ...

  4. python ip动态代理_Python 爬虫设置动态代理

    爬虫的时候,我们用同一个ip反复爬一个网站有可能会被封,这时候就需要使用到代理ip 网上有免费的开放代理,但有些代理ip稳定性差要经常更换且有些爬取后就不可用了还要再筛查 除了免费的外可以向代理供应商 ...

  5. python post 参数_python爬虫——requests库使用代理

    在看这篇文章之前,需要大家掌握的知识技能: python基础 html基础 http状态码 让我们看看这篇文章中有哪些知识点: get方法 post方法 header参数,模拟用户 data参数,提交 ...

  6. python爬虫代理_python爬虫-代理的使用

    代理的设置 在urllib库中使用代理,代码如下: from urllib.request importProxyHandler,build_openerfrom urllib.error impor ...

  7. python爬虫难点_Python爬虫技巧

    ​在本文中,我们将分析几个真实网站,来看看我们在<用Python写网络爬虫(第2版)>中学过的这些技巧是如何应用的.首先我们使用Google演示一个真实的搜索表单,然后是依赖JavaScr ...

  8. python爬虫要点_Python爬虫知识点梳理

    学任何一门技术,都应该带着目标去学习,目标就像一座灯塔,指引你前进,很多人学着学着就学放弃了,很大部分原因是没有明确目标,所以,在你准备学爬虫前,先问问自己为什么要学习爬虫.有些人是为了一份工作,有些 ...

  9. 花一千多学python值吗_Python爬虫应该怎么学?程序猿花了一周整理的学习技巧,请收下...

    原标题:Python爬虫应该怎么学?程序猿花了一周整理的学习技巧,请收下 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多, ...

  10. python爬虫模块_Python爬虫 --- Scrapy爬取IT桔子网

    目标: 此次爬取主要是针对IT桔子网的事件信息模块,然后把爬取的数据存储到mysql数据库中. 目标分析: 通过浏览器浏览发现事件模块需要登录才能访问,因此我们需要先登录,抓取登录接口: 可以看到桔子 ...

最新文章

  1. Oracle数据库管理----性能优化
  2. Algs4-1.1.21打印表格
  3. Oracle中sysdba身份和dba角色区别
  4. 【Unity】11.5 物理材质 (Physics Material)
  5. 【转】VNC不同软件之间的联系与区别
  6. 《WF编程》系列之16 - 工作流与外部世界:生存周期事件 3.2 工作流与外部世界
  7. JavaWeb网络考试系统
  8. 设计一个求立方体体积的父类,包含一个显示底面各个形状信息的统一方法,信息显示方式 “类别+周长+面积”;一个计算和显示立方体体积的统一方法 设计三个子类(利用继承关系):圆柱、长方体、三棱柱
  9. 职业经验分享之我是如何转行成为数据分析师的
  10. Aria2+yaaw+Chrome插件BaiduExporter实现百度网盘下载
  11. 荣之学:关于跨境电商shopee平台,你了解多少?
  12. ffmpeg水平翻转视频,附批量处理脚本
  13. 软件测试笔记——3.多种多样的测试类型
  14. 【Qt】2D基本绘图操作——QPainter执行绘制及绘图设备介绍
  15. 创维YS代工E900V21E/TY1608-S905l3B-8822CS及7668无线通刷线刷包
  16. 织梦 DEDECMS LOOP标签的用法及调用
  17. 云空间服务,助力用户数据存储与协同
  18. Mac使用技巧之如何禁用独立显卡
  19. 利用kiftd实现局域网文件共享,支持不同操作系统
  20. 曝腾讯天美程序员税后250万,月均20万

热门文章

  1. c++静态成员函数为什么不能为虚函数?
  2. QAQ的幸运数字 数学
  3. AliRTC 开启视频互动 “零计算” 时代
  4. 一文搞懂物联网Modbus通讯协议
  5. 【机器人】标记不友好评论,AI工作效果是人类的4.4倍
  6. 阿里云杜欢:云上Serverless开发能力将成为前端的“金手指”
  7. 关于Paxos 幽灵复现问题的看法
  8. Andrew Ng深度学习课程笔记
  9. 干货!一文搞懂无状态服务
  10. 对于华为,英特尔与微软表示继续提供支持;亚马逊亲证云计算服务出现宕机;中国移动5G套餐曝光,每月都含200G流量……...