该错误是因为网站禁止爬虫,可以在请求加上模拟的头信息,伪装成浏览器访问.

myurl = ""
myheaders = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req = urllib.request.Request(url=myurl,headers = myheaders)
data = urllib.request.urlopen(req).read()

或者

req = urllib.request.Request(myurl)
req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.76 Safari/537.36')
data = urllib.request.urlopen(req).read()

headers是参数不是很懂,回头在研究一下.

转载于:https://blog.51cto.com/smilence/1345741

python3.3 urllib.error.HTTPError: HTTP Error 403: Forbidden相关推荐

  1. downloading Olivetti faces from urllib.error.HTTPError: HTTP Error 403: Forbidden

    最近在学Tensorflow和Sklearn,一个原因是想搞机器视觉,另外一个原因是想探索深入了解一下AI等等方面的知识,例如神经网络等等. 遇到的第一个问题是有些包用不了,一个可能是因为墙墙,另外一 ...

  2. urllib.error.HTTPError: HTTP Error 403: Forbidden

    问题: urllib.request.urlopen() 方法经常会被用来打开一个网页的源代码,然后会去分析这个页面源代码,但是对于有的网站使用这种方法时会抛出"HTTP Error 403 ...

  3. 成功解决urllib.error.HTTPError: HTTP Error 403: Forbidden

    成功解决urllib.error.HTTPError: HTTP Error 403: Forbidden 目录 解决问题 解决思路 解决方法 解决问题 urllib.error.HTTPError: ...

  4. Python爬虫HTTP异常:rllib.error.HTTPError: HTTP Error 418,伪装User-Agent以及fake-useragent插件的妙用

    前言 刚开始学习 Python 的时候,一般都会遇到这个问题,因为我们只是简单的想要打开一个 url 爬取返回的 Html,没有考虑太多,却没有想到会被浏览器的反爬虫手段识别出来,最终请求什么也没获取 ...

  5. 【blackduck】 Request failed authorization [HTTP Error]: XXX, response was 403 Forbidden.

    问题: 15:03:23 2022-02-14 15:03:23 CST ERROR [main] --- Failed to upload code location: xxx/bom 15:03: ...

  6. Python爬虫的urllib.error.HTTPError: HTTP Error 418错误

    在家办公无聊,最近开始研究了下Python,刚了解了下爬虫,想自己尝试下,一上来就来了一个418的错误. from urllib.request import urlopenurl = 'https: ...

  7. jonathonf/python-3.6/ubuntu xenial/main amd64 Packages 403 Forbidden 解决

    mark一下 (https://askubuntu.com/questions/1195654/unable-to-locate-package-apt-pkg) since @jonathonf r ...

  8. python之python3.x版本用urllib爬虫出现的module 'urllib' has no attribute 'urlopen'与urllib.error.HTTPError: HTT

    研究pycharm编辑器用Python 3.x的urllib爬一个网页代码如下: 运行报错如下: 在网上查资料可知,Python3.x与Python2.7的差别是urlopen()方法放置模块不同,p ...

  9. Python HTTP Error 403: Forbidden

    问题: 执行下面的语句时 1 def set_IPlsit(): 2 url = 'https://www.whatismyip.com/' 3 response = urllib.request.u ...

最新文章

  1. mamp设置mysql密码_MAMP中设置Mysql root密码
  2. 从零开始搭建系统1.1——CentOs安装
  3. https和http的主要区别
  4. Matlab-OpenCV-VC-混合编程配置
  5. maven 修改文件名_Maven 构建配置文件
  6. MongoDB 5.0 来了,原生时序、版本化 API 新特性悉数登场
  7. 用完全平方数填满指定区域(洛谷P2666题题解,Java语言描述)
  8. 3种常见的渗透测试漏洞总结,快来收藏√
  9. 2007年教育学专业基础综合考试大纲(重要部分) ——下载地址
  10. viper4android蓝牙耳机,蝰蛇音效app下载-蝰蛇音效官方版(ViPER4Android FX)下载v2.7.1.0 安卓版-单机手游网...
  11. 8个国外在线学习网课的网站
  12. Kubeadm部署单Master节点
  13. 计算机出现假桌面怎么解决办法,Win10系统下“AppHangXProcB1”导致桌面频繁假死如何解决?...
  14. c语言sizeof啥作用,C语言中sizeof什么意思
  15. 损失函数--持续更新
  16. VAX v10.9.2062.0-52pj vDie 分析 【转载请注明出处】
  17. 《数据结构与算法 Python语言实现》书评与学习心得
  18. c语言常见表达式汇总(赋值表达式,条件表达式,关系表达式,算数表达式......)
  19. C++中指针是什么?
  20. Ubuntu20.04 ROS读取basler相机图像步骤。MATLAB2021b标定basler单目相机

热门文章

  1. 解决 Chrome 下载不了东西 失败 - 已屏蔽 的问题
  2. python爬虫中文乱码解决方法
  3. PowerShell说“此系统上的脚本执行被禁用。”
  4. c++ file* 句柄泄漏_C/C++连接MySql数据库使用总结
  5. Shiro 支持三种方式的授权
  6. 阿里巴巴的页面不能被抓取吗_符合百度抓取的高质量内容(72小时秒收录)
  7. wos 文献被引_全世界最权威的文献检索工具,这6个检索技巧必须要掌握!
  8. elementui 嵌套表单验证_vue elementUI 表单嵌套验证的实例代码
  9. linux 启动网络服务,Linux下网络启动服务器安装和配置方法(pxe+tftp+dhcpd)
  10. 微信小程序为电商插上翅膀