该错误是因为网站禁止爬虫,可以在请求加上模拟的头信息,伪装成浏览器访问.

myurl = ""
myheaders = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req = urllib.request.Request(url=myurl,headers = myheaders)
data = urllib.request.urlopen(req).read()

或者

req = urllib.request.Request(myurl)
req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.76 Safari/537.36')
data = urllib.request.urlopen(req).read()

headers是参数不是很懂,回头在研究一下.

转载于:https://blog.51cto.com/smilence/1345741

python3.3 urllib.error.HTTPError: HTTP Error 403: Forbidden相关推荐

  1. downloading Olivetti faces from urllib.error.HTTPError: HTTP Error 403: Forbidden

    最近在学Tensorflow和Sklearn,一个原因是想搞机器视觉,另外一个原因是想探索深入了解一下AI等等方面的知识,例如神经网络等等. 遇到的第一个问题是有些包用不了,一个可能是因为墙墙,另外一 ...

  2. urllib.error.HTTPError: HTTP Error 403: Forbidden

    问题: urllib.request.urlopen() 方法经常会被用来打开一个网页的源代码,然后会去分析这个页面源代码,但是对于有的网站使用这种方法时会抛出"HTTP Error 403 ...

  3. 成功解决urllib.error.HTTPError: HTTP Error 403: Forbidden

    成功解决urllib.error.HTTPError: HTTP Error 403: Forbidden 目录 解决问题 解决思路 解决方法 解决问题 urllib.error.HTTPError: ...

  4. Python爬虫HTTP异常:rllib.error.HTTPError: HTTP Error 418,伪装User-Agent以及fake-useragent插件的妙用

    前言 刚开始学习 Python 的时候,一般都会遇到这个问题,因为我们只是简单的想要打开一个 url 爬取返回的 Html,没有考虑太多,却没有想到会被浏览器的反爬虫手段识别出来,最终请求什么也没获取 ...

  5. 【blackduck】 Request failed authorization [HTTP Error]: XXX, response was 403 Forbidden.

    问题: 15:03:23 2022-02-14 15:03:23 CST ERROR [main] --- Failed to upload code location: xxx/bom 15:03: ...

  6. Python爬虫的urllib.error.HTTPError: HTTP Error 418错误

    在家办公无聊,最近开始研究了下Python,刚了解了下爬虫,想自己尝试下,一上来就来了一个418的错误. from urllib.request import urlopenurl = 'https: ...

  7. jonathonf/python-3.6/ubuntu xenial/main amd64 Packages 403 Forbidden 解决

    mark一下 (https://askubuntu.com/questions/1195654/unable-to-locate-package-apt-pkg) since @jonathonf r ...

  8. python之python3.x版本用urllib爬虫出现的module 'urllib' has no attribute 'urlopen'与urllib.error.HTTPError: HTT

    研究pycharm编辑器用Python 3.x的urllib爬一个网页代码如下: 运行报错如下: 在网上查资料可知,Python3.x与Python2.7的差别是urlopen()方法放置模块不同,p ...

  9. Python HTTP Error 403: Forbidden

    问题: 执行下面的语句时 1 def set_IPlsit(): 2 url = 'https://www.whatismyip.com/' 3 response = urllib.request.u ...

最新文章

  1. 北京智源人工智能研究院启动“智源学者计划”,与旷视发布首个智源联合实验室
  2. 《OpenGL ES 3.x游戏开发(上卷)》一1.5 Android应用程序运行的机制
  3. 1.10.Flink DataStreamAPI(API的抽象级别、Data Sources、connectors、Source容错性保证、Sink容错性保证、自定义sink、partition等)
  4. php子类选择器代码,php – 可变产品选择器:获取实时选定值
  5. P4331-[BalticOI2004]Sequence数字序列【左偏树】
  6. HDU 1033 水题
  7. 2021-07-24 KDD China郑宇博士部分听会记录
  8. sat2 计算机科目,2019-2020年SAT2考试时间及Top100大学要求
  9. 判断是否是日期格式_Java8新特性之新世间与日期
  10. iOS 开发面试通关指南:67 个必知问题!
  11. winxp计算机远程桌面连接,winxp系统远程桌面不能连接指定计算机的解决方法
  12. [原创]游戏合服时如何避免主键冲突
  13. wireshark最新版本for Ubuntu18.04(六)
  14. 0002-标题段落-前端学习笔记
  15. 分享两款迷你FTP服务器
  16. 各种音频视频编解码详细介绍
  17. python敏感词过滤代码简单_DFA敏感词过滤算法的python实现
  18. 局域网打印机共享设置
  19. 使用cache tier
  20. wakeup_in休眠唤醒

热门文章

  1. 如何在Linux命令行中替换多个文件中的字符串
  2. 如何在Windows CMD的一行中运行两个命令?
  3. 片段中的findViewById
  4. 如何使用extern在源文件之间共享变量?
  5. win11组策略如何开启自动更新 Windows11组策略开启自动更新的设置方法
  6. win11下载时卡住0%不动怎么办 Windows11下载卡在0%的解决方法
  7. Python基础-循环
  8. Shell:函数返回值接收
  9. 英魂之刃服务器维护中修改,英魂之刃gg修改教程 | 手游网游页游攻略大全
  10. python3怎么使用pyrex_python pyrex windows 编译C可执行文件