python3.3 urllib.error.HTTPError: HTTP Error 403: Forbidden
该错误是因为网站禁止爬虫,可以在请求加上模拟的头信息,伪装成浏览器访问.
myurl = ""
myheaders = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req = urllib.request.Request(url=myurl,headers = myheaders)
data = urllib.request.urlopen(req).read()
或者
req = urllib.request.Request(myurl)
req.add_header('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.76 Safari/537.36')
data = urllib.request.urlopen(req).read()
headers是参数不是很懂,回头在研究一下.
转载于:https://blog.51cto.com/smilence/1345741
python3.3 urllib.error.HTTPError: HTTP Error 403: Forbidden相关推荐
- downloading Olivetti faces from urllib.error.HTTPError: HTTP Error 403: Forbidden
最近在学Tensorflow和Sklearn,一个原因是想搞机器视觉,另外一个原因是想探索深入了解一下AI等等方面的知识,例如神经网络等等. 遇到的第一个问题是有些包用不了,一个可能是因为墙墙,另外一 ...
- urllib.error.HTTPError: HTTP Error 403: Forbidden
问题: urllib.request.urlopen() 方法经常会被用来打开一个网页的源代码,然后会去分析这个页面源代码,但是对于有的网站使用这种方法时会抛出"HTTP Error 403 ...
- 成功解决urllib.error.HTTPError: HTTP Error 403: Forbidden
成功解决urllib.error.HTTPError: HTTP Error 403: Forbidden 目录 解决问题 解决思路 解决方法 解决问题 urllib.error.HTTPError: ...
- Python爬虫HTTP异常:rllib.error.HTTPError: HTTP Error 418,伪装User-Agent以及fake-useragent插件的妙用
前言 刚开始学习 Python 的时候,一般都会遇到这个问题,因为我们只是简单的想要打开一个 url 爬取返回的 Html,没有考虑太多,却没有想到会被浏览器的反爬虫手段识别出来,最终请求什么也没获取 ...
- 【blackduck】 Request failed authorization [HTTP Error]: XXX, response was 403 Forbidden.
问题: 15:03:23 2022-02-14 15:03:23 CST ERROR [main] --- Failed to upload code location: xxx/bom 15:03: ...
- Python爬虫的urllib.error.HTTPError: HTTP Error 418错误
在家办公无聊,最近开始研究了下Python,刚了解了下爬虫,想自己尝试下,一上来就来了一个418的错误. from urllib.request import urlopenurl = 'https: ...
- jonathonf/python-3.6/ubuntu xenial/main amd64 Packages 403 Forbidden 解决
mark一下 (https://askubuntu.com/questions/1195654/unable-to-locate-package-apt-pkg) since @jonathonf r ...
- python之python3.x版本用urllib爬虫出现的module 'urllib' has no attribute 'urlopen'与urllib.error.HTTPError: HTT
研究pycharm编辑器用Python 3.x的urllib爬一个网页代码如下: 运行报错如下: 在网上查资料可知,Python3.x与Python2.7的差别是urlopen()方法放置模块不同,p ...
- Python HTTP Error 403: Forbidden
问题: 执行下面的语句时 1 def set_IPlsit(): 2 url = 'https://www.whatismyip.com/' 3 response = urllib.request.u ...
最新文章
- mamp设置mysql密码_MAMP中设置Mysql root密码
- 从零开始搭建系统1.1——CentOs安装
- https和http的主要区别
- Matlab-OpenCV-VC-混合编程配置
- maven 修改文件名_Maven 构建配置文件
- MongoDB 5.0 来了,原生时序、版本化 API 新特性悉数登场
- 用完全平方数填满指定区域(洛谷P2666题题解,Java语言描述)
- 3种常见的渗透测试漏洞总结,快来收藏√
- 2007年教育学专业基础综合考试大纲(重要部分) ——下载地址
- viper4android蓝牙耳机,蝰蛇音效app下载-蝰蛇音效官方版(ViPER4Android FX)下载v2.7.1.0 安卓版-单机手游网...
- 8个国外在线学习网课的网站
- Kubeadm部署单Master节点
- 计算机出现假桌面怎么解决办法,Win10系统下“AppHangXProcB1”导致桌面频繁假死如何解决?...
- c语言sizeof啥作用,C语言中sizeof什么意思
- 损失函数--持续更新
- VAX v10.9.2062.0-52pj vDie 分析 【转载请注明出处】
- 《数据结构与算法 Python语言实现》书评与学习心得
- c语言常见表达式汇总(赋值表达式,条件表达式,关系表达式,算数表达式......)
- C++中指针是什么?
- Ubuntu20.04 ROS读取basler相机图像步骤。MATLAB2021b标定basler单目相机
热门文章
- 解决 Chrome 下载不了东西 失败 - 已屏蔽 的问题
- python爬虫中文乱码解决方法
- PowerShell说“此系统上的脚本执行被禁用。”
- c++ file* 句柄泄漏_C/C++连接MySql数据库使用总结
- Shiro 支持三种方式的授权
- 阿里巴巴的页面不能被抓取吗_符合百度抓取的高质量内容(72小时秒收录)
- wos 文献被引_全世界最权威的文献检索工具,这6个检索技巧必须要掌握!
- elementui 嵌套表单验证_vue elementUI 表单嵌套验证的实例代码
- linux 启动网络服务,Linux下网络启动服务器安装和配置方法(pxe+tftp+dhcpd)
- 微信小程序为电商插上翅膀