decode解码报错UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8f in position 6018: illegal multib
python抓取网页后用decode解码,报错信息如下:
Traceback (most recent call last):File "<pyshell#7>", line 1, in <module>html = html.decode("gb2312")
UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8f in position 6018: illegal multibyte sequence
初步推测是网页中有部分数值是错误的或者说不是采用<meta>标签中charset显示的显示的编码,那么可以通过设置‘decode’函数的第二参数——‘errors’来解决这一问题
举例:
html = html.decode("gb2312",errors = 'ignore')
截图:
注意:不要把‘ignore’输成了‘ignone’,否则会报错!
报错信息:
LookupError: unknown error handler name 'ignone'The above exception was the direct cause of the following exception:Traceback (most recent call last):File "D:\Personal\Desktop\测试.py", line 8, in <module>html = rep.read().decode("gb2312",errors="ignone")
LookupError: decoding with 'gb2312' codec failed (LookupError: unknown error handler name 'ignone')
截图:
decode解码报错UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8f in position 6018: illegal multib相关推荐
- GBK解码报错-UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa1 in position 98: illegal multibyte seq
文章目录 背景 原因分析 解决办法 办法一 方法二 总结 背景 在PyCharm中,创建一个带有中文的html文件,进行读取的时候出现如下报错: UnicodeDecodeError: 'gbk' c ...
- Python报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte
Python报错UnicodeDecodeError: 'gbk' codec can't decode byte,这个错误是做NLP的小伙伴常见的一个错误,报错原因是读取的文件中有中文. 核心思路: ...
- import configparser config.read(config_path) 报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x
import configparser config.read(config_path) 报错 UnicodeDecodeError: 'gbk' codec can't decode byte 0x ...
- 解决Python报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte
解决Python报错–UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte ...
- python报错UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe8 in position 0 解决方案
python报错UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 0 解决方案 参考文章: (1)python报 ...
- 解决Python打开文件报错UnicodeDecodeError: 'gbk' codec can't decode byte
用Python打开文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 10: illegal multi ...
- Anaconda安装Tensorflow报错UnicodeDecodeError: 'utf-8' codec can't decode ## invalid start byte的问题之解决
转载请注明出处:http://blog.csdn.net/apply51/article/details/79516002 本人在使用Anaconda prompt通过命令: pip install ...
- Python报错UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 1919: illegal mult
with open("a.html", 'w') as f:f.write(html) python在写入文件时报错 UnicodeEncodeError: 'gbk' codec ...
- python 报错 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd3 in position 解决方法
在使用urllib获取reqest的response的时候,还要进行解码 content = urllib.request.urlopen(request).read().decode() 当执行该语 ...
最新文章
- 生成keystore是报错拒绝访问(已测试)
- thinkserver rd650管理口地址_路由器WAN口和LAN口有什么区别【区别介绍】
- mysql与django交互_django与mysql交互
- java 控制台五子棋_java控制台五子棋
- 红黑树在java中的作用_带你真正理解Java数据结构中的红黑树
- 设计干货素材|使用纹理背景的技巧
- Fragment懒加载预加载
- CAS的ABA问题及解决方案
- 邢台农业计算机学校,邢台农业学校
- Unity3D基础26:物体实例化
- cenos 安装 Docker
- win7系统可以禁止的服务器,win7旗舰版怎么禁用不必要的系统服务项
- cURL – POST请求示例
- Mac OS 版本历史
- performing vcs refresh卡住不动解决方法
- Transformer计算量和过程统计
- android旋转的列表,Android利用layer-list实现ProgressBar顺时针及逆时针旋转
- [软件分享]Bandizip(有史以来最好的压缩软件)「v1.0」
- jQuery参考手册
- Linux下如何设置程序的开机自启动功能