python抓取网页后用decode解码,报错信息如下:

Traceback (most recent call last):File "<pyshell#7>", line 1, in <module>html = html.decode("gb2312")
UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8f in position 6018: illegal multibyte sequence

初步推测是网页中有部分数值是错误的或者说不是采用<meta>标签中charset显示的显示的编码,那么可以通过设置‘decode’函数的第二参数——‘errors’来解决这一问题

举例:

html = html.decode("gb2312",errors = 'ignore')

截图:

注意:不要把‘ignore’输成了‘ignone’,否则会报错!

报错信息:

LookupError: unknown error handler name 'ignone'The above exception was the direct cause of the following exception:Traceback (most recent call last):File "D:\Personal\Desktop\测试.py", line 8, in <module>html = rep.read().decode("gb2312",errors="ignone")
LookupError: decoding with 'gb2312' codec failed (LookupError: unknown error handler name 'ignone')

截图:

decode解码报错UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8f in position 6018: illegal multib相关推荐

  1. GBK解码报错-UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa1 in position 98: illegal multibyte seq

    文章目录 背景 原因分析 解决办法 办法一 方法二 总结 背景 在PyCharm中,创建一个带有中文的html文件,进行读取的时候出现如下报错: UnicodeDecodeError: 'gbk' c ...

  2. Python报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte

    Python报错UnicodeDecodeError: 'gbk' codec can't decode byte,这个错误是做NLP的小伙伴常见的一个错误,报错原因是读取的文件中有中文. 核心思路: ...

  3. import configparser config.read(config_path) 报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x

    import configparser config.read(config_path) 报错 UnicodeDecodeError: 'gbk' codec can't decode byte 0x ...

  4. 解决Python报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte

    解决Python报错–UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte ...

  5. python报错UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe8 in position 0 解决方案

    python报错UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 0 解决方案 参考文章: (1)python报 ...

  6. 解决Python打开文件报错UnicodeDecodeError: 'gbk' codec can't decode byte

    用Python打开文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 10: illegal multi ...

  7. Anaconda安装Tensorflow报错UnicodeDecodeError: 'utf-8' codec can't decode ## invalid start byte的问题之解决

    转载请注明出处:http://blog.csdn.net/apply51/article/details/79516002 本人在使用Anaconda prompt通过命令: pip install ...

  8. Python报错UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 1919: illegal mult

    with open("a.html", 'w') as f:f.write(html) python在写入文件时报错 UnicodeEncodeError: 'gbk' codec ...

  9. python 报错 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd3 in position 解决方法

    在使用urllib获取reqest的response的时候,还要进行解码 content = urllib.request.urlopen(request).read().decode() 当执行该语 ...

最新文章

  1. 生成keystore是报错拒绝访问(已测试)
  2. thinkserver rd650管理口地址_路由器WAN口和LAN口有什么区别【区别介绍】
  3. mysql与django交互_django与mysql交互
  4. java 控制台五子棋_java控制台五子棋
  5. 红黑树在java中的作用_带你真正理解Java数据结构中的红黑树
  6. 设计干货素材|使用纹理背景的技巧
  7. Fragment懒加载预加载
  8. CAS的ABA问题及解决方案
  9. 邢台农业计算机学校,邢台农业学校
  10. Unity3D基础26:物体实例化
  11. cenos 安装 Docker
  12. win7系统可以禁止的服务器,win7旗舰版怎么禁用不必要的系统服务项
  13. cURL – POST请求示例
  14. Mac OS 版本历史
  15. performing vcs refresh卡住不动解决方法
  16. Transformer计算量和过程统计
  17. android旋转的列表,Android利用layer-list实现ProgressBar顺时针及逆时针旋转
  18. [软件分享]Bandizip(有史以来最好的压缩软件)「v1.0」
  19. jQuery参考手册
  20. Linux下如何设置程序的开机自启动功能

热门文章

  1. 【C语言 日历备忘录之彩蛋游戏】
  2. 【css】手把手教你写QQ动画可爱气泡
  3. 我们都应具备的五种理财思维
  4. 计算机硬件配置参数是什么,怎样看电脑的配置_电脑的配置参数是什么意思_代表了什么?...
  5. python docx寻找到文中图片下载并反相处理
  6. 《软件工程》期末试卷及答案
  7. Python版春节快乐虎年大吉代码
  8. 《人人都能用英语》前言
  9. IE11打开网页会有彩色方块出现
  10. 2021年中国产业电商上市公司经营现状分析:九家公司总营收超2500亿元[图]