lines = open('西游记.txt').read()   # Windows 平台的默认编码是GBK

报错,已知文件编码是ANSI(GBK)

UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 575056: illegal multibyte sequence

意思是'gbk'编解码器无法解码位置为575056的字节0xfe:非法多字节序列。大概是说,在575056位置的字在gbk中没有,所以解码错误。

(GB2312过时标准、GBK微软标准、GB18030国家标准。GB18030收录的汉字最多)

lines = open('西游记.txt', encoding='GB18030').read() 

这样就没有错误,应该是GB18030包含了在575056位置的字。

如果还不行,应该就是出现了GB18030也无法编码的字符,可以加上 errors='ignore'来忽略非法字符

lines = open('西游记.txt', encoding='gb18030', errors='ignore').read()

注意:

r/w 模式,可以指定编码,也可以不指定,windows下默认是gbk编码。

rb/wb模式直接读取二进制,与编码没有关系,加上就报错。(rb/wb不能与encoding共存)

UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 575056: illegal multibyte sequenc相关推荐

  1. 成功解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 28: illegal multibyte sequenc

    成功解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 28: illegal multibyte sequenc ...

  2. 【报错】UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 13: illegal multibyte sequenc

    [报错]UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 13: illegal multibyte sequenc ...

  3. 解决Python报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte

    解决Python报错–UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte ...

  4. UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 658: illegal multibyte sequence

    解决Python报错–UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte ...

  5. 编码调试:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 12: illegal multibyte sequen

    在程序段: stopkey = [w.strip() for w in codecs.open('data/stopWord.txt', 'r').readlines()] 出现错误: Unicode ...

  6. 成功解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xba in position 2: illegal multibyte sequence

    成功解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xba in position 2: illegal multibyte sequence ...

  7. UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal multibyte sequence

    python读取txt文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal mul ...

  8. UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence

    在做<机器学习实战>里的朴素贝叶斯算法时提示错误 UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 19 ...

  9. UnicodeDecodeError: 'gbk' codec can't decode byte 0xd2 in position 85: illegal multibyte sequence

    1.今天,写一个小代码运行时,报了这个错误:UnicodeDecodeError: 'gbk' codec can't decode byte 0xd2 in position 85: illegal ...

  10. 踩坑记-- UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa6 in position 17: illegal multibyte seque

    在使用exejs运行js代码的时候发生如下报错,但是在命令行去运行js文件正常: Exception in thread Thread-1: Traceback (most recent call l ...

最新文章

  1. php获取mysql数据菜鸟_PHP 连接 MySQL | 菜鸟教程
  2. 螃蟹学PHP设计模式之解释器模式
  3. Windows下使用gvim格式化xml文件
  4. 信息检索的评价指标(Precision、Recall、F-score、MAP、ROC、AUC)
  5. mysql内部安装workb_centOS系统中下安装mysql workbench图文详细步骤
  6. Androidz之Activity概要学习
  7. 简单的群体测试方案C++代码(Group testing against Covid-19)
  8. 反射使用 非空表向空表赋值
  9. 【数学优化】学习知识点
  10. C#txt文本分割器
  11. Android自定义T9拨号键盘,Android拨号盘 支持T9搜索和号码搜索等拨号盘案例
  12. python实现携程网站爬取
  13. oracle裁员原因_Oracle中国良心裁员:首批900人,赔偿N+6
  14. Spring框架初学习
  15. 网管“北向接口”与“南向接口”
  16. sql server2008 批量删除发生:查询处理器用尽了内部资源,无法生成查询计划。这种情况很少出现,只有在查询极其复杂或引用了大量表或分区时才会出现。请简化查询
  17. 应广单片机的RAM的清零方法
  18. 教你快速随意重命名多个文件夹名称
  19. 如何用Java设计一个简单的窗口界面(初级二)
  20. 3D打印机喷头堵塞维修

热门文章

  1. 不同系统下的shell的不同_案例分析 | 不同安装角度下平板集热器阳台壁挂式太阳能热水系统性能分析...
  2. python基础1:数据类型和标识符命名规范
  3. local class incompatible: stream classdesc serialVersionUID = -4601057296962918535, local class seri
  4. 读后感系列2:《看见》柴静(一)
  5. Shopee店铺爆单赚钱核心方法!跨境商家必学技能(干货建议收藏)
  6. 哔哩哔哩电脑版怎么下载视频?
  7. 关于小米手机用微信会重启的问题
  8. 高低温试验箱的11点使用注意事项说明
  9. 装完金蝶电脑无限重启_电脑一直自动重启的原因与解决方法
  10. 【Debug】 Packet for query is too large (1155878 > 1048576),max_allowed_packet设置.