UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 575056: illegal multibyte sequenc
lines = open('西游记.txt').read() # Windows 平台的默认编码是GBK
报错,已知文件编码是ANSI(GBK)
UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 575056: illegal multibyte sequence
意思是'gbk'编解码器无法解码位置为575056的字节0xfe:非法多字节序列。大概是说,在575056位置的字在gbk中没有,所以解码错误。
(GB2312过时标准、GBK微软标准、GB18030国家标准。GB18030收录的汉字最多)
lines = open('西游记.txt', encoding='GB18030').read()
这样就没有错误,应该是GB18030包含了在575056位置的字。
如果还不行,应该就是出现了GB18030也无法编码的字符,可以加上 errors='ignore'来忽略非法字符
lines = open('西游记.txt', encoding='gb18030', errors='ignore').read()
注意:
r/w 模式,可以指定编码,也可以不指定,windows下默认是gbk编码。
rb/wb模式直接读取二进制,与编码没有关系,加上就报错。(rb/wb不能与encoding共存)
UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 575056: illegal multibyte sequenc相关推荐
- 成功解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 28: illegal multibyte sequenc
成功解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 28: illegal multibyte sequenc ...
- 【报错】UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 13: illegal multibyte sequenc
[报错]UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 13: illegal multibyte sequenc ...
- 解决Python报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte
解决Python报错–UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte ...
- UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 658: illegal multibyte sequence
解决Python报错–UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte ...
- 编码调试:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 12: illegal multibyte sequen
在程序段: stopkey = [w.strip() for w in codecs.open('data/stopWord.txt', 'r').readlines()] 出现错误: Unicode ...
- 成功解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xba in position 2: illegal multibyte sequence
成功解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xba in position 2: illegal multibyte sequence ...
- UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal multibyte sequence
python读取txt文件时报错: UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal mul ...
- UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence
在做<机器学习实战>里的朴素贝叶斯算法时提示错误 UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 19 ...
- UnicodeDecodeError: 'gbk' codec can't decode byte 0xd2 in position 85: illegal multibyte sequence
1.今天,写一个小代码运行时,报了这个错误:UnicodeDecodeError: 'gbk' codec can't decode byte 0xd2 in position 85: illegal ...
- 踩坑记-- UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa6 in position 17: illegal multibyte seque
在使用exejs运行js代码的时候发生如下报错,但是在命令行去运行js文件正常: Exception in thread Thread-1: Traceback (most recent call l ...
最新文章
- php获取mysql数据菜鸟_PHP 连接 MySQL | 菜鸟教程
- 螃蟹学PHP设计模式之解释器模式
- Windows下使用gvim格式化xml文件
- 信息检索的评价指标(Precision、Recall、F-score、MAP、ROC、AUC)
- mysql内部安装workb_centOS系统中下安装mysql workbench图文详细步骤
- Androidz之Activity概要学习
- 简单的群体测试方案C++代码(Group testing against Covid-19)
- 反射使用 非空表向空表赋值
- 【数学优化】学习知识点
- C#txt文本分割器
- Android自定义T9拨号键盘,Android拨号盘 支持T9搜索和号码搜索等拨号盘案例
- python实现携程网站爬取
- oracle裁员原因_Oracle中国良心裁员:首批900人,赔偿N+6
- Spring框架初学习
- 网管“北向接口”与“南向接口”
- sql server2008 批量删除发生:查询处理器用尽了内部资源,无法生成查询计划。这种情况很少出现,只有在查询极其复杂或引用了大量表或分区时才会出现。请简化查询
- 应广单片机的RAM的清零方法
- 教你快速随意重命名多个文件夹名称
- 如何用Java设计一个简单的窗口界面(初级二)
- 3D打印机喷头堵塞维修
热门文章
- 不同系统下的shell的不同_案例分析 | 不同安装角度下平板集热器阳台壁挂式太阳能热水系统性能分析...
- python基础1:数据类型和标识符命名规范
- local class incompatible: stream classdesc serialVersionUID = -4601057296962918535, local class seri
- 读后感系列2:《看见》柴静(一)
- Shopee店铺爆单赚钱核心方法!跨境商家必学技能(干货建议收藏)
- 哔哩哔哩电脑版怎么下载视频?
- 关于小米手机用微信会重启的问题
- 高低温试验箱的11点使用注意事项说明
- 装完金蝶电脑无限重启_电脑一直自动重启的原因与解决方法
- 【Debug】 Packet for query is too large (1155878 > 1048576),max_allowed_packet设置.