python UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 0: invalid start byte
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xbd in position 0: invalid start byte
我遇到该错误的地方有两处:
- 使用open函数后read数据
f = open('D:/test.csv','r',encoding='utf8')
f.readlines()
- 使用pandas read_csv时
df = pd.read_csv('D:/test.csv')
该test.csv是gbk编码。open时指定了utf8解码、pd.read_csv应该默认是utf8解码,所以编码与解码方案不对称。当更改一下解码方案就解决了,代码如下,则不会报错,正常读取。关于open函数的使用参考链接。
f = open('D:/test.csv','r')
f.readlines()
df = pd.read_csv('D:/test.csv',encoding='gbk')
场景说完,我们来解读错误原因。UnicodeDecodeError:Unicode 解码时的错误。 ‘utf-8’ codec can’t decode byte 0xbd in position 0: invalid start byte翻译:utf8解码器无法解码位置0处的0xbd字节,无效的起始字节。
Unicode为什么要解码?因为我们的数据存储时都是二进制,而且是使用了一定编码方式的二进制。当我们用程序读取时,就需要将二进制从存储中拿出来然后使用解码方案去解码呈现出人类可读的数据。当编码方案与解码方案不对称时,就发生解码错误。关于编码方案与解码方案的具体种类和细节,我们后面再讨论。
可以使用UltraEdit和notepad++两个文本编辑器查看和修改文件的编码。
So,理解了上面错误的原因后,对于下面 ↓ 的“双胞胎”型错误也就迎刃而解了吧!
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xab in position 20: illegal multibyte sequen
python UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 0: invalid start byte相关推荐
- 因为编码产生的报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbd in position 0: invalid start byte
发生此报错多半是因为编码. 我这里是在读取txt文本的时候发生的报错,如下: 修改编码为gbk后,就可以正常读取了:
- python错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte
python错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte解 ...
- Python UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbb in position 0: invalid start byte
关注微信公共号:小程在线 关注CSDN博客:程志伟的博客 df1 = pd.read_csv('F:\Python\科室数据.csv',encoding='UTF-8') df1.head(3) Tr ...
- UnicodeDecodeError: 'utf8' codec can't decode byte 0xb1 in position 0: invalid start byte
在Python处理字符编码时出现如下错误: UnicodeDecodeError: 'utf8' codec can't decode byte 0xb1 in position 0: invalid ...
- UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 0: invalid continuation byte
[写在前面] 今天在做说stm32和服务器之间的通信时因为编码格式问题导致了一些错误做个记录: 测试时搭载在云服务器上的python socket通讯模块数据接收部分代码如下: receive_dat ...
- 【debug】UnicodeDecodeError: codec can't decode byte 0xbd in position 4: invalid start byte
问题描述: python内置编码方式为unicode编码,当读取一个非unicode编码文本时,python将报错,如: 情况一: 当文本为 utf-8 编码,直接读取将报错: UnicodeDeco ...
- UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0: invalid continuation byte问题
在用python编码的时候,想把一txt文件里面的东西,插入到excel表格中,结果出现了UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 ...
- UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xff in position 0: invalid start byte ,mac
从网上查了很多种方法*均对我的bug不是很奏效,可能因为我的.txt文件是.xls文件转的,且我要读取的文件只有6个,遂采取最brute的方法:把所有文件里的内容copy出来,放到新文件里即可. *方 ...
- 解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte问题
此文首发于我的个人博客:解决UnicodeDecodeError 'utf-8' codec can't decode byte 0xff in position 0 invalid start by ...
最新文章
- 2013秋东北计算机在线作业,2013秋奥鹏东北师范大学计算机应用基础第三次在线作业及答案.doc...
- python编程语法-Python基础及语法(十三)
- mysql 自后向前截取函数_【转载】Sqlserver使用Right函数从最右边向前截取固定长度字符串...
- 通过libusb操作usb设备扫描二维码
- maven之阿里云Maven镜像的使用
- leetcode35 C++ 4ms 搜索插入位置
- jmeter修改redis_jmeter如何访问redis服务缓存
- python-opencv图像处理之哈里斯角检测
- arduino 中断 串口_【Arduino教程】第一讲:Arduino是什么?
- 服务器装凤凰系统,凤凰系统装在云服务器
- Redis集群管理工具redis-trib
- 【LOL】小龙刷新机制
- 零基础学编程的我的心路历程
- 淘宝天猫1688通过图片搜索到相关产品API(拍立淘以图搜图API接口调用)
- 数据库中的锁机制(数据库中有哪些锁)
- 用户画像中怎么给用户打标签
- cocos creator 优化之相机渲染 drawcall优化
- linux没有i18n文件,【Linux】/etc/sysconfig/i18n文件详解
- 计算机专业写不出程序,计算机专业的同学总说在编写程序,他们究竟在编什
- 再次遇到RuntimeError: CUDA error: an illegal memory access was encountered