错误信息:

UnicodeDecodeError: ‘XXX' codec can't decode bytes in position 2-5: illegal multibyte sequence

这是因为遇到了非法字符,例如:全角空格往往有多种不同的实现方式,比如\xa3\xa0,或者\xa4\x57,
这些字符,看起来都是全角空格,但它们并不是“合法”的全角空格
真正的全角空格是\xa1\xa1,因此在转码的过程中出现了异常。 
而之前在处理数据库中的数据时,遇到了非法空格问题导致无法正确解析数据。

解决办法:

#将获取的字符串str做decode时,指明ignore,会忽略非法字符,

#当然对于gbk等编码,处理同样问题的方法是类似的

strTest = str.decode('utf-8', 'ignore')

return strTest

补充:

默认的参数就是strict,代表遇到非法字符时抛出异常; 
如果设置为ignore,则会忽略非法字符; 
如果设置为replace,则会用?号取代非法字符; 
如果设置为xmlcharrefreplace,则使用XML的字符引用。

转载于:https://www.cnblogs.com/zhbzz2007/p/4960440.html

处理UnicodeDecodeError: ‘XXX' codec can't decode bytes in position...的问题相关推荐

  1. UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 708-709: invalid continuation byte

    UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 708-709: invalid continuation byte

  2. UnicodeDecodeError: 'gb2312' codec can't decode bytes in position 723269-723270: illegal multibyte s

    pycharm控制台中文乱码,目标网页编码gb2312编码 <meta http-equiv="Content-Type" content="text/html; ...

  3. 解决python偶尔读文件报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 1022-1023: unex....

    完整报错为:UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 1022-1023: unexpected end of ...

  4. word2vec加载异常解决:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position。。。

    原文链接:https://blog.csdn.net/W_Honor/article/details/105037033?utm_medium=distribute.pc_relevant.none- ...

  5. UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 5098-5099: invalid continuatio byte

    问题描述 读取数据集(.csv格式)时遇到如下错误: UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 5098-509 ...

  6. pycharm运行异常 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 600-601: invalid contin

    pycharm运行异常 UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 600-601: invalid contin ...

  7. pandas read_csv ‘utf-8‘ codec can‘t decode bytes in position 1198-1199: invalid continuation byte解决

    pandas read_csv 'utf-8' codec can't decode bytes in position 1198-1199: invalid continuation byte解决 ...

  8. python中trun是什么意思_Python 中 'unicodeescape' codec can't decode bytes in position XXX: trun错误解...

    Python 中 'unicodeescape' codec can't decode bytes in position XXX: trun错误解决方案 背景描述 今天在运用Python pillo ...

  9. python SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: trunca

    这个是笔者在通过绝对路径读取文件时出现的错误,笔者使用的命令如下 file = open('C:\Users\Wudl\Desktop\pi_digits1.txt','r') 结果出现错误 Synt ...

最新文章

  1. 14、ListView案例
  2. 基于Java Socket的文件UpLoad代码(完美版)-用递归解决java的目录树遍历
  3. 如何使用MaxCompute Spark读写阿里云Hbase
  4. java异常处理机制_Java的异常处理机制
  5. Hadoop单点安装(伪分布式)
  6. LeetCode 59. 螺旋矩阵 II
  7. matlab矩阵内存预分配
  8. Django——日志
  9. java经典算法(一)——zws
  10. 阿里云产品分析(PPT)
  11. ArchLinux中使用yaourt安装AUR上面的各种包
  12. FSOS森林模拟优化模型学习笔记
  13. 函数的调用(传值调用和传址调用)
  14. Angular *NgFor - angular 基础教程
  15. it可以拥有的证书含金量和途径
  16. 容器与容器云——Docker容器基本概念
  17. 服务器跟普通电脑的区别?
  18. uni-app类似淘宝选择商品多规格(库存判断)
  19. 基于51单片机电子秤称重系统10kg量程proteus仿真原理图PCB
  20. 【验证码一】验证码Demo

热门文章

  1. mysql 范围内日期列表_MySQL:即使没有记录,也选择范围内的所有日期
  2. glusterfs java_GlusterFS分布式文件系统使用简介
  3. java 对象 转换 工具类_Java中excel与对象的互相转换的通用工具类编写与使用(基于apache-poi-ooxml)...
  4. 2018年计算机应用基础性考,2018年电大计算机应用基础核心课形考册
  5. 【BZOJ1257】余数之和sum,数论练习之取值讨论
  6. 1.极限——例子_4
  7. vs2017 linux工程设置头文件,使用Visual Studio 2017作为Linux C++开发工具
  8. vue2.0中组建里面套用组件_vue2.0如何嵌套组件
  9. python自己写包_封装属于自己的Python包
  10. 2017.3.5 yveh测试