在Python处理字符编码时出现如下错误:

UnicodeDecodeError: 'utf8' codec can't decode byte 0xb1 in position 0: invalid start byte

具体业务场景如下:

我读入一个编码为GBK的文件,解析里面的汉字,使用utf-8编码进行正则匹配,出现上述问题

解决方法:

设置python编码为GBK
#encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('gbk')

参考文献:

[1].http://www.phperz.com/article/14/1222/42448.html

UnicodeDecodeError: 'utf8' codec can't decode byte 0xb1 in position 0: invalid start byte相关推荐

  1. pandas UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb1 in position 0: invalid start byte

    import pandas as pddf = pd.read_csv(r'shares\ST东海洋(002086)\lrb_002086.csv',encoding='gbk' # 修改此处编码 ) ...

  2. 解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte问题

    此文首发于我的个人博客:解决UnicodeDecodeError 'utf-8' codec can't decode byte 0xff in position 0 invalid start by ...

  3. UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb0 in position 0: invalid start byte

    UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 0: invalid start byte

  4. 成功解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0x9a in position 0: invalid start byte

    成功解决UnicodeDecodeError: 'utf-8' codec can't decode byte 0x9a in position 0: invalid start byte 目录 解决 ...

  5. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 0: invalid continuation byte

    [写在前面] 今天在做说stm32和服务器之间的通信时因为编码格式问题导致了一些错误做个记录: 测试时搭载在云服务器上的python socket通讯模块数据接收部分代码如下: receive_dat ...

  6. UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0: invalid continuation byte问题

    在用python编码的时候,想把一txt文件里面的东西,插入到excel表格中,结果出现了UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 ...

  7. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte解决办法

    Pandas导入CSV文件,出现下面的报错信息. /usr/local/lib/python3.5/dist-packages/pandas/io/parsers.py in __init__(sel ...

  8. python错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte

    python错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte解 ...

  9. 解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xca in position 0: invalid continuation byte

    英文字母,数字,符号都用特定的二进制编码方式计算机才能识别."UnicodeDecodeError: 'utf-8' codec can't decode byte 0xca in posi ...

最新文章

  1. 10秒完成Linux系统pip在线安装
  2. 在Eclipse下面安装spket
  3. 机器学习知识点(五)梯度下降法Java实现
  4. Django的电子商务网站的调研
  5. java web 的粗粒度权限管理
  6. java并发编程核心方法与框架_Java并发编程核心方法与框架-Future和Callable的使用...
  7. ArrayList单列集合的简单使用常见方法
  8. POJ 1696 Space Ant(点积的应用)
  9. Mac下虚拟机win10键盘不兼容解决方案-MS Office Word篇
  10. ParkingEE智能化停车服务平台
  11. php 监听 扫描枪,Android监听扫描枪内容(一)
  12. 如何绕过mac地址过滤_Maccms V8 后台Getshell #2(绕过过滤)
  13. 同步Buck芯片的自举电容原理解析
  14. 6-1 读文章(*)
  15. web全栈工程师技能介绍
  16. Chap1_基础理论+Chap2_数据准备和数据模型
  17. 浅析组合子集和的互异性
  18. 1527. 患某种疾病的患者(like关键字的使用)
  19. 计算机职业资格证书有哪些
  20. Linux shell 脚本编程-实战篇(三)

热门文章

  1. linux一键安装包
  2. iCup,USB加热饮品方案
  3. arcengine 加载地图不显示_地图建筑建模制作与输出
  4. stm32f302实现斩波控制步进电机_什么是步进电机控制器?
  5. android post请求_Vue 网络请求框架 axios 使用教程
  6. main方法_错误: 在类 ZiFUChuan.Pyramid 中找不到 main 方法, 请将 main 方法定义为:
  7. c语言fread无法存储,【求助】C语言fread读取二进制文件时,读取结果全都是零
  8. qt工程在linux系统里颜色显示错误_【飞凌嵌入式RK3399开发板试用体验】+QT开发环境搭建测试(二)...
  9. 妲己智能机器人开箱_王者荣耀:妲己第二款史诗限定皮肤周三上架,全局数字流特效一览...
  10. 华为机考HJ1字符串最后一个单词的长度