首先我们看看正常的读取数据过程:

with open('test.txt','r',encoding='utf-8') as f:
#很多时候由于数据量比较大,所以并不建议一次性读取,这里我们选择的是逐行一次读取数据for i in f:pass

在读取数据的过程中,有时候会因为某一行数据中有一些特殊字符而出现编码错误。

'utf-8' codec can't decode byte 0xe8 in position 10

一般想到的是通过异常处理直接跳过,但是想想try加在哪里呢?

加在for i in f这里吗?这样就算跳过了异常那不还是拿不到后面的数据吗?

for循环里面就更加不可能了,因为出错是错现在读取过程中,而不是读取之后。

如果是数据量比较小,可以直接打开文件到出错的地方将错误数据修改,或者将那条数据删除都行,但是文件太大了,此时又无法通过打开文件去修改。

其实,可以通过在读取的时候将数据以其他的方式来编码,这个时候是可以正常读取到数据的

with open('test.txt','r', encoding='ISO-8859-1') as f:for i in f:pass

注意编码之后,还需要进行还原

with open('test.txt', 'r', encoding='ISO-8859-1') as f:for i in tqdm(f):# 打印出来数据是ISO-8859-1编码# print(i)# 此处可能还是会因为数据中的特殊字符导致报错try:# 将读取出来的数据先用ISO-8859-1格式给它编码,然后通过utf-8给它解码x = i.encode('ISO-8859-1').decode('utf-8')except UnicodeError as e:print(e)# 跳过出错的数据x = ''if x == '':print(x)with open('test_new.txt', 'a', encoding='utf-8') as f:f.write(x)

问题解决。

python读取txt文件出现UnicodeError相关推荐

  1. python删除重复值所在的行数_使用python读取txt文件的内容,并删除重复的行数方法...

    注意,本文代码是使用在txt文档上,同时txt文档中的内容每一行代表的是图片的名字. #coding:utf-8 import shutil readDir = "原文件绝对路经" ...

  2. python读取txt文件并画图

    1,使用python读取txt文件 已知txt文件内容如下: 0 01 12 43 94 165 256 36 请以第一列为x轴,第二列为y轴画图 步骤如下: 1)使用readlines读取文件 2) ...

  3. python怎么读文件里的某一行-python读取txt文件并取其某一列数据的示例

    菜鸟笔记 首先读取的txt文件如下: AAAAF110 0003E818 0003E1FC 0003E770 0003FFFC 90 AAAAF110 0003E824 0003E208 0003E7 ...

  4. python读取指定路径txt文件-python读取txt文件并取其某一列数据的示例

    菜鸟笔记 首先读取的txt文件如下: AAAAF110 0003E818 0003E1FC 0003E770 0003FFFC 90 AAAAF110 0003E824 0003E208 0003E7 ...

  5. python读取txt文件时去除换行符

    python读取txt文件时去除换行符 python的readlines()方法用于读取所有行,且返回值是一个列表,换行符包含在字符串中. f = open("temp.txt", ...

  6. python读取txt文件代码-Python txt文件常用读写操作代码实例

    python读取txt文件 #方式一: file = r'D: est.txt' with open(file, 'rb+') as f: #可读可写二进制,文件若不存在就创建 data = f.re ...

  7. python读取txt文件为dataframe,python批量读取txt文件为DataFrame

    我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...

  8. python读取txt文件并求和,Python读取txt文件数据的方法(用于接口自动化参数化数据)...

    小试牛刀: 1.需要python如何读取文件 2.需要python操作list 3.需要使用split()对字符串进行分割 代码运行截图 : 代码(copy) #encoding=utf-8 #1.r ...

  9. python读取文件编码错误_关于python 读取txt文件出现编码问题:

    python 读取txt文件出现编码问题:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xba in position 5: invalid ...

最新文章

  1. TCP报文段首部格式详解
  2. 【JUC系列】Future异步回调模式
  3. 答CSDN关于建模的系列问题
  4. 《Python编程快速上手 让繁琐工作自动化》pdf
  5. 分布式机器学习_229页,CMU博士张昊毕业论文公布,探索机器学习并行化的奥秘...
  6. 在laravel5.8中集成swoole组件----初步测试
  7. 精通ASP.NET MVC ——视图
  8. java 图像梯度检测_数字图像处理-边缘检测
  9. node Express 框架
  10. 关于使用cadence建pad
  11. 从0到上线一个完整Java项目,需要具备哪些技能?
  12. 第一个IOS APP总结
  13. 禁用微信浏览器的下拉_解决微信浏览器禁止下拉查看真实域名网址的问题
  14. mysql8.0怎么设置中文版_mysql 8.0.21免安装版配置方法图文教程
  15. HashSet去重方法VS数据库去重查询
  16. 最简单易懂的SpringCloudSleuth教程(spring cloud体系的链路追踪系统)
  17. ramda 函数 String
  18. C-11 Problem H: 开宝箱2
  19. 三、入门Python第三课
  20. oracle e-bussiness 简称

热门文章

  1. 水墨流动生太极,四式''拳诀''展存储
  2. 第 0001 天:聊聊成长型思维模式者
  3. amd自定义分辨率_Intel首款独显性能走光:AMD/NVIDIA芒刺在背
  4. dataframe一列按长度补0_Pandas中Series和DataFrame基础功能详解
  5. PHP基础题带详细答案,PHP基础语法试题(一)答案版.docx
  6. 代替嵌套循环java_蓝石榴_个人博客_Java中for循环嵌套的替换优化
  7. Shell教程----Shell脚本
  8. 国外软件测试方法,ATE软件测试方法研究及实现
  9. 山东女子学院计算机专业分数线,山东女子学院2020年山东省本科专业录取分数统计(含位次)...
  10. 海兰一体计算机参数,海兰幽灵X7电竞一体机怎么样-海兰幽灵X7电竞一体机评测...