python读文件的解码方式_跳过Python文件读取中的不可解码字符
我有一个csv文件,我想用Python读取它。当我使用下面的代码片段时,我得到一个错误。在with open(input_file, 'r') as file:
self.md = file.read()
UnicodeDecodeError: 'ascii' codec can't decode byte 0x89 in position 58658: ordinal not in range(128)
或者
^{pr2}$
或者with open(input_file, 'r', encoding='utf8') as file:
self.md = file.read()
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 58658: invalid start byte
或者with open(input_file, 'r') as file:
# START INFINITE LOOP
while (True):
self.md = file.readline()
print (self.md)
# END INFINITE LOOP
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 1314: invalid start byte
当我在textwarangler或Excel中打开该文件时,即使选择了displayinfisibles in textwarangler,我也没有看到任何奇怪的字符。其他一些奇怪的观察:出错的总是第1380行,即使我从文件中删除了1370-1390行。这让我怀疑这一行是否有错别字。在
有没有一种方法可以读取文件并直接跳过不可解码的字符?在
编辑
这是问题区域周围的一个十六进制垃圾场。位置58658是十六进制的位置E522。二线第二场的89人似乎是罪魁祸首。在000e510: 3436 3822 3b22 4152 454d 4920 2020 2020 468";"AREMI
000e520: 6e6f 8922 3b3b 3b0a 2246 3130 3030 3134 no.";;;."F100014
000e530: 3639 223b 2230 3030 3134 3639 223b 2245 69";"0001469";"E
编辑2
{cd1>编码可以读取文件。问题仍然存在:是否可以假设UTF-8读取文件,并跳过无法读取的字节序列?在
python读文件的解码方式_跳过Python文件读取中的不可解码字符相关推荐
- python爬取微信群聊天信息_跳一跳python使用教程 微信跳一跳python怎么刷分
跳一跳python使用教程 微信跳一跳python怎么刷分?下面一起来看看吧. 微信跳一跳python怎么刷分?跳一跳python使用教程: 工具介绍 Python 2.7 Android 手机 Ad ...
- python程序设计语言的执行方式_编程语言用Python执行程序的4种方式
在编写代码中,经常会遇到在 Python程序中打开外部程序的需求,那么在Python里如何打开外部程序呢?今天我们来介绍四种不同的方式,供大家参考收藏. 使用 os.system() os.syste ...
- python多线程实现同步的方式_深入解析Python中的线程同步方法
同步访问共享资源 在使用线程的时候,一个很重要的问题是要避免多个线程对同一变量或其它资源的访问冲突.一旦你稍不留神,重叠访问.在多个线程中修改(共享资源)等这些操作会导致各种各样的问题:更严重的是,这 ...
- C#以文件夹共享方式实现2G以上大文件传输
protected void Page_Load(object sender, EventArgs e) {//下面的方法调用时最好做成异步线程,以免在文件过大时让用户主线程等待过久//如果asp.n ...
- logback-spring.xml 文件路径 相对路径_小白学 Python(18):基础文件操作
人生苦短,我选Python 前文传送门 小白学 Python(1):开篇 小白学 Python(2):基础数据类型(上) 小白学 Python(3):基础数据类型(下) 小白学 Python(4):变 ...
- python的read函数调用报错_从零开始学Python(七):文件存储I/O流和异常捕捉
这两天在搞小程序开发,耽搁了一下更新的进度,今天补上.一个完整的前端程序肯定离不开数据存储和网络两个模块,今天我们就先来讲讲python中的一种常见数据存储:文件存储!~! 文件存储(I/O操作) 何 ...
- python为运行为何出现乱码_我的python写入文件正常,打开后却是乱码格式为什么?...
windows7 +2.7.5 我的源代码: #!/usr/bin/env python # -*- coding: utf-8 -*- file = open(r"D:\Android\p ...
- 不是python文件操作的相关函数_从零开始学Python(七):文件存储I/O流和异常捕捉
这两天在搞小程序开发,耽搁了一下更新的进度,今天补上.一个完整的前端程序肯定离不开数据存储和网络两个模块,今天我们就先来讲讲python中的一种常见数据存储:文件存储!~! 文件存储(I/O操作) 何 ...
- python读excel两列为字典_用python读取Excel并保存字典?一两行代码完成骚操作
分享一个前几天晚上粉丝问的问题,觉得很实用的一个问题,用python读取Excel并保存字典,如何做? 下面是该同学问题截图和代码 代码截图是下面这样的 不知道大家第一眼看了这个代码,什么感受?我第一 ...
最新文章
- Easyui combobox下拉框默认选中第一项
- [Hive_add_8] Hive 常用参数配置
- mysql主从(GTID复制模式)
- 9、ShardingSphere 之 Sharding-Proxy 读写分离
- iOS 修改项目名称
- Android之屏幕旋转之后当前activity被finish了依然被拉起来
- (pytorch-深度学习系列)pytorch构造深度学习模型-学习笔记
- 10分钟上线 - API网关 + 函数计算实现图片处理服务
- 信息学奥赛一本通 1033:计算线段长度 | OpenJudge NOI 1.3 16
- I9 9900K线程_收藏党抓紧了!英特尔停产i9-9900K特色包装,只因运输太浪费
- emacs24下使用jedi对python编程进行补全
- Nero Video 2019中文破解版
- c语言求信源的信息熵,第二章-信源与信息熵(三)
- Windows10操作系统搭建C语言开发环境
- 1人工智能概述------人工智能发展历程(人工智能的起源、人工智能的发展经历了六个阶段)
- 如何应对微信群舆情?
- python量化策略——改进的美林时钟代码(代码版)
- Python Qt6快速入门-嵌入PyQtGraph图表
- 冰蝎shell_冰蝎全系列有效:针对 HTTPS 加密流量的 webshell 检测研究
- Debian编译内核教程
热门文章
- 2022-2028年中国复合软管行业市场行情动态及发展趋向分析报告
- 2017 年已读书单总结
- 【Sql Server】数据库的安全机制
- distill bert 相关问题
- [JavaScript] Math里的api
- [JAVAEE] 理解“自然模板“+使用 ModelAndView 对象
- Android 属性动画(Property Animation) ObjectAnimator的介绍
- Binary XML file line #39: 最多只支持3个子View,Most only support three sub vi
- 纯CSS制作的图形效果
- unity开发小贴士之八 Audio使用心得