python读取文件编码错误_关于python 读取txt文件出现编码问题:
python 读取txt文件出现编码问题:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xba in position 5: invalid start byte 或者 UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 11144: illegal multibyte sequence等
使用代码:
txt = open('红楼梦.txt','r',encoding = 'utf-8').read()
出现错误:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xba in position 5: invalid start byte
将代码改成:
txt = open('红楼梦.txt','r',encoding = 'gbk').read()
再次报错:
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 11144: illegal multibyte sequence
这类错误是txt文件编码问题。
解决方案:打开对应txt文件,找到其右下角对应编码方式,如下图
将其输入至代码"encoding ="后面 替换即可,我这里是ANSI。
最后代码更正如下
txt = open('红楼梦.txt','r',encoding = 'ANSI').read()
修改后没有再出现这类报错。
原文链接:https://blog.csdn.net/qq_42518033/article/details/105263182
python读取文件编码错误_关于python 读取txt文件出现编码问题:相关推荐
- java pdf 转txt文件怎么打开_使用iText将TXT文件转换为PDF(保留格式)
我正在尝试使用iText库将.txt文件转换为.pdf文件.我面临的问题如下: 我在txt文件中有清晰的格式,与此类似: TEXT ******************* Other text her ...
- python打开csv忽略错误_在python中读取错误的格式csv
我收到的格式错误的csv文件(无法控制生成此CSV的应用程序) CSV和第一行的 Headers 如下所示: "Start Time" "End Time" & ...
- python 跳过计算错误_在python中计算分数时如何跳过被0除的错误?
我正在运行一个很长的CSV文件下面的函数.函数每50行计算列MFE的Z分数.这50行中有一些只包含零,因此在计算Zscore时,程序会停止,因为它不能被零除.如何解决这个问题,而不是停止程序运行打印这 ...
- python装饰器类型错误_有没有办法在继承期间保持装饰器? - python
我正在尝试使用未实现的方法编写一个抽象类,这将迫使继承的子代在重写该方法(在装饰器中定义)时返回特定类型的值. 当我使用下面显示的代码时,子方法不会调用装饰器.我认为这是因为该方法被重写了,这很有意义 ...
- python读取txt文件如何按数字分隔_python 读txt文件,按‘,’分割每行数据操作
按行读取TXT文件 fname = './新建文件夹/yob2010.txt' //文件夹路径 with open(fname,'r+',encoding='utf-8') as f: for lin ...
- python将txt文件按行数分成多个txt文件
当一个txt文件太大了打不开,想到的这个方法,分成多个文件方便打开 如果文档中有中文打开时,加上 encoding='UTF-8' 具体见代码块中注释 代码运行工具:jupyter noteboo ...
- python保存图片到指定路径_用 Python 识别图片中的文字
(给Python开发者加星标,提升Python技能) 来源:ZackSock 一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度 ...
- 多个html合成txt,Python - 将多个HTML页解析为单个TXT文件
我试图从X个HTML文件解析特定内容到单个TXT文件.Python - 将多个HTML页解析为单个TXT文件 我已经dirtily编码如下: #!/usr/bin/python import sys, ...
- 【最新实用版】Python批量将pdf文本提取并存储到txt文件中
#注意:笔者在2021/11/11当天调试过这个代码是可用的,由于pdfminer版本的更新,网络上大多数的语法没有更新,我也是找了好久的文章才修正了我的代码,仅供学习参考. 1.把pdf文件移动到本 ...
最新文章
- golang 数组和切片
- camera理论基础和工作原理【转】
- 文巾解题 13. 罗马数字转整数
- 简述python执行原理_Python程序的执行原理(1)(2)
- android+proguard目录,Android proguard问题:路径可能不是null或空字符串.路径=“空”...
- redis学习-NoSQL数据库的四大分类
- 关于Debug.exe
- BGP消息格式-UPDATE
- 进销存excel_不用再花钱买软件做进销存,这份免费的Excel系统送你,财务收
- 【linux】linux下修改鼠标指针
- 高速PCB设计之阻焊层和助焊层的检查
- godot常用的一些概念、组件(整理于官方教程)
- 软件之道 -- 道篇全文
- 基于易班API的Java开发入门教程
- 软件工程应用与实践(十):PP-OCRv2的简单介绍
- 单片机基础项目(上)
- 关于USB3.0的U盘正确用法
- macos安装盘第三方工具制作_简单制作 Mac OS X USB 启动盘的方法教程
- 基于Vue的标尺插件(刻度尺)
- 'Project Name' was compiled with optimization - stepping may behave oddly
热门文章
- 2022 极术通讯-“周易”NPU软件开源项目上线,适配100多种AI算法
- 百度云上传(离线)接口,备份数据到百度云
- excel2019如何保留小数点后两位方法
- 全球及中国轮盘显示屏行业需求现状及投资效益预测报告2022-2027年
- linux top 命令可视化_top——交互界面使用图解
- lottie动画android,lottie——让设计师来写动画
- 【原创】再来二频,发现改变的东西太多了。
- mysql 拼音转汉字_Mysql中文汉字转拼音的实现(每个汉字转换全拼)
- 关于示波器测波特率的方法
- 。那为什么这种新语言取名为Python呢?