用Python进行文本分析时出现UnicodeDecodeError错误的解决方法
问题:利用Python对文本进行分析时,出现UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xef in position 0: ordinal not in range(128)
先看下面这段Python代码:
filename = 'alice.txt'
try:with open(filename) as f_obj:contents = f_obj.read()
except FileNotFoundError:msg = "Sorry, the file " + filename + " does not exist."print(msg)
else:# 计算文件大致包含多少单词words = contents.split()num_words = len(words)print("The file " + filename + " has about " + str(num_words) + " words.")
运行的结果如下:
File "/Users/tiramisu/python_work/10/alice.py", line 5, in <module>contents = f_obj.read()File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/encodings/ascii.py", line 26, in decodereturn codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xef in position 0: ordinal not in range(128)
正是出现了标题中所说的UnicodeDecodeError。
这个问题我在网上找了很多方法,都没能成功解决。最后经过一番波折,终于成功解决了这个问题。
方法就是:
在打开文本的时候,就用utf-8
格式。
就我这个代码而言,只需将第3行的
with open(filename) as f_obj:
修改为:
with open(filename, encoding='utf-8') as f_obj:
即可。
修改后再次运行改代码,结果如下:
至此,该问题已经解决。
用Python进行文本分析时出现UnicodeDecodeError错误的解决方法相关推荐
- 使用R语言包clusterProfiler做KEGG富集分析时出现的错误及解决方法
使用enrichKEGG做通路富集分析时,一直报错:显示No gene can be mapped.... k <- enrichKEGG(gene = gene, organism = &qu ...
- navicat for mysql 1045错误,navicat连接mysql时出现1045错误的解决方法
navicat连接mysql时出现1045错误的解决方法 navicat for MySQL 连接本地数据库出现1045错误 如下图: 查了很多资料,意思是说mysql没有授权远程连接,也就是权限不够 ...
- Adobe flash cs5 的Java运行时环境初始化错误 完美解决方法
Adobe flash cs5 的Java运行时环境初始化错误 完美解决方法 下载网络上的Adobe flash cs5 精简版(绿色版),Java运行时环境初始化时出现错误,你可能需要重装Flash ...
- 安装Exchange2003时出0XC1037AE6错误的解决方法.
安装Exchange2003时出0XC1037AE6错误的解决方法 今天在虚拟机安装Exchange2003时,当进行到林架构扩展ForestPrep时,出现一了个错误: 意思就是: 安装程序在安 ...
- SharePoint2013安装组件时AppFabric时出现1603错误,解决方法:
采用PowerShell命令批量下载必备组件: 下载完成后,采用批处理命令安装必备组件. 注:SPS2013安装必备组件及批处理下载地址: 需要将必备组件放在安装文件的PrerequisiteInst ...
- VMware虚拟机运行虚拟系统时显示“内部错误”的解决方法
VMware虚拟机运行虚拟系统时显示"内部错误"的解决方法 参考文章: (1)VMware虚拟机运行虚拟系统时显示"内部错误"的解决方法 (2)https:// ...
- 服务器复制文件出现io错误,win7系统复制文件时发生IO错误的解决方法
很多小伙伴都遇到过win7系统复制文件时发生IO错误的困惑吧,一些朋友看过网上零散的win7系统复制文件时发生IO错误的处理方法,并没有完完全全明白win7系统复制文件时发生IO错误是如何解决的,今天 ...
- 运行游戏时出现0xc000007b错误的解决方法
原文地址为: 运行游戏时出现0xc000007b错误的解决方法 如图,这个错误使无数玩家烦恼. 出现这个错误,可能是硬件的问题,也可能是软件的问题.但是,由于硬件引起该问题的概率很小,并且除了更换硬件 ...
- mysql连接数据库出现1251错误_连接MySQL数据库时出现#1251错误的解决方法
连接MySQL数据库时出现#1251错误的解决方法 连接MySQL数据库时常会出现如下的错误提示: #1251 - Client does not support authentication pro ...
最新文章
- 网络工程师_记录的一些真题_2016下半年上午
- C# 实现DB文件的导入导出功能
- linux sha1sum命令,Linux下校验SHA1和MD5的方法
- python队列在进程传递_Python 进程队列
- 【李宏毅机器学习】Brief Introduction of Deep Learning 深度学习简介(p12) 学习笔记
- 【utorrent】ubuntu 安装utorrent
- 小米线刷一直显示flashing_小米空调质量怎么样 小米空调一晚上多少电 看完这篇你就有数了...
- JavaScript 霸榜、TypeScript 爆发、开源吞噬世界,GitHub 年度报告正式发布!
- 根据高德API获取poi数据
- 软件工程专业和网络工程专业的区别
- Power Apps 创建响应式布局
- 熊出没机器人光头强_熊出没:光头强除了3个真名,还有6个外号,第4个最让人心酸...
- Web服务器群集——公有CA构建阿里云服务器HTTPS
- c# 指定打开某个路径下的CMD_这招太厉害了,不用鼠标也可以打开指定文件
- pgr_createTopology
- 2022-07成功更换RockyLinux9.0为国内源,并成功更新。
- 5-基于51单片机步进电机的控制研究(原理图工程+仿真工程+答辩论文+答辩PPT)
- tflearn教程_环境部署——Windows下安装配置tensorflow和tflearn
- 2020.03.04软件构造听课笔记
- 电子地图/卫星地图下载并转存为jpg图片
热门文章
- vSphere6.7中WindowsServer2012r2虚拟机磁盘扩容
- windows系统下多个程序窗口快速切换的方法
- 排球分组循环交叉编排_请问一下排球是怎么样编排的啊
- C#中操作Word(9)—— 向Word中插入图表的三种方法(二)
- 微信小程序开发笔记——wsdchong
- 【selection】 学习光标API并实现编辑区插入表情图片的功能
- 几张“有趣”的简图带你理解面试题:String、StringBuffer、StringBuilder区别
- 一级计算机浏览器题加收藏夹,2016年计算机一级考试上机操作重难点突破
- 基于51单片机的数字气压计
- 备份android分区,备份分区