python读取中文文件报错-Python3 解决读取中文文件txt编码的问题
问题描述
尝试用Python写一个Wordcloud的时候,出现了编码问题。
照着网上某些博客的说法添添改改后,结果是变成了“UnicodeDecodeError: "utf-8' codec can't decode byte…”这个错误。
捣鼓了一天啊,TXT(此处为本人现下内心表情)。最后,干脆写个最简单的文件读取,竟然还是报错。于是就考虑是不是txt的编码问题,因为读取的txt文件是在Mac上面新建的纯文本文件,一时没找到在哪里查看编码,最后拷贝到Windows系统上,查看了txt文件的编码,竟然是ASCII,不是我最爱的utf-8,Mac你辜负了我对你的一番信任啊!ε(┬┬﹏┬┬)3
解决方法
将txt文件的编码格式改为utf-8即可
此外,在打开文件的时候,要加上第三个参数encoding="utf8'(没有横杠)。
with open('./test3.txt','r',encoding='utf8') as fin:
for line in fin.readlines():
line = line.strip(' ')
下面附上第一次成功显示的词云的源码(参考网上他人的,注释很详细)
import jieba
import jieba.analyse
from matplotlib import pyplot as plt
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
# 1.读取数据
with open("./test.txt","r",encoding="utf8") as f:
text = f.read()
# 2.基于 TextRank 算法的关键词抽取,top50
keywords = jieba.analyse.textrank(text, topK=50, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v'))
file = ",".join(keywords)
# 指定中文字体,不然中文显示框框
font = r'./HYQiHei-25J.ttf'
print(file)
# 指定背景图,随意
image = imread('cake.jpg')
wc = WordCloud(
font_path=font,
background_color='white',#背景色
mask=image,#背景图
stopwords=STOPWORDS,#设置停用词
max_words=100,#设置最大文字数
max_font_size=100,#设置最大字体
width=800,
height=1000,
)
#生成词云
image_colors = ImageColorGenerator(image)
wc.generate(file)
# 使用matplotlib,显示词云图
plt.imshow(wc) #显示词云图
plt.axis('off') #关闭坐标轴
plt.show()
# 保存图片
wc.to_file('news.png')
以上这篇Python3 解决读取中文文件txt编码的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
本文标题: Python3 解决读取中文文件txt编码的问题
本文地址: http://www.cppcns.com/jiaoben/python/294349.html
python读取中文文件报错-Python3 解决读取中文文件txt编码的问题相关推荐
- include引入php报错,如何解决引入php文件报错的问题
引入php文件报错的解决办法:首先检测被包含的文件读权限是否打开:然后检测被包含的文件路径上的每个目录的x权限是否打开,将该权限打开即可. php脚本中include文件报错解决方法 经常当php页面 ...
- Vivado生成bit文件报错彻底解决
1.1 Vivado生成bit文件报错彻底解决 1.1.1 本节目录 1)本节目录: 2)本节引言: 3)FPGA简介: 4)Vivado生成bit文件报错彻底解决: 5)结束语. 1.1.2 本节引 ...
- 引入文件报错的解决方法(bootstrap+jquery项目)
这篇文章主要介绍了bootstrap+jquery项目引入文件的常见报错问题,下面给大家分享了一些错误及错误的解决方法,需要的朋友可以参考下 做一个项目的时候 ,控制台总是会出现各种bug,其实不用慌 ...
- python中unexpected indent报错的解决办法
python中unexpected indent报错的解决办法 在我们初步学习pyton的时候,由于对python语言的学习掌握不充分,则会导致所编写的代码,运行时候报错.比如,容易报错的unexpe ...
- Linux打开文件报错E325解决方法
提示:记得点赞加关注哦! 目录 问题描述 原因分析: 解决方案: 问题描述 提示:这里描述linux中遇到的问题: 例如:Linux打开文件报错E325解决方法 E325: ATTENTION Fou ...
- scp远程传输文件报错,不是完整文件,not a regular file
错误信息: scp远程传输文件报错,不是完整文件,not a regular file -- 不是完整文件 解决办法: 如果传输的是文件 scp 文件路径 主机名:$PWD 如果传输的是文件夹 scp ...
- python 读取xlsx文件报错,解决方法 ( xlrd 2.0.1 仅支持 .xls 文件)
一.问题: python读取xlsx文件报错,报错信息如下: 为什么会报错?那是因为xlrd 2.0.1 仅支持 .xls 文件. 二.解决方法: 1.确认自己安装的xlrd版本: 可以先用以下命令看 ...
- python googletrans_Python使用googletrans报错的解决方法
问题 最近在工作中发现了一个问题,Python代码一直用着免费的Google翻译API插件googletrans,这两天突然就报错了: Traceback (most recent call last ...
- pom文件报错常用解决方式
现象: pom文件报错,依赖报错,build中的plugin报红,不管是让maven工程 Reimport 还是 Download Sources 最后删除项目再重新建都不行 解决: 删除未成功下载的 ...
最新文章
- Vue的百度地图插件尝试
- different color in Chrome Development Tool
- 模拟——玩具谜题(洛谷 P1563)
- json jackson
- power bi形状地图_如何使用内置形状图在Power BI中创建地理图
- jmeter分布式步骤
- 修改tomcat的部署名称
- 按照某列属性拆分Excel文件
- python樱花_如何基于python实现画不同品种的樱花树
- 十大验证码解决方案服务比较
- RecyclerView刷新布局时Glide加载图片闪现
- MySQL完整笔记 总结
- 产品经理不再纸上谈兵——关于用户默认头像的思考
- c还是java(雨思版)
- 日本股神是川银藏:从店员到炒股大王
- 国内各类 WebShell 密码大全 爆破、社工用 webshell-password
- 经典日内策略——空中花园(附源码)
- 微信小程序直连蓝牙实现控制继电器及串口调试功能--全系统开源工程
- P1879 [USACO06NOV]Corn Fields G
- 关于微信小程序VM22:2 (in promise) MiniProgramError {“errMsg“:“hideLoading:fail:toast can‘t be found“
热门文章
- blfs(systemv版本)学习笔记-使用apache创建简单的网页服务器
- Django(models中字段+参数)
- document.compatMode属性
- c++学习书籍推荐《Visual C++2008入门经典》下载
- 【php】php5.0以上,instanceof 用法
- http://download.eclipse.org/technology/m2e/releases install error
- python多版本和隔离环境配置
- Selenium+Python ---- 免登录、等待、unittest单元测试框架、PO模型
- 事务(Transaction)
- Kubernetes1.1源码分析(二)