问题描述

尝试用Python写一个Wordcloud的时候,出现了编码问题。

照着网上某些博客的说法添添改改后,结果是变成了“UnicodeDecodeError: "utf-8' codec can't decode byte…”这个错误。

捣鼓了一天啊,TXT(此处为本人现下内心表情)。最后,干脆写个最简单的文件读取,竟然还是报错。于是就考虑是不是txt的编码问题,因为读取的txt文件是在Mac上面新建的纯文本文件,一时没找到在哪里查看编码,最后拷贝到Windows系统上,查看了txt文件的编码,竟然是ASCII,不是我最爱的utf-8,Mac你辜负了我对你的一番信任啊!ε(┬┬﹏┬┬)3

解决方法

将txt文件的编码格式改为utf-8即可

此外,在打开文件的时候,要加上第三个参数encoding="utf8'(没有横杠)。

with open('./test3.txt','r',encoding='utf8') as fin:

for line in fin.readlines():

line = line.strip(' ')

下面附上第一次成功显示的词云的源码(参考网上他人的,注释很详细)

import jieba

import jieba.analyse

from matplotlib import pyplot as plt

from scipy.misc import imread

from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator

# 1.读取数据

with open("./test.txt","r",encoding="utf8") as f:

text = f.read()

# 2.基于 TextRank 算法的关键词抽取,top50

keywords = jieba.analyse.textrank(text, topK=50, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v'))

file = ",".join(keywords)

# 指定中文字体,不然中文显示框框

font = r'./HYQiHei-25J.ttf'

print(file)

# 指定背景图,随意

image = imread('cake.jpg')

wc = WordCloud(

font_path=font,

background_color='white',#背景色

mask=image,#背景图

stopwords=STOPWORDS,#设置停用词

max_words=100,#设置最大文字数

max_font_size=100,#设置最大字体

width=800,

height=1000,

)

#生成词云

image_colors = ImageColorGenerator(image)

wc.generate(file)

# 使用matplotlib,显示词云图

plt.imshow(wc) #显示词云图

plt.axis('off') #关闭坐标轴

plt.show()

# 保存图片

wc.to_file('news.png')

以上这篇Python3 解决读取中文文件txt编码的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

本文标题: Python3 解决读取中文文件txt编码的问题

本文地址: http://www.cppcns.com/jiaoben/python/294349.html

python读取中文文件报错-Python3 解决读取中文文件txt编码的问题相关推荐

  1. include引入php报错,如何解决引入php文件报错的问题

    引入php文件报错的解决办法:首先检测被包含的文件读权限是否打开:然后检测被包含的文件路径上的每个目录的x权限是否打开,将该权限打开即可. php脚本中include文件报错解决方法 经常当php页面 ...

  2. Vivado生成bit文件报错彻底解决

    1.1 Vivado生成bit文件报错彻底解决 1.1.1 本节目录 1)本节目录: 2)本节引言: 3)FPGA简介: 4)Vivado生成bit文件报错彻底解决: 5)结束语. 1.1.2 本节引 ...

  3. 引入文件报错的解决方法(bootstrap+jquery项目)

    这篇文章主要介绍了bootstrap+jquery项目引入文件的常见报错问题,下面给大家分享了一些错误及错误的解决方法,需要的朋友可以参考下 做一个项目的时候 ,控制台总是会出现各种bug,其实不用慌 ...

  4. python中unexpected indent报错的解决办法

    python中unexpected indent报错的解决办法 在我们初步学习pyton的时候,由于对python语言的学习掌握不充分,则会导致所编写的代码,运行时候报错.比如,容易报错的unexpe ...

  5. Linux打开文件报错E325解决方法

    提示:记得点赞加关注哦! 目录 问题描述 原因分析: 解决方案: 问题描述 提示:这里描述linux中遇到的问题: 例如:Linux打开文件报错E325解决方法 E325: ATTENTION Fou ...

  6. scp远程传输文件报错,不是完整文件,not a regular file

    错误信息: scp远程传输文件报错,不是完整文件,not a regular file -- 不是完整文件 解决办法: 如果传输的是文件 scp 文件路径 主机名:$PWD 如果传输的是文件夹 scp ...

  7. python 读取xlsx文件报错,解决方法 ( xlrd 2.0.1 仅支持 .xls 文件)

    一.问题: python读取xlsx文件报错,报错信息如下: 为什么会报错?那是因为xlrd 2.0.1 仅支持 .xls 文件. 二.解决方法: 1.确认自己安装的xlrd版本: 可以先用以下命令看 ...

  8. python googletrans_Python使用googletrans报错的解决方法

    问题 最近在工作中发现了一个问题,Python代码一直用着免费的Google翻译API插件googletrans,这两天突然就报错了: Traceback (most recent call last ...

  9. pom文件报错常用解决方式

    现象: pom文件报错,依赖报错,build中的plugin报红,不管是让maven工程 Reimport 还是 Download Sources 最后删除项目再重新建都不行 解决: 删除未成功下载的 ...

最新文章

  1. Vue的百度地图插件尝试
  2. different color in Chrome Development Tool
  3. 模拟——玩具谜题(洛谷 P1563)
  4. json jackson
  5. power bi形状地图_如何使用内置形状图在Power BI中创建地理图
  6. jmeter分布式步骤
  7. 修改tomcat的部署名称
  8. 按照某列属性拆分Excel文件
  9. python樱花_如何基于python实现画不同品种的樱花树
  10. 十大验证码解决方案服务比较
  11. RecyclerView刷新布局时Glide加载图片闪现
  12. MySQL完整笔记 总结
  13. 产品经理不再纸上谈兵——关于用户默认头像的思考
  14. c还是java(雨思版)
  15. 日本股神是川银藏:从店员到炒股大王
  16. 国内各类 WebShell 密码大全 爆破、社工用 webshell-password
  17. 经典日内策略——空中花园(附源码)
  18. 微信小程序直连蓝牙实现控制继电器及串口调试功能--全系统开源工程
  19. P1879 [USACO06NOV]Corn Fields G
  20. 关于微信小程序VM22:2 (in promise) MiniProgramError {“errMsg“:“hideLoading:fail:toast can‘t be found“

热门文章

  1. blfs(systemv版本)学习笔记-使用apache创建简单的网页服务器
  2. Django(models中字段+参数)
  3. document.compatMode属性
  4. c++学习书籍推荐《Visual C++2008入门经典》下载
  5. 【php】php5.0以上,instanceof 用法
  6. http://download.eclipse.org/technology/m2e/releases install error
  7. python多版本和隔离环境配置
  8. Selenium+Python ---- 免登录、等待、unittest单元测试框架、PO模型
  9. 事务(Transaction)
  10. Kubernetes1.1源码分析(二)