问题描述

尝试用Python写一个Wordcloud的时候,出现了编码问题。
照着网上某些博客的说法添添改改后,结果是变成了“UnicodeDecodeError: ‘utf-8’ codec can’t decode byte…”这个错误。
捣鼓了一天啊,TXT(此处为本人现下内心表情)。最后,干脆写个最简单的文件读取,竟然还是报错。于是就考虑是不是txt的编码问题,因为读取的txt文件是在Mac上面新建的纯文本文件,一时没找到在哪里查看编码,最后拷贝到Windows系统上,查看了txt文件的编码,竟然是ASCII,不是我最爱的utf-8,Mac你辜负了我对你的一番信任啊!ε(┬┬﹏┬┬)3

解决方法

将txt文件的编码格式改为utf-8即可

此外,在打开文件的时候,要加上第三个参数encoding=‘utf8’(没有横杠)。

with open('./test3.txt','r',encoding='utf8') as fin:for line in fin.readlines():line = line.strip('\n')

下面附上第一次成功显示的词云的源码(参考网上他人的,注释很详细)

import jieba
import jieba.analyse
from matplotlib import pyplot as plt
from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator# 1.读取数据
with open("./test.txt","r",encoding="utf8") as f:text = f.read()# 2.基于 TextRank 算法的关键词抽取,top50
keywords = jieba.analyse.textrank(text, topK=50, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v'))
file = ",".join(keywords)# 指定中文字体,不然中文显示框框
font = r'./HYQiHei-25J.ttf'
print(file)
# 指定背景图,随意
image = imread('cake.jpg')
wc = WordCloud(font_path=font,background_color='white',#背景色mask=image,#背景图stopwords=STOPWORDS,#设置停用词max_words=100,#设置最大文字数max_font_size=100,#设置最大字体width=800,height=1000,)#生成词云
image_colors = ImageColorGenerator(image)
wc.generate(file)# 使用matplotlib,显示词云图
plt.imshow(wc)  #显示词云图
plt.axis('off') #关闭坐标轴
plt.show()
# 保存图片
wc.to_file('news.png')

Python3 读取中文文件txt编码问题相关推荐

  1. python读取中文txt文本-Python3 解决读取中文文件txt编码的问题

    问题描述 尝试用Python写一个Wordcloud的时候,出现了编码问题. 照着网上某些博客的说法添添改改后,结果是变成了"UnicodeDecodeError: "utf-8' ...

  2. python读取中文文件报错-Python3 解决读取中文文件txt编码的问题

    问题描述 尝试用Python写一个Wordcloud的时候,出现了编码问题. 照着网上某些博客的说法添添改改后,结果是变成了"UnicodeDecodeError: "utf-8' ...

  3. python怎么读取中文文件-Python3 解决读取中文文件txt编码的问题

    问题描述 尝试用Python写一个Wordcloud的时候,出现了编码问题. 照着网上某些博客的说法添添改改后,结果是变成了"UnicodeDecodeError: "utf-8' ...

  4. python3读文件中文_详解Python3解决读取中文文件txt编码的问题

    import jieba import jieba.analyse from matplotlib import pyplot as plt from scipy.misc import imread ...

  5. python3 读写中文文件

    1.读取中文文件 在open函数末端加一个encoding声明就好了,encoding声明里用的编码是文本自己本身所用的编码,代码如图 inpute = open(copy_file,encoding ...

  6. python怎么读取csv文件-python3读取csv文件任意行列代码实例

    这篇文章主要介绍了python3读取csv文件任意行列代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 读取每一行 reader = csv. ...

  7. Android读取中文文件乱码解决方法

    最近在做个MP3播放器,出现中文乱码问题,在网上找了很多解决办法,我整理了出现乱码的点和解决方案,拿出来和大家共享一下 1.读取中文文件乱码解决方法 package com.apj.conv; imp ...

  8. pandas读取csv文件发生编码(encoding)错误:获取文件编码格式之后再读取文件

    pandas读取csv文件发生编码(encoding)错误:获取文件编码格式之后再读取文件 目录

  9. python怎么读取excel某一行某一列-python3读取excel文件只提取某些行某些列的值方法...

    今天有一位同学给了我一个excel文件,要求读取某些行,某些列,然后我试着做了一个demo,这里分享出来,希望能帮到大家: 首先安装xlrd: pip3 install xlrd 然后上代码: imp ...

最新文章

  1. JS去除字符串左右两端的空格
  2. JavaScript学习第一天(一)
  3. oracle最快访问行,Oracle技术网—在Oracle快速进行数据行存在性检查
  4. windows和centos7实现文件共享之samba
  5. 04.监控过程组-偏差分析
  6. 鹅厂优文 | ReactJS一点通
  7. 电大计算机网考视频,2016年12月电大计算机网考多媒体技术复习资料 整理版.doc...
  8. CAXA 分解命令x 解决不能选中图形问题。
  9. 服务器默认用户名密码
  10. mysql-sql操作
  11. 黑马程序员----------Java新特性反射 泛型
  12. 实现省市县的两种方式
  13. ZHW_AI发布CSDN的模板和要求
  14. 除了性以外,有没有快速、高效的释放压力、清空大脑的方式?
  15. shapely包的使用
  16. 计算机视觉中的小样本学习综述
  17. matlab 归一化功率谱,求大神指点如何画归一化功率谱的图像啊
  18. 合并与拆分数据模型(MSDM:Merging Spliting Data Modeling)
  19. 在RHEL6_Oracle_Linux_6上生成正确的udev_rule_规则文件
  20. 计算机组成原理英文归纳

热门文章

  1. html全屏背景视频特效,HTML – 中心全屏背景视频
  2. 五大列级庄_61列级名庄介绍
  3. Robinhood向美国监管机构递交供传统银行服务的规章
  4. 一行“无用”的枚举反使Rust执行效率提升10%,编程到最后都是极致的艺术!
  5. 什么是DevOps?如何理解DevOps思想?
  6. R6025 - pure virtual function call
  7. Android FTP 客户端 上传/下载 带进度条实战源码
  8. IDS 和 IPS 日志监控
  9. 设置滚动条样式vue + div + el-table
  10. 美团是如何基于深度学习实现图像的智能审核?