1,需要下载的库

基本要求中文分词库jieba,词云库wordcloud。如需要生成有形状的图片则另外需要numpy库、PIL库(python3.5以后好像有自带的),亦可以只用一个imageio库。一般方式(pip 方式)下载不成功的话,可以试一下:

// 以下载numpy包为例,在命令行输入以下语句
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn numpy

2,实例分析

#引入库名
import jieba
import wordcloud
import numpy
from PIL import Image#将文件取出,放入f,可能出错的地方,文件和编码方式不匹配,解决方案:
#方法一:找到文件正确的编码方式,有专门的库做这件事。方法二:把原来的文件打开另存为的时候,把编码方式改为“utf-8”,再保存用新文件操作。
file = open("C:\\Users\Administrator\Desktop\三国演义1.txt","r",encoding = "utf-8")
f = file.read()
file.close()#在网上下载白色背景有形状的图片保存
mask = numpy.array(Image.open("C:\\Users\Administrator\Desktop\\1.png"))#引号中有一个空格(分隔作用,与wordcloud的分词原理有关),不然相当于没有用jieba库
txts = jieba.lcut(f)
txt = " ".join(txts)#font_path = “字体文件地址”,一定要下载一个中文字体库,不然显示结果会很尴尬
w = wordcloud.WordCloud(width = 1000,height = 800,mask = mask,font_path="C:\\Users\Administrator\Desktop\萝莉体 第二版.ttf")
w.generate(txt)
w.to_file("C:\\Users\Administrator\Desktop\\r.png")#最终词云文件储存地址

引入形状:

运行结果:
如果不引入jieba库,和引号中没有空格一样,结果如下:


不引入中文字体的下场:
一个库代替上面两个库提取图片:

from imageio import imread
mask = imread("图片位置")
创作不易,点个赞再走吧

北理嵩天教授课程,生成中文词云及问题解决相关推荐

  1. 封装汉语自然语言处理中的常用方法(附代码:生成中文词云)

    前叙 该文章写作共花费二十分钟,阅读只需要七分钟左右,读完该文章后,你将学会使用少量代码,将中文小说,中文新闻,或者其他任意一段中文文本生成词云图 背景 在进行汉语自然语言处理时候,经常使用的几个方法 ...

  2. python——wordcloud生成中文词云

    毕设中期答辩,想展示一下前期数据抓取和聚类的成果,感觉词云这种形式不错,于是简单学习了一下wordcloud. 首先是安装 我是使用pip直接安装的, pip install wordcloud 没有 ...

  3. python生成中文词云的代码_[python] 基于词云的关键词提取:wordcloud的使用、源码分析、中文词云生成和代码重写...

    1. 词云简介 词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意 ...

  4. Python NLPIR2016 与 wordcloud 结合生成中文词云

    前叙 该博文继承之前的文章,进一步介绍NLPIR2016的使用,三个内容(利用NLPIR 的发现新词功能自动提取文本内的新词汇,解决worldcloud中英文混合只显示中文的问题,NLPIR与worl ...

  5. Python + wordcloud + jieba 十分钟学会生成中文词云

    前述 本文需要的两个Python类库 jieba:中文分词分词工具 wordcloud:Python下的词云生成工具 写作本篇文章用时一个小时半,阅读需要十分钟,读完该文章后你将学会如何将任意中文文本 ...

  6. Python 爬取生成中文词云以爬取知乎用户属性为例

    代码如下: # -*- coding:utf-8 -*-import requests import pandas as pd import timeimport matplotlib.pyplot ...

  7. python爬取数据生成词云_Python 爬取生成中文词云以爬取知乎用户属性为例

    代码如下: # -*- coding:utf-8 -*- import requests import pandas as pd import time import matplotlib.pyplo ...

  8. 基于python的词云生成-中文词云(指定词云形状)

    基于python的词云生成(二) 1.简介    本文是在基于python的词云生成(一)的基础上,进一步对云词进行编写,本文还使用了jieba分词对中文进行分词处理,以做出更好的效果.    jie ...

  9. WordArt怎样生成中文词云?

    关于WordArt的用法,网上已有一些教程. 例如:WordArt : 简单就能用的可视化工具,让文字聚合成图案 #Web 怎么使用 WordArt 拼接图片做成炫酷文字云? 但这些教程都没能很好地帮 ...

最新文章

  1. HTTP长连接和短连接 + Websocket
  2. Amazon Aurora 升级, 兼容 PostgreSQL
  3. 第一天2017/03/28
  4. deepin-Code::Blocks安装与配置
  5. js map 只输出key_什么时候适合使用Map而不是Object
  6. taylor级数 matlab,Taylor级数与Fourier级数展开式比较与MATLAB实例.docx
  7. 苏泊尔搭载华为鸿蒙系统,华为鸿蒙打算在一年内跨过生死线,拿下16%的市场份额...
  8. linux环境变量自动配置,Linux进入系统时自动配置 环境变量的要领
  9. SQL数据库中主键和外键的应用实例
  10. 笔记本无线网卡变身热点供手机Wi-Fi免费通过宽带上网
  11. iOS动画之模拟音量振动条
  12. 使用rust调用c++静态库并编译nodejs包
  13. flutter 截图 截长图 滚动截图 保存到手机
  14. 如何利用PS做文字拼接海报
  15. 微信小程序整合Vant Weapp 步骤
  16. python分号_python分号_python 分号_python加分号 - 云+社区 - 腾讯云
  17. 记nuc8的开箱以及安装hackintosh
  18. Word文档进行XXE攻击
  19. 心田花开:解锁各类语文阅读理解答题技巧
  20. CentOS 7输入startx无法启动图形化界面

热门文章

  1. 如何得到IPhone人像模式中图像的深度图
  2. KVM学习(二十一)性能监视与优化
  3. 亚马逊品牌推广视频被拒,到底是为什么?
  4. 第五人格服务器维修到几点,第五人格:凌晨三点停服维护或有大动作?官方修复32个系统漏洞!...
  5. 教你用支付宝一键生成证件照,简单又实用,效果比照相馆的好太多
  6. 阿里工作9年,熬到技术总监的“我”,选择离职:想给还在努力的你提个醒……...
  7. 乔布斯、村上春树,那些绝顶厉害的人,都自律到变态!
  8. Java的类和包的总结
  9. y470 bios uefi_AMD又给CPU打鸡血了!但刷BIOS前你要懂这些
  10. 带你了解抖音神器---Java实现图片(Image)转字符(ASCII)图片!