前言

今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图:

效果图一:

效果图二:

根据效果图分析的还是比较准确的,小说中的主人公就是“程理”,所以出现次数最多。图中有两种模式,一种是默认的模式,另一种是自己添加图片作为背景。下面我就带大家一起来学习怎样去生成词云!

wordcloud的安装

对于新人来说安装wordcloud模块就是一大关,我们一般都是通过Pycharm或者PIP安装的,但是在安装wordcloud时会提示错误,如下:

我的解决方法是直接访问下面的网址,根据你的电脑和py版本下载对应的whl文件

https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

下载完成后,把whl文件放在pip路径下,输入下面的代码,记住代码的whl文件名一定是适合你的文件名,我只是举例:


pip install wordcloud-1.4.1-cp36-cp36m-win32.whl

运行后会显示安装成功

wordcloud的简单用法

wordcloud的基本方法,看源码如下:

各个参数大家应该一看就明白,另外wordcloud还有几个其他方法,比如fit_words,generate(text),to_file(filename)等等都是非常好理解的。

wordcloud生成词云

效果图一的代码:


from wordcloud import WordCloud
import matplotlib.pyplot as plt  #绘制图像的模块
import  jieba                    #jieba分词path_txt='C://Users/Administrator/Desktop/all.txt'
f = open(path_txt,'r',encoding='UTF-8').read()# 结巴分词,生成字符串,wordcloud无法直接生成正确的中文词云
cut_text = " ".join(jieba.cut(f))wordcloud = WordCloud(#设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的font_path="C:/Windows/Fonts/simfang.ttf",#设置了背景,宽高background_color="white",width=1000,height=880).generate(cut_text)plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()

运行后:

效果图二,给词云加上图片背景,代码如下:


from PIL import Image
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import numpy as np
import  jieba
def GetWordCloud():path_txt = 'C://Users/Administrator/Desktop/all.txt'path_img = "C://Users/Administrator/Desktop/timg.jpg"f = open(path_txt, 'r', encoding='UTF-8').read()background_image = np.array(Image.open(path_img))# 结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云,感兴趣的朋友可以去查一下,有多种分词模式#Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。cut_text = " ".join(jieba.cut(f))wordcloud = WordCloud(# 设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的font_path="C:/Windows/Fonts/simfang.ttf",background_color="white",# mask参数=图片背景,必须要写上,另外有mask参数再设定宽高是无效的mask=background_image).generate(cut_text)# 生成颜色值image_colors = ImageColorGenerator(background_image)# 下面代码表示显示图片plt.imshow(wordcloud.recolor(color_func=image_colors), interpolation="bilinear")plt.axis("off")plt.show()if __name__ == '__main__':GetWordCloud()

运行后:

如果有不懂的朋友可以直接在公众号上加我的微信,希望对大家有所帮助!
大家可以关注我的微信公众号:「秦子帅」一个有质量、有态度的公众号!

Python如何生成词云(详解)相关推荐

  1. python制作中文词云_Python如何生成词云(详解)

    前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图: 效果图一: 效果图二: 根据效果图分析的还是比较准确的,小说中的主人公就是"程理" ...

  2. 拿来就用能的Python词云图代码|wordcloud生成词云详解

    词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息.今天,我们就来学习一下Python生成词云 ...

  3. python中做为词云轮廓的图片,Python如何生成词云图片

    很早之前写过一篇怎么利用微博数据制作词云图片出来,之前的写得不完整,而且只能使用自己的数据,现在重新整理了一下,任何的微博数据都可以制作出来,放在今天应该比较应景. 一年一度的虐汪节,是继续蹲在角落默 ...

  4. python制作词云时出现figure1 figure2_用Python生成词云

    词云是一种数据可视化技术,用于表示文本数据,其中每个单词的大小表示其出现的频率或重要性. 可以使用词云突出显示重要的文本数据点. 词云被广泛用于分析来自社交网络网站的数据. 为了在Python中生成词 ...

  5. python生成的词云没有图案_Python如何生成词云的方法

    这篇文章主要介绍了关于Python如何生成词云的方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先 ...

  6. python程序创建词云 中国地图_就这么简单!使用Python生成漂亮的词云

    原标题:就这么简单!使用Python生成漂亮的词云 作者:Linux迷 链接:https://www.linuxmi.com 词云是一种数据可视化技术,用于表示文本数据,其中每个单词的大小表示其出现的 ...

  7. python怎样安装词云库_python词云库wordcloud的使用方法与实例详解

    wordcloud是优秀的词云展示第三方库 一.基本使用 import jieba import wordcloud txt = open("1.txt", "r&quo ...

  8. python 词云_利用Python生成词云

    利用Python生成词云 一.第三方库的安装与介绍 1.1  Python第三方库jieba(中文分词) 1.介绍 "结巴"中文分词:做最好的 Python 中文分词组件. 2.特 ...

  9. Hadoop3.0基础平台搭建(三节点),以及案例运行并使用python生成词云

    一.设备配置列表,软件包 二.主机名映射 三.生成密钥 四.将密钥发送到各个节点 五.注意事项及验证 六.关闭防火墙和SeLinux安全模块(所有主机均需操作 七.解压JDK.hadoop包,设置Ja ...

最新文章

  1. Unity3D提示“XX,some are mac os x (unix) and some are windows”
  2. java中日期的数据类型是啥_用于存储日期和时间的最合适的SQL和Java数据类型
  3. mvc中signalr实现一对一的聊天
  4. kettle 数据转换
  5. 在线 Sql Server 服务无法启动的解决办法
  6. 什么意思呢_technician是什么意思
  7. x265-确定slice type-2
  8. windows7 系统优化大技巧
  9. C# 实现系统关机、注销、重启、休眠、挂起
  10. 匿名内部类使用外面的类为什么要用final型
  11. 初步熟悉RHEL 8
  12. FPGA学习笔记-IP核-FIFO
  13. 视频“云、边、端”全流程支持H.265,意味着更低的流量成本与更高的视频质量,计算压力都在边缘侧
  14. 安装darknet报libQt5Core.so.5: undefined reference
  15. 美国主机中的RAID磁盘是什么意思?
  16. Java成长第五集--面向对象设计的五大原则
  17. 如何判断用户输入的邮箱格式是否正确?
  18. 解决Unable to open debugger port错误
  19. poi在word输出复选框windows远程突然不能复制的解决方法
  20. 【学习笔记】山东大学生物信息学-05 高通量测序技术介绍 + 06 统计基础与序列算法(原理)

热门文章

  1. Java——字符串类实验
  2. 避免骚扰用户?硅谷这样打造移动推送通知!
  3. 【沃顿商学院学习笔记】商业基础——Financing:04通货膨胀 Inflation
  4. 专科计算机学生比211强,别再瞧不起专科!一所211大学,专科专业的“就业率”远高于本科...
  5. leetcode常见经典算法面试题及答案汇总
  6. 数据结构概述(逻辑结构与存储结构概念详解)
  7. 现在入电商创业有点晚了,不行了
  8. Android 打包混淆
  9. 系统迁移服务器上,系统迁移到云服务器上
  10. TINYINT, SMALLINT, MEDIUMINT, INT, and BIGINT类型的显示宽度不显示