Python如何生成词云(详解)
前言
今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图:
效果图一:
效果图二:
根据效果图分析的还是比较准确的,小说中的主人公就是“程理”,所以出现次数最多。图中有两种模式,一种是默认的模式,另一种是自己添加图片作为背景。下面我就带大家一起来学习怎样去生成词云!
wordcloud的安装
对于新人来说安装wordcloud模块就是一大关,我们一般都是通过Pycharm或者PIP安装的,但是在安装wordcloud时会提示错误,如下:
我的解决方法是直接访问下面的网址,根据你的电脑和py版本下载对应的whl文件
https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
下载完成后,把whl文件放在pip路径下,输入下面的代码,记住代码的whl文件名一定是适合你的文件名,我只是举例:
pip install wordcloud-1.4.1-cp36-cp36m-win32.whl
运行后会显示安装成功
wordcloud的简单用法
wordcloud的基本方法,看源码如下:
各个参数大家应该一看就明白,另外wordcloud还有几个其他方法,比如fit_words,generate(text),to_file(filename)等等都是非常好理解的。
wordcloud生成词云
效果图一的代码:
from wordcloud import WordCloud
import matplotlib.pyplot as plt #绘制图像的模块
import jieba #jieba分词path_txt='C://Users/Administrator/Desktop/all.txt'
f = open(path_txt,'r',encoding='UTF-8').read()# 结巴分词,生成字符串,wordcloud无法直接生成正确的中文词云
cut_text = " ".join(jieba.cut(f))wordcloud = WordCloud(#设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的font_path="C:/Windows/Fonts/simfang.ttf",#设置了背景,宽高background_color="white",width=1000,height=880).generate(cut_text)plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()
运行后:
效果图二,给词云加上图片背景,代码如下:
from PIL import Image
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import numpy as np
import jieba
def GetWordCloud():path_txt = 'C://Users/Administrator/Desktop/all.txt'path_img = "C://Users/Administrator/Desktop/timg.jpg"f = open(path_txt, 'r', encoding='UTF-8').read()background_image = np.array(Image.open(path_img))# 结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云,感兴趣的朋友可以去查一下,有多种分词模式#Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。cut_text = " ".join(jieba.cut(f))wordcloud = WordCloud(# 设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的font_path="C:/Windows/Fonts/simfang.ttf",background_color="white",# mask参数=图片背景,必须要写上,另外有mask参数再设定宽高是无效的mask=background_image).generate(cut_text)# 生成颜色值image_colors = ImageColorGenerator(background_image)# 下面代码表示显示图片plt.imshow(wordcloud.recolor(color_func=image_colors), interpolation="bilinear")plt.axis("off")plt.show()if __name__ == '__main__':GetWordCloud()
运行后:
如果有不懂的朋友可以直接在公众号上加我的微信,希望对大家有所帮助!
大家可以关注我的微信公众号:「秦子帅」一个有质量、有态度的公众号!
Python如何生成词云(详解)相关推荐
- python制作中文词云_Python如何生成词云(详解)
前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图: 效果图一: 效果图二: 根据效果图分析的还是比较准确的,小说中的主人公就是"程理" ...
- 拿来就用能的Python词云图代码|wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息.今天,我们就来学习一下Python生成词云 ...
- python中做为词云轮廓的图片,Python如何生成词云图片
很早之前写过一篇怎么利用微博数据制作词云图片出来,之前的写得不完整,而且只能使用自己的数据,现在重新整理了一下,任何的微博数据都可以制作出来,放在今天应该比较应景. 一年一度的虐汪节,是继续蹲在角落默 ...
- python制作词云时出现figure1 figure2_用Python生成词云
词云是一种数据可视化技术,用于表示文本数据,其中每个单词的大小表示其出现的频率或重要性. 可以使用词云突出显示重要的文本数据点. 词云被广泛用于分析来自社交网络网站的数据. 为了在Python中生成词 ...
- python生成的词云没有图案_Python如何生成词云的方法
这篇文章主要介绍了关于Python如何生成词云的方法,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先 ...
- python程序创建词云 中国地图_就这么简单!使用Python生成漂亮的词云
原标题:就这么简单!使用Python生成漂亮的词云 作者:Linux迷 链接:https://www.linuxmi.com 词云是一种数据可视化技术,用于表示文本数据,其中每个单词的大小表示其出现的 ...
- python怎样安装词云库_python词云库wordcloud的使用方法与实例详解
wordcloud是优秀的词云展示第三方库 一.基本使用 import jieba import wordcloud txt = open("1.txt", "r&quo ...
- python 词云_利用Python生成词云
利用Python生成词云 一.第三方库的安装与介绍 1.1 Python第三方库jieba(中文分词) 1.介绍 "结巴"中文分词:做最好的 Python 中文分词组件. 2.特 ...
- Hadoop3.0基础平台搭建(三节点),以及案例运行并使用python生成词云
一.设备配置列表,软件包 二.主机名映射 三.生成密钥 四.将密钥发送到各个节点 五.注意事项及验证 六.关闭防火墙和SeLinux安全模块(所有主机均需操作 七.解压JDK.hadoop包,设置Ja ...
最新文章
- Unity3D提示“XX,some are mac os x (unix) and some are windows”
- java中日期的数据类型是啥_用于存储日期和时间的最合适的SQL和Java数据类型
- mvc中signalr实现一对一的聊天
- kettle 数据转换
- 在线 Sql Server 服务无法启动的解决办法
- 什么意思呢_technician是什么意思
- x265-确定slice type-2
- windows7 系统优化大技巧
- C# 实现系统关机、注销、重启、休眠、挂起
- 匿名内部类使用外面的类为什么要用final型
- 初步熟悉RHEL 8
- FPGA学习笔记-IP核-FIFO
- 视频“云、边、端”全流程支持H.265,意味着更低的流量成本与更高的视频质量,计算压力都在边缘侧
- 安装darknet报libQt5Core.so.5: undefined reference
- 美国主机中的RAID磁盘是什么意思?
- Java成长第五集--面向对象设计的五大原则
- 如何判断用户输入的邮箱格式是否正确?
- 解决Unable to open debugger port错误
- poi在word输出复选框windows远程突然不能复制的解决方法
- 【学习笔记】山东大学生物信息学-05 高通量测序技术介绍 + 06 统计基础与序列算法(原理)
热门文章
- Java——字符串类实验
- 避免骚扰用户?硅谷这样打造移动推送通知!
- 【沃顿商学院学习笔记】商业基础——Financing:04通货膨胀 Inflation
- 专科计算机学生比211强,别再瞧不起专科!一所211大学,专科专业的“就业率”远高于本科...
- leetcode常见经典算法面试题及答案汇总
- 数据结构概述(逻辑结构与存储结构概念详解)
- 现在入电商创业有点晚了,不行了
- Android 打包混淆
- 系统迁移服务器上,系统迁移到云服务器上
- TINYINT, SMALLINT, MEDIUMINT, INT, and BIGINT类型的显示宽度不显示