利用python制作词云图保姆及教程

前言

一、环境配置

1.要有python的运行环境

2.需要导入jieba ,wordcloud等模块

pip install jieba
pip install wordcloud

注意:有时候导入模块可能会出错,我们可以换一个镜像网站进行安装

pip install 安装包名字  -i http://pypi.doubanio.com/simple/ --trusted-host pypi.doubanio.com

3.准备一个用于分析的文章(此处使用(边城.txt))

4.准备一个停用词表(如哈工大的停用词表,或百度的停用词表等,通常我们不提倡自己建一个停用词表)

5.准备一张背景图片模板


二、具体步骤

1.导入模块

from wordcloud import WordCloud,ImageColorGenerator
import jieba
from PIL import Image
import matplotlib.pyplot as plt
import numpy as np

2.读取分析文档

with open(r"F:\词云图\边城.txt","r",encoding="utf-8") as f:file = f.read()
print(file)

3.对文本进行分词

data_cut = jieba.lcut(file,cut_all=False)  #使用精确模式进行分词
print(data_cut)

4.创建一个stop_word列表,读取停用词文档,将停用词添加到列表中

stop_word = []
with open(r"F:\词云图\stopwords.txt","r",encoding="utf-8") as f:for line in f:if len(line)>0:stop_word.append(line.strip())   #进行追加时将字符串前后的空格去掉
print(stop_word)

5.新建一个列表,用于存放将分析文档库与停用词库对比后去除停用词的字符串

data_result = []
for i in data_cut:if i not in stop_word:data_result.append(i)
print(data_result)

6.将去掉停用词后的列表使用空格将其中的元素连接起来,并将其中的\n替换为空格

text = " ".join(data_result).replace("\n"," ")
print(text)

7.基于TextRank提取关键词

text_new = " ".join(jieba.analyse.textrank(text,topK=100,withWeight=False))
print(text_new)

8.导入模板图片

background = Image.open(r"F:\词云图\biancheng.png")
images = np.array(background)

9.设置WordCloud的相关参数,并生成词云

wc = WordCloud(font_path=r"F:\词云图\SIMLI.TTF",background_color="white",mask=images,max_words=4000,contour_width=3,contour_color="black")
wc.generate(text_new)

10.设置显示的字体

#改变字体颜色,构造ImageColorGenerator对象
img_colors=ImageColorGenerator(images)
#字体颜色为背景图片的颜色
wc.recolor(color_func=img_colors)

11.显示词云图,并保存

#显示词图云
plt.imshow(wc)
#取消坐标
plt.axis("off")
plt.show()
wc.to_file(r"F:\词云图\biancheng.png")

经过以上操作后我们可以得到一张biancheng.png词云图如下:

下面分享制作的其他词云图,欢迎大家交流学习!


利用python制作词云图,分词,提取关键词相关推荐

  1. 数据可视化之利用Python制作词云图

    制作词云图 一.词云图介绍 二.wordcloud方法 二. stylecloud方法 一.词云图介绍 词云图可以看作是文本数据的视觉表示,由词汇组成类似云的彩色图形.相对其它诸多用来显示数值数据的图 ...

  2. e分钟带你利用Python制作词云图

    随着大数据时代的来临,数据分析与可视化,显得越来越重要,今天给小伙伴们带来一种最常见的数据可视化图形-词云图的制作方法. 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语 ...

  3. plt图片输出 python_利用Python制作词云,wordcloud神器你值得拥有

    相信许多人都看到过下面这样的词云图,词云图是一种很好的可视化工具,其作用主要是为了文本数据的视觉表示,既酷炫又能突出重点. 关于词云图的制作,网上能够搜集到很多的教程,许多都是利用了专用的工具,这些工 ...

  4. 对爬取的电影《唐人街探案3》豆瓣短评做文本分析,并利用stylecloud制作词云图

    上一节,我们爬取了豆瓣上电影<唐人街探案3>的评论,并将评论保存成了txt文档,爬虫过程可参考:爬取某瓣上电影<唐人街探案3>的评论 本节,我们将对电影短评做文本分析,并利用s ...

  5. 利用python制作漂亮的词云图_利用python制作词云,wordcloud神器你值得拥有

    相信许多人都看到过下面这样的词云图,词云图是一种很好的可视化工具,其作用主要是为了文本数据的视觉表示,既酷炫又能突出重点. 关于词云图的制作,网上能够搜集到很多的教程,许多都是利用了专用的工具,这些工 ...

  6. Python制作词云图根据蒙板图像确定形状和文字颜色

    问题描述:制作词云图,根据蒙板图像确定词云图形状,根据蒙板图像中像素的颜色确定词云图中相同位置上文字的颜色. 阅读原文

  7. python制作词云图设置停用词,Python生成词云图

    代码如下: from os import path from wordcloud import WordCloud import matplotlib matplotlib.use('TkAgg') ...

  8. python制作词云图设置停用词,python词云图之WordCloud

    1. 导入需要的包package importmatplotlib.pyplot as pltfrom scipy.misc importimreadfrom wordcloud importWord ...

  9. 关键词分词工具_快图制作工具 | 如何制作词云图?

    点击蓝字关注我们 如何制作词云图?    首先,我们需要对"词云"有个简单的概念. "词云"这个概念最先由美国西北大学新闻学副教授.新媒体专业主任里奇·戈登(R ...

最新文章

  1. PDD 笔试反思记录
  2. 一片哗然!ICLR 2020被曝47%的审稿人没发过相关论文
  3. VisualStudioCode插件下载
  4. 动态匹配路由的基本用法||路由组件传递参数
  5. MongoDB删除数据
  6. python序列类型有_Python序列类型
  7. Nginx服务的信号控制
  8. Could not find a suitable table factory for ‘org.apache.flink.table.factories.TableSinkFactory‘
  9. qt调用opencv汇总(2)
  10. wxPython:登录工具
  11. 信息学奥赛一本通 1159:斐波那契数列
  12. 你知道大数据强大在哪里!!!你永远也不会猜到
  13. json string 格式_Retrofit同时解析JSON和XML数据格式
  14. springMVC整合mybatis 项目遇到问题总结
  15. 富士施乐 DocuCentre S2011 打印机驱动安装方法
  16. 中国象棋棋谱棋书链接
  17. vue 下载文档乱码
  18. 关于springcloud中eureka报错com.sun.jersey.api.client.ClientHandlerException: java.net.ConnectException:
  19. 老板面试怎么谈?千万不要走近误区。
  20. C#excelpackage读写Excel文件

热门文章

  1. 浅谈Joomla!流行模板的修改方法
  2. Android聊天室背景,安卓实现类似QQ刚换聊天背景的功能
  3. 摄影师必带三脚架的六个原因
  4. 期刊第11期 | 愿意连上7天的班拿加班费吗?
  5. 折腾Java设计模式之观察者模式
  6. 【web3实践 | 以太坊开发框架Truffle使用】
  7. Aanconda 启动jupyter失败?Anaconda启动一闪一闪?
  8. 为什么要使用多线程技术
  9. Cydia sub-process /usr/libexec/cydia/cydo 报错 100
  10. 3.通过powercfg查看电源报告