wordcloud 是一个python实现的高效词频可视化工具,除了可以使用各种mask和颜色提供个性化的掩膜,还可以通过api便捷的挑战获得个性化的词云输出。
安装pip install wordcloud

wordcloud 包含三个主要api:

  • WordCloud([font_path, width, height, …]) 最重要的函数生成和描绘词云.
  • ImageColorGenerator(image[, default_color]) 通过输入rgb图像获得色彩信息.
  • random_color_func([word, font_size, …]) 随机渲染颜色.

1.简单的小栗子

首先我们需要一篇文本文档来显示,作为例子就copy了纽约时报的一篇报道存为demo.txt,随后使用wordcloud来可视化:

import matplotlib.pyplot as plt  #导入画图包
from wordcloud import WordCloud  #导入wordcloud apitext = open('./demo.txt').read()    #打开刚刚保存的api
wordcloud = WordCloud().generate(text)  #利用text生成词云#显示词云
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()

这时候我们就有一副粗糙的词云图像了,可以看到词云基本上表示了文章的主题:

接下来我们要精炼一下我们的图像,让它变得更漂亮,这就需要详细地了解一下API的信息了。

修改后的词云图:

2.API–wordcloud.WordCloud

class wordcloud.WordCloud(font_path=None,   #可以指定词云的字体
width=400, height=200, margin=2,            #词云长宽
ranks_only=None, prefer_horizontal=0.9,     #水平竖直方向的比例
mask=None, scale=1,                         #mask为词云的掩膜,可由图像突入二值BW图
color_func=None,                            #定义颜色函数,可由ImageColorGenerator定义
max_words=200,                              #最多显示的词数
max_font_size=None,min_font_size=4,
font_step=1,                                #定义最小最大字体及其变化步长
stopwords=None, random_state=None,          #待清除的词
background_color='black',                   #定义背景颜色
mode='RGB',                                 #RGBA时可以使得背景透明
relative_scaling='auto',                    #词频与显示字体的相对大小
regexp=None,                                #输入分词的正则表达式
collocations=True,                          #
colormap=None,
normalize_plurals=True,                     #单复数单词是否看成一致
contour_width=0, contour_color='black',     #边缘设置
repeat=False)                               #小于最大值时是否重复

3.个性化词云

针对api中的设置,我们可以修改刚才的代码来实现更好看的词云:

import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator
import cv2text = open('./demo.txt').read()
mask = cv2.imread('./font/Burdick-Scutoid.jpg')          #读入用于作为mask的图
image_colors = ImageColorGenerator(mask)                 #生成颜色
wc = WordCloud(font_path='./font/CabinSketch-Bold.ttf',  #设置字体,可以从google/font下载background_color='white',          #设置背景颜色mask = mask,colormap='autumn',     #设置掩膜和colormap,会被color_func覆盖#color_func=image_colors,          #设置颜色生成函数#repeat=True,                      contour_width=1, contour_color='gold'  #设置边框)
#字体下载地址:https://github.com/google/fonts/blob/master/ofl/cabinsketch/CabinSketch-Bold.ttf
wc.generate(text)
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.show()

运行后就得到了下面的图啦

4.中文词云

同样我们先准备一份cn.txt的中文文档,保存为utf-8编码:

import io
import jieba                     #导入jieba包作为切分词语的工具
import matplotlib.pyplot as plt  #导入画图包
from wordcloud import WordCloud  #导入wordcloud apitext = io.open('./zh.txt',encoding ='utf-8').read()     #python2中需要利用io.open中的编码功能encoding
cut_str = jieba.cut(text)  #使用Jieba分词进行  -> generator
text = r' '.join(cut_str)  #将分词结果组合为字符串wordcloud = WordCloud(font_path = './font/simhei.ttf',background_color='white',colormap='jet').generate(text)  #利用text生成词云
#必须设定中文字体才能显示  from:http://www.font5.com.cn/font_download.php?id=151&part=1237887120#显示词云
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()


from pexels.com


ref
https://amueller.github.io/word_cloud
https://github.com/amueller/word_cloud
https://blog.csdn.net/fyuanfena/article/details/52038984
http://www.zyy1217.com/
jieba
http://www.cnblogs.com/fonttian/p/9819770.html
https://blog.csdn.net/fontthrone/article/details/72782971
https://blog.csdn.net/sinat_34022298/article/details/75943272
encoding:
https://blog.csdn.net/j2iayu7y/article/details/80193340
http://python.jobbole.com/87145/
http://www.cnblogs.com/fkissx/p/5417363.html

【词云】wordcloud安装与使用相关推荐

  1. python删除中文停用词_python词云 wordcloud+jieba生成中文词云图

    简介 Python+jieba+wordcloud+txt+gif生成动态中文词云 本文基于爬虫爬取某微信号三个月的文章为例,展示了生成中文词云的完整过程.本文需要的两个核心Python类库: jie ...

  2. 在Python中自然语言处理生成词云WordCloud

    了解如何在Python中使用WordCloud对自然语言处理执行探索性数据分析. 最近我们被客户要求撰写关于自然语言处理的研究报告,包括一些图形和统计输出. 什么是WordCloud? 很多时候,您可 ...

  3. 词云wordcloud

    直接pip总是会报错,基本放弃了,还是乖乖下载wheel文件吧 一个超好用的网站,所有的wheel文件都可以找到 https://pypi.org/ wordcloud    词云必须要有的包 用法: ...

  4. python词云 wordcloud+jieba生成中文词云图

    简介 Python+jieba+wordcloud+txt+gif生成动态中文词云 本文基于爬虫爬取某微信号三个月的文章为例,展示了生成中文词云的完整过程.本文需要的两个核心Python类库: jie ...

  5. python词云 wordcloud库详细使用教程

    文章目录 前言 使用wordcloud生成词云的步骤 API参考 实例 从一段文本建立词云 根据蒙版建立词云 从词频建立词云 从图片颜色建立词云 传入中文字体路径解决乱码问题 前言 "词云& ...

  6. Python词云 wordcloud 十五分钟入门与进阶

    整体简介 基于Python的词云生成类库,很好用,而且功能强大.博主个人比较推荐 github:https://github.com/amueller/word_cloud 官方地址:https:// ...

  7. powerbi视觉对象_Power BI 视觉对象词云WordCloud

    我们经常看到各种各样的词云.标签云,有很多网站提供在线制作词云的工具. 向上面这样有形状轮廓的词云,需要专门的网站或是用Python来生成了. 今天说的WordCloud词云只是简单的依据单词.权重生 ...

  8. 词云wordcloud+jieba

    本人的Python词云作业 所需的文件: 2022年政府工作报告.txt Python代码: import jieba import wordcloud import imageio #遮罩with ...

  9. 数据美化 | 更清晰的Python词云wordcloud

    看了前面的词云教程,你可能会有一个疑问.为什么前面生成的词云图片不清晰呢?现在我们就来解决这个问题. 词云的属性 即WordCloud对象的属性: from wordcloud import Word ...

  10. python实验 模块(运用jieba,词云wordcloud)

    笔记. 首先需要下载jieba和wordcloud: win+r打开cmd或者Anaconda Prompt,输入以下代码: pip install jieba pip install wordclo ...

最新文章

  1. centos8编译openssl-1.0.2u、openssl-1.1.1k
  2. ML之GB:GB算法相关论文、相关思路、关键步骤、代码实现、配图集合、案例应用之详细攻略
  3. reg怎样存取注册表信息
  4. 前端将二进制数据流转为文件_前端通过二进制流下载文件
  5. 批量获取远程计算机MAC
  6. python美化输出模块_python日志处理模块
  7. 语言常用c100单词,英语口语练习_夏普新款PW-C100-G电子词典测评_沪江英语
  8. 「深度」详解Uber自动驾驶汽车传感器系统,什么样的配置才能避免撞人事件!...
  9. 电话号码的字母组合---2022/01/23
  10. 下载centOS,下载各种linux版本的镜像,来这里!
  11. (VC++2013)MFC自绘圆形按钮
  12. oracle erp 架构,Oracle ERP (EBS)基础篇-体系架构
  13. 关于图片存储格式的整理(BMP)
  14. 上传文件到服务器指令,上传文件到远程服务器的命令
  15. Java 虚拟机(JVM)原理介绍
  16. Concat和Add操作
  17. 我与我的专业计算机网络作文,我与网络的故事作文600字
  18. e站host地址_台达变频器VFD-E 系列MODBUS-RTU详解
  19. 微信公众号二次开发流程
  20. 高效制作知识库的软件工具,这6个都很不错哦!

热门文章

  1. Spark streaming细粒度工作原理
  2. Hive在linux上的部署
  3. 操作系统(李治军) L9多进程图像-操作系统最重要的图像
  4. SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation要点
  5. vant状态页组件van-empty - 使用篇
  6. 苹果cms V10模板 秘趣响应式高端在线影视视频模板
  7. cad镜像后标注尺寸数字反了_CAD画法大全
  8. QQ注册时间查询非常准确源码程序
  9. FacetWP 筛选与多条件搜索 WordPress插件
  10. 百度SEO站群织梦dedecms自定义多条件筛选插件源码