作者:沂水寒城,CSDN博客专家,个人研究方向:机器学习、深度学习、NLP、CV

Blog: http://yishuihancheng.blog.csdn.net

词云是一种非常漂亮的可视化展示方式,正所谓一图胜过千言万语,词云在之前的项目中我也有过很多的使用,可能对于我来说,一种很好的自我介绍方式就是词云吧,就像下面这样的:

个人觉还是会比枯燥的文字语言描述性的介绍会更吸引人一点吧。

今天不是说要怎么用词云来做个人介绍,而是对工作中使用到比较多的词云计较做了一下总结,主要是包括三个方面:

1、诸如上面的简单形式矩形词云

2、基于背景图片数据来构建词云数据

3、某些场景下不想使用类似上面的默认的字体颜色,这里可以自定义词云的字体颜色

接下来对上面三种类型的词云可视化方法进行demo实现与展示,具体如下,这里我们使用到的测试数据如下:

The Zen of Python, by Tim PetersBeautiful is better than ugly.Explicit is better than implicit.Simple is better than complex.Complex is better than complicated.Flat is better than nested.Sparse is better than dense.Readability counts.Special cases aren't special enough to break the rules.Although practicality beats purity.Errors should never pass silently.Unless explicitly silenced.In the face of ambiguity, refuse the temptation to guess.There should be one-- and preferably text one --obvious way to do it.Although that way may not be obvious at first unless you're Dutch.Now is better than never.Although never is often better than *right* now.If the implementation is hard to explain, it's a bad idea.If the implementation is easy to explain, it may be a good idea.Namespaces are one honking great idea -- let's do more of those!

1、简单形式矩形词云实现如下:

def simpleWC1(sep=' ',back='black',freDictpath='data_fre.json',savepath='res.png'):'''词云可视化Demo'''try:with open(freDictpath) as f:data=f.readlines()data_list=[one.strip().split(sep) for one in data if one]fre_dict={}for one_list in data_list:fre_dict[unicode(one_list[0])]=int(one_list[1])except:fre_dict=freDictpathwc=WordCloud(font_path='font/simhei.ttf',#设置字体  #simheibackground_color=back, #背景颜色max_words=1300,# 词云显示的最大词数max_font_size=120, #字体最大值margin=3,  #词云图边距width=1800,  #词云图宽度height=800,  #词云图高度random_state=42)wc.generate_from_frequencies(fre_dict)  #从词频字典生成词云plt.figure()  plt.imshow(wc)plt.axis("off")wc.to_file(savepath)

图像数据结果如下:

2、 基于背景图像数据的词云可视化具体实现如下:

先贴一下背景图像:

这也是一个比较经典的图像数据了,下面来看具体的实现:

def simpleWC2(sep=' ',back='black',backPic='a.png',freDictpath='data_fre.json',savepath='res.png'):'''词云可视化Demo【使用背景图片】'''try:with open(freDictpath) as f:data=f.readlines()data_list=[one.strip().split(sep) for one in data if one]fre_dict={}for one_list in data_list:fre_dict[unicode(one_list[0])]=int(one_list[1])except:fre_dict=freDictpathback_coloring=imread(backPic)wc=WordCloud(font_path='simhei.ttf',#设置字体  #simheibackground_color=back,max_words=1300,mask=back_coloring,#设置背景图片max_font_size=120, #字体最大值margin=3,width=1800,height=800,random_state=42,)wc.generate_from_frequencies(fre_dict)  #从词频字典生成词云wc.to_file(savepath)

结果图像数据如下:

3、 自定义词云字体颜色的具体实现如下:

#自定义颜色列表
color_list=['#CD853F','#DC143C','#00FF7F','#FF6347','#8B008B','#00FFFF','#0000FF','#8B0000','#FF8C00','#1E90FF','#00FF00','#FFD700','#008080','#008B8B','#8A2BE2','#228B22','#FA8072','#808080']def simpleWC3(sep=' ',back='black',freDictpath='data_fre.json',savepath='res.png'):'''词云可视化Demo【自定义字体的颜色】'''#基于自定义颜色表构建colormap对象colormap=colors.ListedColormap(color_list)  try:with open(freDictpath) as f:data=f.readlines()data_list=[one.strip().split(sep) for one in data if one]fre_dict={}for one_list in data_list:fre_dict[unicode(one_list[0])]=int(one_list[1])except:fre_dict=freDictpathwc=WordCloud(font_path='font/simhei.ttf',#设置字体  #simheibackground_color=back,  #背景颜色max_words=1300,  #词云显示的最大词数max_font_size=120,  #字体最大值colormap=colormap,  #自定义构建colormap对象margin=2,width=1800,height=800,random_state=42,prefer_horizontal=0.5)  #无法水平放置就垂直放置wc.generate_from_frequencies(fre_dict)plt.figure()  plt.imshow(wc)plt.axis("off")wc.to_file(savepath)

结果图像数据如下:

上述三种方法就是我在具体工作中使用频度最高的三种词云可视化展示方法了,下面贴出来完整的代码实现,可以直接拿去跑的:

#!usr/bin/env python
#encoding:utf-8
from __future__ import division'''
__Author__:沂水寒城
功能: 词云的可视化模块
'''import os
import sys
import json
import numpy as np
from PIL import Image
from scipy.misc import imread
from matplotlib import colors
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDSreload(sys)
sys.setdefaultencoding('utf-8')#自定义颜色列表
color_list=['#CD853F','#DC143C','#00FF7F','#FF6347','#8B008B','#00FFFF','#0000FF','#8B0000','#FF8C00','#1E90FF','#00FF00','#FFD700','#008080','#008B8B','#8A2BE2','#228B22','#FA8072','#808080']def simpleWC1(sep=' ',back='black',freDictpath='data_fre.json',savepath='res.png'):'''词云可视化Demo'''try:with open(freDictpath) as f:data=f.readlines()data_list=[one.strip().split(sep) for one in data if one]fre_dict={}for one_list in data_list:fre_dict[unicode(one_list[0])]=int(one_list[1])except:fre_dict=freDictpathwc=WordCloud(font_path='font/simhei.ttf',#设置字体  #simheibackground_color=back, #背景颜色max_words=1300,# 词云显示的最大词数max_font_size=120, #字体最大值margin=3,  #词云图边距width=1800,  #词云图宽度height=800,  #词云图高度random_state=42)wc.generate_from_frequencies(fre_dict)  #从词频字典生成词云plt.figure()  plt.imshow(wc)plt.axis("off")wc.to_file(savepath)def simpleWC2(sep=' ',back='black',backPic='a.png',freDictpath='data_fre.json',savepath='res.png'):'''词云可视化Demo【使用背景图片】'''try:with open(freDictpath) as f:data=f.readlines()data_list=[one.strip().split(sep) for one in data if one]fre_dict={}for one_list in data_list:fre_dict[unicode(one_list[0])]=int(one_list[1])except:fre_dict=freDictpathback_coloring=imread(backPic)wc=WordCloud(font_path='simhei.ttf',#设置字体  #simheibackground_color=back,max_words=1300,mask=back_coloring,#设置背景图片max_font_size=120, #字体最大值margin=3,width=1800,height=800,random_state=42,)wc.generate_from_frequencies(fre_dict)  #从词频字典生成词云wc.to_file(savepath)def simpleWC3(sep=' ',back='black',freDictpath='data_fre.json',savepath='res.png'):'''词云可视化Demo【自定义字体的颜色】'''#基于自定义颜色表构建colormap对象colormap=colors.ListedColormap(color_list)  try:with open(freDictpath) as f:data=f.readlines()data_list=[one.strip().split(sep) for one in data if one]fre_dict={}for one_list in data_list:fre_dict[unicode(one_list[0])]=int(one_list[1])except:fre_dict=freDictpathwc=WordCloud(font_path='font/simhei.ttf',#设置字体  #simheibackground_color=back,  #背景颜色max_words=1300,  #词云显示的最大词数max_font_size=120,  #字体最大值colormap=colormap,  #自定义构建colormap对象margin=2,width=1800,height=800,random_state=42,prefer_horizontal=0.5)  #无法水平放置就垂直放置wc.generate_from_frequencies(fre_dict)plt.figure()  plt.imshow(wc)plt.axis("off")wc.to_file(savepath)if __name__ == '__main__':text="""The Zen of Python, by Tim PetersBeautiful is better than ugly.Explicit is better than implicit.Simple is better than complex.Complex is better than complicated.Flat is better than nested.Sparse is better than dense.Readability counts.Special cases aren't special enough to break the rules.Although practicality beats purity.Errors should never pass silently.Unless explicitly silenced.In the face of ambiguity, refuse the temptation to guess.There should be one-- and preferably text one --obvious way to do it.Although that way may not be obvious at first unless you're Dutch.Now is better than never.Although never is often better than *right* now.If the implementation is hard to explain, it's a bad idea.If the implementation is easy to explain, it may be a good idea.Namespaces are one honking great idea -- let's do more of those!"""word_list=text.split()fre_dict={}for one in word_list:if one in fre_dict:fre_dict[one]+=1else:fre_dict[one]=1simpleWC1(sep=' ',back='black',freDictpath=fre_dict,savepath='simpleWC1.png')simpleWC2(sep=' ',back='black',backPic='backPic/A.png',freDictpath=fre_dict,savepath='simpleWC2.png')simpleWC3(sep=' ',back='black',freDictpath=fre_dict,savepath='simpleWC3.png')

赞 赏 作 者

Python中文社区作为一个去中心化的全球技术社区,以成为全球20万Python中文开发者的精神部落为愿景,目前覆盖各大主流媒体和协作平台,与阿里、腾讯、百度、微软、亚马逊、开源中国、CSDN等业界知名公司和技术社区建立了广泛的联系,拥有来自十多个国家和地区数万名登记会员,会员来自以工信部、清华大学、北京大学、北京邮电大学、中国人民银行、中科院、中金、华为、BAT、谷歌、微软等为代表的政府机关、科研单位、金融机构以及海内外知名公司,全平台近20万开发者关注。

投稿点击阅读原文      喜欢文章,点个在看

用 Python 实现词云可视化相关推荐

  1. 下c语言实现wc_用 Python 实现词云可视化

    词云是一种非常漂亮的可视化展示方式,正所谓一图胜过千言万语,词云在之前的项目中我也有过很多的使用,可能对于我来说,一种很好的自我介绍方式就是词云吧,就像下面这样的: 个人觉还是会比枯燥的文字语言描述性 ...

  2. 用Python做词云可视化带你分析海贼王、火影和死神三大经典动漫

    对于动漫爱好者来说,海贼王.火影.死神三大动漫神作你肯定肯定不陌生了.小编身边很多的同事仍然深爱着这些经典神作,可见"中毒"至深.今天小编利用Python大法带大家分析一下这些神作 ...

  3. 使用python生成词云——聆心云心理健康服务平台数据可视分析和可视化

    实验题目:聆心云心理健康服务平台数据可视分析和可视化 实验目的和要求:统计出在聆心云平台做沙盘游戏的次数.根据各次沙盘游戏所使用的沙具和进行的操作数据进行词云可视化,掌握Python词云制作方法 实验 ...

  4. Python大佬用词云可视化带你分析海贼王、火影和死神三大经典动漫

    对于动漫爱好者来说,海贼王.火影.死神三大动漫神作你肯定肯定不陌生了.小编身边很多的同事仍然深爱着这些经典神作,可见"中毒"至深.利用Python大法带大家分析一下这些神作,看看这 ...

  5. 词云可视化:四行Python代码轻松上手到精通

    词云可视化:四行Python代码轻松上手到精通 文章目录 词云可视化:四行Python代码轻松上手到精通 本课概要 关于本课程 `粉丝答疑交流QQ群:953712961` `微信赞赏码` 不需要写代码 ...

  6. 数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化...

    全文下载链接:http://tecdat.cn/?p=28877 作者:Yunfan Zhang Twitter是一家美国社交网络及微博客服务的网站,致力于服务公众对话.迄今为止,Twitter的日活 ...

  7. 一步一步教你如何用python做词云_一步一步教你如何用Python做词云

    前言 在大数据时代,你竟然会在网上看到的词云,例如这样的. 看到之后你是什么感觉?想不想自己做一个? 如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流 ...

  8. D3临摹作业_分词与词云可视化(西安交大国家艺术基金数据可视化培训第28天)

    第十二章  分词与词云可视化 第一节 词云图 概念:一种富文本信息可视化技术,通过布局算法用文字大小表示词频,辅以多种颜色,直观的反映词组重要性差异,展示文本关键摘要信息.完整的词云分析包括:分词.词 ...

  9. wordcloud词云可视化

    安装: pip install wordcloud(有时会有VC++ 14缺失的问题) 解决方案: 在github下载wordcloud的包(https://github.com/amueller/w ...

  10. 文本数据的词云可视化

    1.使用python实现文本数据的词云可视化,阐述词云原理,数据源可以自行选定: 2.实现文本数据的one-hot编码.Bag-of-word模型,将过程阐述清楚,数据源可以自行选定: 词云可视化 随 ...

最新文章

  1. 10、kubernetes 核心技术-Secret、ConfigMap
  2. 【 NLS 】Gauss-Netwon algorithm Iteration Procedure of TOA - Based Positioning
  3. ZLMS教学管理平台系统V1.2.0最新版本发布,支持纯Web视频直播点播,还带运营在线支付功能!完全免费提供!...
  4. 2016,成为更好的自己
  5. 如何在WPF中通过XAML代码创建菜单项
  6. OpenGL编程指南10:组合运动示例1—创建太阳系模型
  7. 测试原理_OTDR测试原理及注意事项
  8. http协议知识msdn
  9. sketch 将动图转换为json_UI设计师如何创建sketch设计样式、库和UI套件
  10. 树莓派3代linux,树莓派 3B 入门 ARMv8 Arch Linux
  11. SCO UNIX环境下自动增加网关的两种方法
  12. php学生管理系统整理
  13. pdf论文中visio画的图出现Times New Roman 字体未嵌入
  14. Mac终端find命令的使用
  15. 反射、注解、字节码、类加载机制
  16. C语言全局变量和局部变量的范围以及区别
  17. OpenWrt 18.06.1的ss-redir, 以及在乐视超4 X40上看Youtube
  18. IP-SAN存储技术
  19. Qt 动态添加控件,并删除指定控件
  20. 端傳媒 android客户端,知乎安卓客户端交互设计分析!

热门文章

  1. 网管、桌面运维、技术支持 有出路吗
  2. 栅格化渲染源码解析-neural_renderer源码(三)栅格化
  3. .frm mysql_mysqlfrm使用
  4. 计算机网络 网络层 私网地址和公网地址及子网划分
  5. HC05蓝牙模块 修改密码 返回 ERROR:(1D)解决办法
  6. Springboot引入hibernate配置自动建表并进行增删改查
  7. 微信公众号网页OAuth2.0授权自动登录(Java版)
  8. 工欲善其事,必先利其器-器
  9. https://juejin.im/post/5ae081aaf265da0b767d263a
  10. 简易计算机电路,适合新手使用的5款超简单电路图制作软件