三种实现词云图的方式

需要用到的第三方库 - matplotlib,jieba,wordcloud

import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud

1.词频统计实现词云图

data={‘a’:20,‘b’:30,‘c’:15,‘d’:22,‘e’:50}
词频统计确保数据是字典格式
如果数据不是字典格式,设法弄成字典格式就好

如果文本是中文的,需要设置字体,不然会乱码

font=r'C:\Windows\Fonts\simfang.ttf'
wc = wordcloud.WordCloud( background_color='white',  # 设置背景色,默认为黑色font_path=font,#字体路径设置width=500,  # 设置背景宽height=350,  # 设置背景高max_font_size=50,  # 最大字体min_font_size=10,  # 最小字体mode='RGBA'  # 当参数为“RGBA”并且background_color不为空时,背景为透明
)

绘图

wc.generate_from_frequencies(data)
wc.to_file(r"d.png")  # 保存绘制好的词云图

2.一段文字实现词云图

给出一段文本

text='祥子来自农村,是个破产的青年农民,勤劳、纯朴、善良,保留着农村哺育他、教养他的一切,却再也不愿意回农村去了。从农村来到城市的祥子,渴望以' \'自己的诚实劳动买一辆属于自己的车。做个独立的劳动者是祥子的志愿、希望、甚至是宗教,凭着勤劳和坚忍,他用三年的时间省吃俭用,终于实现了理想,成为自食其' \'力的上等车夫。但刚拉半年,车就在兵荒马乱中被逃兵掳走,祥子失去了洋车,只牵回三匹骆驼。祥子没有灰心,他依然倔强地从头开始,更加克己地拉车攒钱。' \'可是,还没有等他再买上车,所有的积蓄又被侦探敲诈、洗劫一空,买车的梦想再次成泡影。'

先使用jieba库进行分词操作,后再画词云图

cut_text=jieba.cut(text)
result=" ".join(cut_text

如果文本是中文的,需要设置字体,不然会乱码

font=r'C:\Windows\Fonts\simfang.ttf'
wc=WordCloud(background_color='white',  # 设置背景色,默认为黑色font_path=font, #指定文字路径width=500,  # 设置背景宽height=350,  # 设置背景高max_font_size=50,  # 最大字体min_font_size=10,  # 最小字体mode='RGBA'  # 当参数为“RGBA”并且background_color不为空时,背景为透明
)

绘图

wc.generate(result)  # 根据分词后的文本产生词云
wc.to_file(r"wordcloud.png")  # 保存绘制好的词云图
plt.imshow(wc)  # 以图片的形式显示词云
plt.axis("off")  # 关闭图像坐标系,即不显示坐标系
plt.show()  # plt.imshow()函数负责对图像进行处理,并显示其格式,但是不能显示。其后必须有plt.show()才能显示

3.自定义词云图样式

背景图片需使用透明背景(有条件可以ps抠图

这里另外需要导入的库是numpy,PIL

from PIL import Image
import numpy as np

设置自定义背景

mask = np.array(Image.open("t.png"))

绘图

f = open('data.txt',encoding='utf-8')
txt = f.read()
f.close()wc=WordCloud(background_color="white", \width=400, \height=300,\max_words=200, \max_font_size=80, \mask=mask, \contour_width=3, \contour_color='steelblue'
)
wc.generate(txt)  # 根据分词后的文本产生词云
wc.to_file(r"data词云图.png")  # 保存绘制好的词云图
plt.imshow(wc)  # 以图片的形式显示词云
plt.axis("off")  # 关闭图像坐标系,即不显示坐标系
plt.show()  # plt.imshow()函数负责对图像进行处理,并显示其格式,但是不能显示。其后必须有plt.show()才能显示

效果如下:

Python实现词云图的3种方式(词频,一段文本,自定义样式)相关推荐

  1. Python生成词云图,TIIDF方法文本挖掘: 词频统计,词云图

    python中使用wordcloud包生成的词云图. 下面来介绍一下wordcloud包的基本用法. class wordcloud.WordCloud(font_path=None, width=4 ...

  2. python中文词云图代码_python词云图与中文分词

    2019-12-12中文文本分词和词云图具体功能介绍与学习代码: import jieba a="由于中文文本的单词不是通过空格或者标点符号来进行分割" #jieba.lcut() ...

  3. echarts的词云图表类型有哪些_词云图的几种制作方法评测,你pick哪款

    前言 大家好,不知道大家会在什么场合使用词云图,对我来说词云图的优点除了它可以展示大量文本数据.从而让读者快速抓住重点,更重要的是词云图好看啊所以今天给大家分享几种词云图的制作方法.首先我们来思考一下 ...

  4. python生成词云图

    所谓一张图胜过千言万语, 在信息爆炸时代,一张形象生动的信息图往往要比一篇深度长文章更容易赢得眼球和青睐,万能的python怎么会少了这种工具呢,wordcloud是python的一个词云生成库,只需 ...

  5. python使用什么作为转义字符-详解用Python处理HTML转义字符的5种方式

    写爬虫是一个发送请求,提取数据,清洗数据,存储数据的过程.在这个过程中,不同的数据源返回的数据格式各不相同,有 JSON 格式,有 XML 文档,不过大部分还是 HTML 文档,HTML 经常会混杂有 ...

  6. python实现词云图

    python实现词云图 import matplotlib.pyplot as plt import jieba from wordcloud import WordCloud,ImageColorG ...

  7. Python调用API接口的几种方式

    本文主要介绍python中调用API的几种方式,下面是python中会用到的库. 1.urllib2 import urllib2, urllib github_url = 'https://api. ...

  8. 用Python读取CSV文件的5种方式

    典型的数据集stocks.csv: 一个股票的数据集,其实就是常见的表格数据.有股票代码,价格,日期,时间,价格变动和成交量.这个数据集其实就是一个表格数据,有自己的头部和身体. 第一招:简单的读取 ...

  9. 运用java爬虫和python做词云图

    前言: 最近有点时间,就写个东西玩玩,就是分析电影评论做成词云图.这次没有采用python去爬取电影评论,而是采用了java中的多线程和线程池去爬取电影评论,但是用评论做词云图使用python写的.如 ...

  10. Python实现微信支付(三种方式)

    Python实现微信支付(三种方式) 微信.支付宝二维码聚合SDK下载 点我下载 关注公众号"轻松学编程"了解更多. 如果需要python SDk源码,可以加我微信[1257309 ...

最新文章

  1. nginx之 nginx-1.9.7 编译安装、理论简介
  2. 超全Python IDE武器库大总结,优缺点一目了然!
  3. 关于:为什么在 Real Producer 10 Plus 里面找不到 RealAudio 10 with aacPlus的解答
  4. SliverLight注册字典转换器方法
  5. 面试题整理17 输入一个字符串判断一个字符串是否是有效ip地址
  6. android系统特效详解和修改方法
  7. JAVA a --; 与 -- a;
  8. Spring Boot、Spring Cloud、Dubbo的区别
  9. java8 Optional源码
  10. dede tags.php漏洞,织梦dedecms安全漏洞之/include/common.inc.php漏洞解决办法
  11. android 多线程类,Android 多线程处理之多线程用法大集合
  12. 封装批量获取键值对数据的方法
  13. mysql锁表语句,Java核心知识点
  14. 美国签证过不了,ICLR 2020搬到埃塞俄比亚,同性恋学者:不去,保命要紧
  15. Android截图功能
  16. python获取网页数据判断并提交_python3爬虫无法通过网页内容判断存在与否?
  17. OpenCV的图像分类基础知识
  18. 四大名著红楼梦第二回 贾夫人仙逝扬州城 冷子兴演说荣国府
  19. 计算机一黑屏就显示当前账户已锁定,电脑黑屏用户已锁定账户怎么办?
  20. 运行进入计算机服务,电脑怎么进入运行命令

热门文章

  1. 安吉丽娜-朱莉曝光罕见少女照(图)
  2. Jira配置LDAP实现统一认证
  3. 【验证码识别】OpenCV挑战顶象滑动拼图验证码
  4. 带经纬度的水印相机_经纬度生成小工具(仿水印相机)
  5. 淄博市区地图最新版_淄博地图全图高清版下载|
  6. Cadence学习之路:寻找优秀的封装资源以及3D封装设置
  7. 格雷码详解(分治法)
  8. 高频功率放大器的设计实现
  9. anaconda 完全卸载——重装
  10. LM358电压跟随器