wordcloud库的常规方法及词云绘制实例
对一文本wordclound.txt
进行词云绘制
import jieba
import wordcloud
f = open("wordcloudeg.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path = "msyh.ttc",width=1000,height=700,\background_color="white")
w.generate(txt)
w.to_file("gewordclound.png")
wordloud库常规方法
生成词云对象:w = wordcloud.WordCloud()
方法 | 描述 |
---|---|
w.generate(txt) | 向wordcloud对象w中加载文本txt |
w.to_file(filename) | 将词云输出为图像文件,.png或.jpg格式 |
词云绘制步骤
生成词云对象,配置对象参数
加载词云文本
输出词云文件
配置对象参数
w = wordcloud.WordCloud(<参数>)
参数 | 描述 |
---|---|
width | 指定词云对象生成图片的宽度,默认400像素 |
height | 指定词云对象生成图片的高度,默认200像素 |
min_font_size | 指定词云中字体的最小字号,默认4号 |
max_font_size | 指定词云中字体的最大字号,根据高度自动调节 |
font_size | 指定词云中字体字号的步进间隔,默认为1 |
font_path | 指定字体文件的路径,默认None |
max_words | 指定词云显示的最大单词数量,默认200 |
stop_words | 指定词云的排除词列表,即不显示的单词列表 |
mask | 指定词云形状,默认为长方形,需要引用imread()函数 |
background_color | 指定词云图片背景颜色,默认为黑色 |
mask用法
from scipy.misc import imread
mk = imread("pic.png") #读取图片效果
w = wordcloud.WordCloud(mask=mk)
wordcloud库的常规方法及词云绘制实例相关推荐
- python词频统计完整步骤_Python中文文本分词、词频统计、词云绘制
本文主要从中文文本分词.词频统计.词云绘制方面介绍Python中文文本分词的使用.会使用到的中文文本处理包包括:wordcloud,jieba,re(正则表达式),collections. 1 准备工 ...
- 机器学习之---文本分析(jieba分词和词云绘制)
一.定义: 文本挖掘:从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程. 二.语料库(Corpus) 语料库是我们要分析的所有文档的集合. import os import os ...
- 【文本挖掘】——词频统计、词云绘制与美化+[微微一笑很倾城]实战
词频统计.词云+实战 一.词频统计: 1.基本概念及原理 2.词频统计方法 二.词云 1.词云绘制工具: 2.python词云绘制--Wordcloud 三.基于分词频数绘制词云 1.利用词频绘制词云 ...
- 关于词云绘制你应该知道什么?
1.原理 词云图是文本数据可视化的一种形式,视觉冲击力较强,迎合现在快节奏的生活,能够让人聚焦主旨,眼前一亮.其原理是对输入的文本数据进行词频统计,根据词汇出现频率的不同,按不同比例显示词汇,生成图片 ...
- 银行间市场评论员文章词云绘制效果
本文以<中国金融>银行间市场金融科技标准化建设一文为原始材料,对该文章做了自定义分词,并统计词频,最后绘制词云.以期通过机器来认识机器思维和人的思维之间存在的一些差异.对<杀死一只知 ...
- python7(文件,join方法,jieba,wordcloud词云绘制)
文章目录 文件 文件类型 文件的打开和关闭 文件内容的读取 利用with语句 数据文件的写入 实例:利用文件绘制轨迹 join方法 一维数据的表示 一维数据的写入处理 二维数据的表示 jieba库 w ...
- r语言上机文本分析与词云绘制_倚天屠龙记的文本分析
<倚天屠龙记>作为金庸先生的经典作品,在无数人心目中留下了深刻的印象,基本上隔一段时间这部经典作品就会被重新拍成电影或者电视剧,可见观众的喜爱程度.虽然本人没有完完全全拜读过先生的这部作品 ...
- 用Python读红楼梦之——一、词云绘制
原文连接 Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦 ...
- 利用结巴和WordCloud进行中文分词及图云绘制入门
摘要:利用结巴分词对文本进行分词,并获取高频的关键词,之后对关键词绘制图云. 语言:python 库:jieba wordcloud python下中文的分词好多人推荐了"结巴" ...
最新文章
- xshell使用命令总结
- 分隔单词和标点符号示例
- Python基础知识(第十一天)
- 成功解决AttributeError: module 'cv2.cv2' has no attribute 'CV_CAP_PROP_FPS'和 'CV_CAP_PROP_FRAME_WIDTH'
- Android App内部自动更新Library的使用(转载)
- 自定义封装 banner 组件
- MMORPG的一份Unity手游性能蓝皮书
- 随想录(形式化验证小结)
- python开发接口故障码_Python代码样例
- 从 Ops 到 NoOps,阿里文娱智能运维的关键:自动化应用容量管理
- snprintf的返回值代表字节数 != 实际写入字节数
- Bailian4003 十六进制转十进制【十六进制】
- ffplay for mfc 代码备忘
- 全国各地车牌代码整理出数据库表,直接生成表
- Linux教学的误区
- web漏洞扫描器原理_黑客秘籍:基于WAF日志的扫描器检测实践
- 凯立德导航 版本号意义解读
- 查询光猫厂家为ZTE,且内存范围在0到100之间,统计去掉重复的loid之后的数量,并计算出内存的avg,max,min,sum
- PID调谐方法:根据开环响应特性调谐(一)
- MVP2006成都聚会图片