对一文本wordclound.txt进行词云绘制

import jieba
import wordcloud
f = open("wordcloudeg.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path = "msyh.ttc",width=1000,height=700,\background_color="white")
w.generate(txt)
w.to_file("gewordclound.png")
wordloud库常规方法

生成词云对象:w = wordcloud.WordCloud()

方法 描述
w.generate(txt) 向wordcloud对象w中加载文本txt
w.to_file(filename) 将词云输出为图像文件,.png或.jpg格式

词云绘制步骤
生成词云对象,配置对象参数
加载词云文本
输出词云文件

配置对象参数
w = wordcloud.WordCloud(<参数>)

参数 描述
width 指定词云对象生成图片的宽度,默认400像素
height 指定词云对象生成图片的高度,默认200像素
min_font_size 指定词云中字体的最小字号,默认4号
max_font_size 指定词云中字体的最大字号,根据高度自动调节
font_size 指定词云中字体字号的步进间隔,默认为1
font_path 指定字体文件的路径,默认None
max_words 指定词云显示的最大单词数量,默认200
stop_words 指定词云的排除词列表,即不显示的单词列表
mask 指定词云形状,默认为长方形,需要引用imread()函数
background_color 指定词云图片背景颜色,默认为黑色

mask用法

from scipy.misc import imread
mk = imread("pic.png")   #读取图片效果
w = wordcloud.WordCloud(mask=mk)

wordcloud库的常规方法及词云绘制实例相关推荐

  1. python词频统计完整步骤_Python中文文本分词、词频统计、词云绘制

    本文主要从中文文本分词.词频统计.词云绘制方面介绍Python中文文本分词的使用.会使用到的中文文本处理包包括:wordcloud,jieba,re(正则表达式),collections. 1 准备工 ...

  2. 机器学习之---文本分析(jieba分词和词云绘制)

    一.定义: 文本挖掘:从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程. 二.语料库(Corpus) 语料库是我们要分析的所有文档的集合. import os import os ...

  3. 【文本挖掘】——词频统计、词云绘制与美化+[微微一笑很倾城]实战

    词频统计.词云+实战 一.词频统计: 1.基本概念及原理 2.词频统计方法 二.词云 1.词云绘制工具: 2.python词云绘制--Wordcloud 三.基于分词频数绘制词云 1.利用词频绘制词云 ...

  4. 关于词云绘制你应该知道什么?

    1.原理 词云图是文本数据可视化的一种形式,视觉冲击力较强,迎合现在快节奏的生活,能够让人聚焦主旨,眼前一亮.其原理是对输入的文本数据进行词频统计,根据词汇出现频率的不同,按不同比例显示词汇,生成图片 ...

  5. 银行间市场评论员文章词云绘制效果

    本文以<中国金融>银行间市场金融科技标准化建设一文为原始材料,对该文章做了自定义分词,并统计词频,最后绘制词云.以期通过机器来认识机器思维和人的思维之间存在的一些差异.对<杀死一只知 ...

  6. python7(文件,join方法,jieba,wordcloud词云绘制)

    文章目录 文件 文件类型 文件的打开和关闭 文件内容的读取 利用with语句 数据文件的写入 实例:利用文件绘制轨迹 join方法 一维数据的表示 一维数据的写入处理 二维数据的表示 jieba库 w ...

  7. r语言上机文本分析与词云绘制_倚天屠龙记的文本分析

    <倚天屠龙记>作为金庸先生的经典作品,在无数人心目中留下了深刻的印象,基本上隔一段时间这部经典作品就会被重新拍成电影或者电视剧,可见观众的喜爱程度.虽然本人没有完完全全拜读过先生的这部作品 ...

  8. 用Python读红楼梦之——一、词云绘制

    原文连接 Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦 ...

  9. 利用结巴和WordCloud进行中文分词及图云绘制入门

    摘要:利用结巴分词对文本进行分词,并获取高频的关键词,之后对关键词绘制图云. 语言:python 库:jieba  wordcloud python下中文的分词好多人推荐了"结巴" ...

最新文章

  1. xshell使用命令总结
  2. 分隔单词和标点符号示例
  3. Python基础知识(第十一天)
  4. 成功解决AttributeError: module 'cv2.cv2' has no attribute 'CV_CAP_PROP_FPS'和 'CV_CAP_PROP_FRAME_WIDTH'
  5. Android App内部自动更新Library的使用(转载)
  6. 自定义封装 banner 组件
  7. MMORPG的一份Unity手游性能蓝皮书
  8. 随想录(形式化验证小结)
  9. python开发接口故障码_Python代码样例
  10. 从 Ops 到 NoOps,阿里文娱智能运维的关键:自动化应用容量管理
  11. snprintf的返回值代表字节数 != 实际写入字节数
  12. Bailian4003 十六进制转十进制【十六进制】
  13. ffplay for mfc 代码备忘
  14. 全国各地车牌代码整理出数据库表,直接生成表
  15. Linux教学的误区
  16. web漏洞扫描器原理_黑客秘籍:基于WAF日志的扫描器检测实践
  17. 凯立德导航 版本号意义解读
  18. 查询光猫厂家为ZTE,且内存范围在0到100之间,统计去掉重复的loid之后的数量,并计算出内存的avg,max,min,sum
  19. PID调谐方法:根据开环响应特性调谐(一)
  20. MVP2006成都聚会图片

热门文章

  1. SSM实现个人博客-day03
  2. ZOJ 1001 A + B Problem
  3. SpringAop @AfterThrowing通知中获取异常信息并且在控制台打印
  4. druid连接池配置数据库密码加密
  5. 开源一些Delphi系统:mp3play
  6. 配置lamp+supervisor
  7. CentOS yum安装MySQL5.7.20
  8. upload总结及一般处理思路步骤
  9. Xcode6的新特性、iPhone6和iPhone6Plus的适配,xcode6iphone6
  10. Java9发布回顾Java 8的十大新特性