wordcloud是优秀的词云展示第三方库

一、基本使用

import jieba

import wordcloud

txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)

txt_1 = " ".join(words)

# print(txt1)

w = wordcloud.WordCloud(font_path="msyh.ttc",

width=1000, height=700, background_color="white",

)

w.generate(txt_1)

w.to_file("ciyun.png")

二、按图片形状生成

import jieba

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

import numpy as np

from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)

txt_1 = " ".join(words)

photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))

# from scipy.misc import imread

# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",

mask=photo,

background_color="white",

)

w.generate(txt_1)

w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数

作用

font_path

字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'

width

输出的画布宽度,默认为400像素

height

输出的画布高度,默认为200像素

prefer_horizontal

词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )

mask

如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image

scale

按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍

min_font_size

显示的最小的字体大小

font_step

字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差

max_words

要显示的词的最大个数

stopwords

设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS

background_color

背景颜色,如background_color=‘white',背景颜色为白色

max_font_size

显示的最大的字体大小

mode

当参数为“RGBA”并且background_color不为空时,背景为透明

relative_scaling

词频和字体大小的关联性

color_func

生成新颜色的函数,如果为空,则使用 self.color_func

regexp

使用正则表达式分隔输入的文本

collocations

是否包括两个词的搭配

colormap

给每个单词随机分配颜色,若指定color_func,则忽略该方法

random_state

为每个单词返回一个PIL颜色

其他部分函数

函数

作用

fit_words(frequencies)

根据词频生成词云

generate(text)

根据文本生成词云

generate_from_frequencies(frequencies[, …])

根据词频生成词云

generate_from_text(text)

根据文本生成词云

process_text(text)

将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )

recolor([random_state, color_func, colormap])

对现有输出重新着色。重新上色会比重新生成整个词云快很多

to_array()

转化为 numpy array

to_file(filename)

输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

python怎样安装词云库_python词云库wordcloud的使用方法与实例详解相关推荐

  1. python定义函数的组成部分有_Python学习笔记之函数的定义和作用域实例详解

    本文实例讲述了Python函数的定义和作用域.分享给大家供大家参考,具体如下: 定义函数 默认参数: 可以向函数中添加默认参数,以便为在函数调用中未指定的参数提供默认值 # 如果调用 cylinder ...

  2. python类是实例的工厂_Python设计模式之工厂方法模式实例详解

    本文实例讲述了Python设计模式之工厂方法模式.分享给大家供大家参考,具体如下: 工厂方法模式(Factory Method Pattern):定义一个用于创建对象的接口,让子类决定实例化哪一个类, ...

  3. python网上批量下载表格_python爬虫智能翻页批量下载文件的实例详解

    python爬虫遇到爬取文件内容时,需要一页页的翻页爬取,这样很是麻烦,其实可以获取每个列表信息下的文件名和文件链接,让文件名和文件链接处理为列表,保存后下载,实现智能翻页批量下载文件,本文以以京客隆 ...

  4. python调用qq识别图片文字_Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解...

    百度OCR体验地址: 腾讯OCR体验地址: 测试结果是:腾讯的效果要比百度的好 腾讯云目前额度是: 每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月 百度接口调用之前写过文 ...

  5. python中字符串切片取奇数_Python中的字符串切片(截取字符串)的详解

    Python中的字符串切片(截取字符串)的详解 字符串索引示意图 字符串切片也就是截取字符串,取子串 Python中字符串切片方法 字符串[开始索引:结束索引:步长] 切取字符串为开始索引到结束索引- ...

  6. python中iloc的详细用法_python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片)...

    df是一个dataframe,列名为A B C D 具体值如下: A B C D 0 ss 小红 8 1 aa 小明 d 4 f f 6 ak 小紫 7 dataframe里的属性是不定的,空值默认为 ...

  7. python交互式和文件式区别_Python 运行.py文件和交互式运行代码的区别详解

    代码版本:3.6.3 1. 交互式运行代码会直接给出表达式的结果,运行代码文件必须print才能在控制台看到结果. 直接给出结果: 没有print是看不到结果的: 有print才能看到结果: 另:交互 ...

  8. python定义链表节点_Python数据结构与算法之链表定义与用法实例详解【单链表、循环链表】...

    本文实例讲述了Python数据结构与算法之链表定义与用法.分享给大家供大家参考,具体如下: 本文将为大家讲解: (1)从链表节点的定义开始,以类的方式,面向对象的思想进行链表的设计 (2)链表类插入和 ...

  9. python守护多线程_Python多线程Threading、子线程与守护线程实例详解

    线程Threading: python中多线程需要使用threading模块 线程的创建与运行: 1.直接调用threading的Thread类: 线程的创建:线程对象=thread.Thread(t ...

最新文章

  1. 在Java中调用Python
  2. httplib 和 httplib2区别之 gzip解压
  3. 刷新纪录 | 74.7 秒训练完 ImageNet!2048 GPU 暴力出奇迹
  4. python3 xlrd包的用法
  5. CSS代码属性大全(HTML)
  6. java 接口 单元测试_java单元测试之如何实现异步接口的测试案例
  7. python库手册(官方)python文档
  8. 简单C语言程序的编写,c语言编写简单程序.doc
  9. 解决SpringBoot项目jar包启动慢
  10. Python IDLE编写代码 输入反斜杠\显示为人民币符号¥
  11. 基于控制的角度无人机集群——避障(有源代码)
  12. 计量经济学笔记5-Eviews操作-异方差的检验与消除(White检验与加权最小二乘)
  13. TRS_WCM(拓尔思信息技术有限公司)内容协作平台平台置标经验攻略
  14. Office 彻底卸载
  15. 陕西科技大学计算机专业课表,陕西科技大学教务管理系统入口:http://jwc.www.sust.edu.cn/...
  16. 【洛谷P3258】松鼠的新家
  17. 出口欧盟万圣节cosplay服装CE认证办理标准
  18. 44个Java编码规范与常用知识点
  19. 2019寒假集训新生考试
  20. 在线客服系统是一种网页版即时通讯软件的统称

热门文章

  1. 前端学习-css(一)
  2. 安装 RabbitMQ
  3. windows下使用DOS命令删除大文件
  4. 【转】linux /centos 中OpenSSL升级方法详解
  5. android自定义样式大全:shape,selector,layer-list,style,动画全部内容
  6. Redis可以做哪些事儿?
  7. 使用Python将字符串转换为格式化的日期时间字符串
  8. navicat连接PostgreSQL报:column “rolcatupdate” does not exist ...错误的解决办法
  9. (转)shiro权限框架详解06-shiro与web项目整合(下)
  10. 《Scikit-Learn与TensorFlow机器学习实用指南》第5章 支持向量机