python怎样安装词云库_python词云库wordcloud的使用方法与实例详解
wordcloud是优秀的词云展示第三方库
一、基本使用
import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()
words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
width=1000, height=700, background_color="white",
)
w.generate(txt_1)
w.to_file("ciyun.png")
二、按图片形状生成
import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image
txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()
words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片
w = WordCloud(font_path="msyh.ttc",
mask=photo,
background_color="white",
)
w.generate(txt_1)
w.to_file("ciyun.png")
三、WordCloud参数详解
from wordcloud import WordCloud
参数
作用
font_path
字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width
输出的画布宽度,默认为400像素
height
输出的画布高度,默认为200像素
prefer_horizontal
词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask
如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale
按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size
显示的最小的字体大小
font_step
字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words
要显示的词的最大个数
stopwords
设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color
背景颜色,如background_color=‘white',背景颜色为白色
max_font_size
显示的最大的字体大小
mode
当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling
词频和字体大小的关联性
color_func
生成新颜色的函数,如果为空,则使用 self.color_func
regexp
使用正则表达式分隔输入的文本
collocations
是否包括两个词的搭配
colormap
给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state
为每个单词返回一个PIL颜色
其他部分函数
函数
作用
fit_words(frequencies)
根据词频生成词云
generate(text)
根据文本生成词云
generate_from_frequencies(frequencies[, …])
根据词频生成词云
generate_from_text(text)
根据文本生成词云
process_text(text)
将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap])
对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array()
转化为 numpy array
to_file(filename)
输出到文件
更多关于python词云库wordcloud的使用方法请查看下面的相关文章
python怎样安装词云库_python词云库wordcloud的使用方法与实例详解相关推荐
- python定义函数的组成部分有_Python学习笔记之函数的定义和作用域实例详解
本文实例讲述了Python函数的定义和作用域.分享给大家供大家参考,具体如下: 定义函数 默认参数: 可以向函数中添加默认参数,以便为在函数调用中未指定的参数提供默认值 # 如果调用 cylinder ...
- python类是实例的工厂_Python设计模式之工厂方法模式实例详解
本文实例讲述了Python设计模式之工厂方法模式.分享给大家供大家参考,具体如下: 工厂方法模式(Factory Method Pattern):定义一个用于创建对象的接口,让子类决定实例化哪一个类, ...
- python网上批量下载表格_python爬虫智能翻页批量下载文件的实例详解
python爬虫遇到爬取文件内容时,需要一页页的翻页爬取,这样很是麻烦,其实可以获取每个列表信息下的文件名和文件链接,让文件名和文件链接处理为列表,保存后下载,实现智能翻页批量下载文件,本文以以京客隆 ...
- python调用qq识别图片文字_Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解...
百度OCR体验地址: 腾讯OCR体验地址: 测试结果是:腾讯的效果要比百度的好 腾讯云目前额度是: 每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月 百度接口调用之前写过文 ...
- python中字符串切片取奇数_Python中的字符串切片(截取字符串)的详解
Python中的字符串切片(截取字符串)的详解 字符串索引示意图 字符串切片也就是截取字符串,取子串 Python中字符串切片方法 字符串[开始索引:结束索引:步长] 切取字符串为开始索引到结束索引- ...
- python中iloc的详细用法_python选取特定列 pandas iloc,loc,icol的使用详解(列切片及行切片)...
df是一个dataframe,列名为A B C D 具体值如下: A B C D 0 ss 小红 8 1 aa 小明 d 4 f f 6 ak 小紫 7 dataframe里的属性是不定的,空值默认为 ...
- python交互式和文件式区别_Python 运行.py文件和交互式运行代码的区别详解
代码版本:3.6.3 1. 交互式运行代码会直接给出表达式的结果,运行代码文件必须print才能在控制台看到结果. 直接给出结果: 没有print是看不到结果的: 有print才能看到结果: 另:交互 ...
- python定义链表节点_Python数据结构与算法之链表定义与用法实例详解【单链表、循环链表】...
本文实例讲述了Python数据结构与算法之链表定义与用法.分享给大家供大家参考,具体如下: 本文将为大家讲解: (1)从链表节点的定义开始,以类的方式,面向对象的思想进行链表的设计 (2)链表类插入和 ...
- python守护多线程_Python多线程Threading、子线程与守护线程实例详解
线程Threading: python中多线程需要使用threading模块 线程的创建与运行: 1.直接调用threading的Thread类: 线程的创建:线程对象=thread.Thread(t ...
最新文章
- 在Java中调用Python
- httplib 和 httplib2区别之 gzip解压
- 刷新纪录 | 74.7 秒训练完 ImageNet!2048 GPU 暴力出奇迹
- python3 xlrd包的用法
- CSS代码属性大全(HTML)
- java 接口 单元测试_java单元测试之如何实现异步接口的测试案例
- python库手册(官方)python文档
- 简单C语言程序的编写,c语言编写简单程序.doc
- 解决SpringBoot项目jar包启动慢
- Python IDLE编写代码 输入反斜杠\显示为人民币符号¥
- 基于控制的角度无人机集群——避障(有源代码)
- 计量经济学笔记5-Eviews操作-异方差的检验与消除(White检验与加权最小二乘)
- TRS_WCM(拓尔思信息技术有限公司)内容协作平台平台置标经验攻略
- Office 彻底卸载
- 陕西科技大学计算机专业课表,陕西科技大学教务管理系统入口:http://jwc.www.sust.edu.cn/...
- 【洛谷P3258】松鼠的新家
- 出口欧盟万圣节cosplay服装CE认证办理标准
- 44个Java编码规范与常用知识点
- 2019寒假集训新生考试
- 在线客服系统是一种网页版即时通讯软件的统称
热门文章
- 前端学习-css(一)
- 安装 RabbitMQ
- windows下使用DOS命令删除大文件
- 【转】linux /centos 中OpenSSL升级方法详解
- android自定义样式大全:shape,selector,layer-list,style,动画全部内容
- Redis可以做哪些事儿?
- 使用Python将字符串转换为格式化的日期时间字符串
- navicat连接PostgreSQL报:column “rolcatupdate” does not exist ...错误的解决办法
- (转)shiro权限框架详解06-shiro与web项目整合(下)
- 《Scikit-Learn与TensorFlow机器学习实用指南》第5章 支持向量机