Python2.7 anaconda。安装Wordcloud,网上有许多下载路径,说一下掩模,就是在这个膜的区域才会有东西,当然这个与实际的掩模还有一定区别,这个词频显示是把所有统计的词,显示在这个掩模图片的非白色区域。

(接下来就不用看着网上那些小软件很羡慕,其实代码就十行左右,你也可以)

from os import path

from scipy.misc import imread

import matplotlib.pyplot as plt

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

# 获取当前文件路径

# __file__ 为当前文件, 在ide中运行此行会报错,可改为

# d = path.dirname('.')

d = path.dirname(__file__)

#

text = open(path.join(d, 't.txt')).read()

# 设置背景图片,也就是掩膜图像,在非白色部分我们的统计好的词频会显示在这里

alice_coloring = imread(path.join(d, "b.jpg"))

wc = WordCloud(background_color="white", #背景颜色

#max_words=2000,# 词云显示的最大词数

mask=alice_coloring,#设置背景图片

stopwords=STOPWORDS.add("said"),

max_font_size=60, #字体最大值

random_state=50)

#上述函数设计了词云格式

# 生成词云, 可以用generate输入全部文本(中文不好分词),也可以我们计算好词频后使用generate_from_frequencies函数

wc.generate(text)

#文本词频统计函数,本函数自动统计词的个数,以字典形式内部存储,在显示的时候词频大的,字体也大

# 从背景图片生成颜色值

image_colors = ImageColorGenerator(alice_coloring)

# 以下代码显示图片

plt.figure()

# recolor wordcloud and show

# we could also give color_func=image_colors directly in the constructor

plt.imshow(wc.recolor(color_func=image_colors))

plt.axis("off")

# 绘制背景图片为颜色的图片

示例图像,文本分词是直接用的英文(网上随便粘贴一篇英文文章),它是以空格进行分词的。如果是中文也可以用网上推荐的分词器,或者你是做数据分析的,当然就知道怎么分词了。

bra................嘿嘿嘿

图片背景色为白色,分清图片背景,和掩模,和掩模背景色(函数默认的是白色区域)

词频分析,数据分析挖掘。

以后再PPT中也可以用啦!!!!!!!!!!!!!!!!!

python词云词频分析_Python词云(词频统计,掩膜显示)相关推荐

  1. python歌词分析_Python 词云分析周杰伦新歌《说好不哭》

    周杰伦难得出新歌 ,最近终于推出了单曲<说好不哭>,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 今天过年 看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢 ...

  2. python微博评论情感分析_Python采集微博热评进行情感分析祝你狗年脱单

    Ps: 重要的事情说三遍!!! 结尾有彩蛋,结尾有彩蛋,结尾有彩蛋. 如果自己需要爬(cai)虫(ji)的数据量比较大,为了防止被网站封Ip,可以分时段爬取,另外对于爬到的数据一般是用来存储数据库,这 ...

  3. python单词词频字典_Python字典使用--词频统计的GUI实现

    字典是针对非序列集合而提供的一种数据类型,字典中的数据是无序排列的. 字典的操作 为字典增加一项 dict[key] = value students = {"Z004":&quo ...

  4. python数据获取与文本分析_python文本分析之处理和理解文本

    前言: 在进行自然语言的建模(NLP)时,我们通常难以处理文字类型的数据,因此在常见的机器学习项目中,数据的格式是结构化的,就算在视觉处理的时候也是一个矩阵或者高维张量的形式.那么文字类型的数据我们应 ...

  5. 医药行业上云难点分析,医药云解决方案

    中国要实现从"医药大国"走向"医药强国"的转变,除了需要国家政策的支持,医药企业自身的信息化升级也非常重要,而互联网+.大数据.人工智能等新兴技术的应用成为其中 ...

  6. python温度转换代码分析_Python温度转换实例分析

    本文主要研究的是Python语言实现温度转换的相关实例,具体如下. 代码如下: #TempConvert.py val=input("请输入带有温度表示符号的温度值(例如:32c)" ...

  7. python如何做敏感度分析_Python中的模型敏感度分析(使用Salib)

    敏感度分析的基础概念 文本主要参考了维基百科(对其中的关键部分进行了摘选了翻译):https://en.wikipedia.org/wiki/Sensitivity_analysis​en.wikip ...

  8. python实验报告实验总结_Python词云制作实验报告

    实验题目:n Python 词云制作实验报告 实验目的与要求: 础 掌握基础 Python 安装过程和词云制作. 实验步骤: n Python 安装 1.击 双击 Anaconda2-4.0.0-Wi ...

  9. python词云下载什么_python词云安装什么库

    python词云需要安装wordcloud库. 安装方法: 在cmd使用pip install wordcloud命令即可安装. wordcloud库把词云当作一个WordCloud对象:wordcl ...

  10. python词云代码手机_Python词云入门——十行代码即可领取爱豆!

    快来领取你的爱豆哇! 词云图大家应该不会陌生,即是由词汇组成类似云的彩色图形. 今天Henry带领大家一起学习用Python自带的词云库--wordcloud在十行代码内绘制出精美的词云图! 首先放一 ...

最新文章

  1. 给定一个 n X n 的矩阵 和 R,求旋转 90 X R 度以后的矩阵
  2. TVP两周年:携手同行,让未来可见
  3. LeetCode 327. 区间和的个数(multiset二分查找/归并排序)
  4. PyTorch 1.0 中文文档:torch.onnx
  5. 计算机发展初期 承载信息的媒体,兰州大学《多媒体技术基础》18秋平时作业3(含答案)...
  6. 有哪些开源C ++静态分析工具? [关闭]
  7. 算法工程师常用Linux命令总结
  8. mysql 查询用户权限
  9. 前端网页字体优化指南
  10. html5在线拍照,h5调用html5拍照上传功能
  11. 闲置台式机+文件服务器,闲置主机秒变家用NAS,让你的闲置电脑变存储中心
  12. 数据分析常用数据来源及报告网站记录
  13. 挑战大数据 金仓助力三农自助支付系统
  14. python中的关系运算符可以连续室友_在Python中,关系运算符可以连续使用,例如135等价于13 and 35。...
  15. 占豪--2010年的市场机会在哪里(兼谈股指期货与楼市)
  16. 卷积神经网络的网络结构——VGGNet
  17. 移动echarts地图省份名称的位置
  18. 写一个matlab程序,自己写的第一个matlab程序
  19. wxpython 事件驱动
  20. HTML-HyperText Markup Language

热门文章

  1. win10电源设置选项无效--高级电源选项
  2. 新闻分类(文本分类)
  3. 计算机绘画社团活动教案,电脑绘画社团教案
  4. 【田间连着车间、佘太酒业这十年!
  5. CND的定义,原理和好处和CDN回源
  6. 工行银企互联接入详解(1)--流程说明
  7. python实战因子分析和主成分分析
  8. 网络安全等级保护拓扑图大全
  9. Marr-Hildreth边缘检测器C++实现
  10. 从零实现一个3D目标检测算法(1):3D目标检测概述