python词云词频分析_Python词云(词频统计,掩膜显示)
Python2.7 anaconda。安装Wordcloud,网上有许多下载路径,说一下掩模,就是在这个膜的区域才会有东西,当然这个与实际的掩模还有一定区别,这个词频显示是把所有统计的词,显示在这个掩模图片的非白色区域。
(接下来就不用看着网上那些小软件很羡慕,其实代码就十行左右,你也可以)
from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
# 获取当前文件路径
# __file__ 为当前文件, 在ide中运行此行会报错,可改为
# d = path.dirname('.')
d = path.dirname(__file__)
#
text = open(path.join(d, 't.txt')).read()
# 设置背景图片,也就是掩膜图像,在非白色部分我们的统计好的词频会显示在这里
alice_coloring = imread(path.join(d, "b.jpg"))
wc = WordCloud(background_color="white", #背景颜色
#max_words=2000,# 词云显示的最大词数
mask=alice_coloring,#设置背景图片
stopwords=STOPWORDS.add("said"),
max_font_size=60, #字体最大值
random_state=50)
#上述函数设计了词云格式
# 生成词云, 可以用generate输入全部文本(中文不好分词),也可以我们计算好词频后使用generate_from_frequencies函数
wc.generate(text)
#文本词频统计函数,本函数自动统计词的个数,以字典形式内部存储,在显示的时候词频大的,字体也大
# 从背景图片生成颜色值
image_colors = ImageColorGenerator(alice_coloring)
# 以下代码显示图片
plt.figure()
# recolor wordcloud and show
# we could also give color_func=image_colors directly in the constructor
plt.imshow(wc.recolor(color_func=image_colors))
plt.axis("off")
# 绘制背景图片为颜色的图片
示例图像,文本分词是直接用的英文(网上随便粘贴一篇英文文章),它是以空格进行分词的。如果是中文也可以用网上推荐的分词器,或者你是做数据分析的,当然就知道怎么分词了。
bra................嘿嘿嘿
图片背景色为白色,分清图片背景,和掩模,和掩模背景色(函数默认的是白色区域)
词频分析,数据分析挖掘。
以后再PPT中也可以用啦!!!!!!!!!!!!!!!!!
python词云词频分析_Python词云(词频统计,掩膜显示)相关推荐
- python歌词分析_Python 词云分析周杰伦新歌《说好不哭》
周杰伦难得出新歌 ,最近终于推出了单曲<说好不哭>,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 今天过年 看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢 ...
- python微博评论情感分析_Python采集微博热评进行情感分析祝你狗年脱单
Ps: 重要的事情说三遍!!! 结尾有彩蛋,结尾有彩蛋,结尾有彩蛋. 如果自己需要爬(cai)虫(ji)的数据量比较大,为了防止被网站封Ip,可以分时段爬取,另外对于爬到的数据一般是用来存储数据库,这 ...
- python单词词频字典_Python字典使用--词频统计的GUI实现
字典是针对非序列集合而提供的一种数据类型,字典中的数据是无序排列的. 字典的操作 为字典增加一项 dict[key] = value students = {"Z004":&quo ...
- python数据获取与文本分析_python文本分析之处理和理解文本
前言: 在进行自然语言的建模(NLP)时,我们通常难以处理文字类型的数据,因此在常见的机器学习项目中,数据的格式是结构化的,就算在视觉处理的时候也是一个矩阵或者高维张量的形式.那么文字类型的数据我们应 ...
- 医药行业上云难点分析,医药云解决方案
中国要实现从"医药大国"走向"医药强国"的转变,除了需要国家政策的支持,医药企业自身的信息化升级也非常重要,而互联网+.大数据.人工智能等新兴技术的应用成为其中 ...
- python温度转换代码分析_Python温度转换实例分析
本文主要研究的是Python语言实现温度转换的相关实例,具体如下. 代码如下: #TempConvert.py val=input("请输入带有温度表示符号的温度值(例如:32c)" ...
- python如何做敏感度分析_Python中的模型敏感度分析(使用Salib)
敏感度分析的基础概念 文本主要参考了维基百科(对其中的关键部分进行了摘选了翻译):https://en.wikipedia.org/wiki/Sensitivity_analysisen.wikip ...
- python实验报告实验总结_Python词云制作实验报告
实验题目:n Python 词云制作实验报告 实验目的与要求: 础 掌握基础 Python 安装过程和词云制作. 实验步骤: n Python 安装 1.击 双击 Anaconda2-4.0.0-Wi ...
- python词云下载什么_python词云安装什么库
python词云需要安装wordcloud库. 安装方法: 在cmd使用pip install wordcloud命令即可安装. wordcloud库把词云当作一个WordCloud对象:wordcl ...
- python词云代码手机_Python词云入门——十行代码即可领取爱豆!
快来领取你的爱豆哇! 词云图大家应该不会陌生,即是由词汇组成类似云的彩色图形. 今天Henry带领大家一起学习用Python自带的词云库--wordcloud在十行代码内绘制出精美的词云图! 首先放一 ...
最新文章
- 给定一个 n X n 的矩阵 和 R,求旋转 90 X R 度以后的矩阵
- TVP两周年:携手同行,让未来可见
- LeetCode 327. 区间和的个数(multiset二分查找/归并排序)
- PyTorch 1.0 中文文档:torch.onnx
- 计算机发展初期 承载信息的媒体,兰州大学《多媒体技术基础》18秋平时作业3(含答案)...
- 有哪些开源C ++静态分析工具? [关闭]
- 算法工程师常用Linux命令总结
- mysql 查询用户权限
- 前端网页字体优化指南
- html5在线拍照,h5调用html5拍照上传功能
- 闲置台式机+文件服务器,闲置主机秒变家用NAS,让你的闲置电脑变存储中心
- 数据分析常用数据来源及报告网站记录
- 挑战大数据 金仓助力三农自助支付系统
- python中的关系运算符可以连续室友_在Python中,关系运算符可以连续使用,例如135等价于13 and 35。...
- 占豪--2010年的市场机会在哪里(兼谈股指期货与楼市)
- 卷积神经网络的网络结构——VGGNet
- 移动echarts地图省份名称的位置
- 写一个matlab程序,自己写的第一个matlab程序
- wxpython 事件驱动
- HTML-HyperText Markup Language