用Python搞出自己的云词图 | 【带你装起来】
作者:AI算法与图像处理
参考:http://www.sohu.com/a/149657007_236714
云词图简介
什么词云
由词汇组成类似云的彩色图形。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
有何作用
1、直观,高大上
2、可装逼,很潇洒
准备工作
1、导入包——jieba和wordcloud
命令:pip install jieba
命令:pip install wordcloud
备注:对于pycharm等可采用各自的方法导入包
2、文本和图片的准备
文本:可爬取网上资料或某歌曲书籍等关键字,亦或是像我是自己手动输入文字并用tab隔开
图片:找自己喜欢的图片,这里我采用乔巴的图片作为背景,而且除了主要人物外,其他背景都为白色,显示效果较好。
采用的文本内容:
采用的图片:
代码展示
# coding: utf-8import jiebafrom wordcloud import WordCloud,STOPWORDSfrom scipy.misc import imread # 处理图像的函数import matplotlib.pyplot as plt
# 读取文本文件text = open('/media/pzw/0E50196C0E50196C/weixin/t1.txt', 'r').read()# 对文本进行分词cut_text = ''.join(jieba.cut(text))# 读取图片color_mask = imread('/media/pzw/0E50196C0E50196C/weixin/qiaoba.jpg')# 生成词云cloud = WordCloud(font_path='G:/py/wc/new_songti.ttc',# 这里是导入字体,因为我是采用英文的,所有不导入也并不影响,若是中文的或者有其他的字符需要自己选择合适的字体包 background_color="white", mask=color_mask, max_words=2000, max_font_size=80)word_cloud = cloud.generate(cut_text)
# 输出图片plt.axis('off')plt.imshow(word_cloud)plt.show()复制代码
效果展示
今天的学习就到这里了,希望大家能点个右下角小小的“好看”
非常感谢哈!!!!
END
用Python搞出自己的云词图 | 【带你装起来】相关推荐
- 基于python的自媒体和官媒数据爬取、可视化分析及云词图制作
创作不易,如果以下内容对你有帮助,别忘了点一个赞,让更多的小伙伴能看到吧~~ 1. 问题描述 为了研究自媒体和官媒的传播新闻<武汉快递小哥汪勇的先进事迹>的及时性和传播力度,对比两种传播途 ...
- 基于python的自媒体和官媒数据爬取、对比可视化分析及云词图提取关键词
创作不易,如果以下内容对你有帮助,别忘了点一个赞,让更多的小伙伴能看到吧~~ 1. 问题描述 为了研究自媒体和官媒的传播新闻<武汉快递小哥汪勇的先进事迹>的及时性和传播力度,对比两种传播途 ...
- r语言各形状编号_R语言,超级英雄云词图,你们要的自定义形状来了
原标题:R语言,超级英雄云词图,你们要的自定义形状来了 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 天善学院sv ...
- jieba库词频统计_用jieba库统计文本词频及云词图的生成
一.安装jieba库 :\>pip install jieba #或者 pip3 install jieba 二.jieba库解析 jieba库主要提供提供分词功能,可以辅助自定义分词词典. j ...
- vue集成Highcharts 云词图
vue集成Highcharts 云词图 最近接手一个需求,需要服务端统计词语,前端出一个云图. 记得很早之前在echarts看到过一个云词图,去翻一下echarts官网没翻到索性去Highcharts ...
- python制作云词图
网上代码很多,主要是用plt模糊的问题 import io import jieba #导入jieba包作为切分词语的工具 from wordcloud import WordCloud #导入wor ...
- python爬虫网易云音乐许巍的漫步制作热门点赞柱状图云词
喜欢许巍的一些歌曲,真实而洒脱,那就爬虫玩会.获取数据用到了requests,绘制柱状图时用到了pyecharts,制作云词用到了wordcloud. 打开网易云音乐,找到许巍的漫步,按F12,让后再 ...
- 【Python绘图小课堂】词云韦恩图(上篇-分词)
数据说明 本案例数据为电影<白蛇传·情>豆瓣短评数据: 其中,评分有:推荐.力荐.还行.较差.很差 五种,我们将推荐与力荐的评论归为"好评",并赋值为1,将其余三种评论 ...
- Python 数据可视化:WordCloud 词云的构建
WordCloud 官方文档:https://amueller.github.io/word_cloud/index.html WordCloud GitHub 地址:https://github.c ...
- 如何使用python实现一个优雅的词云?(超详细)
什么是词云 "词云"就是对网络文本中出现频率较高的"关键词"予以视觉上的突出,形成"关键词云层"或"关键词渲染". 从 ...
最新文章
- 根据身份证号码导出生日和性别(JavaScript代码)
- 如何改变SQL SERVER的身份验证模式
- 温州大学《机器学习》课程代码(四)朴素贝叶斯
- word公式编辑器_论文查重算公式吗 公式怎样避免查重?
- 数据脱敏和加密_Apache ShardingSphere数据脱敏全解决方案详解
- 眼睛-摄像 科技-文学
- [置顶] Oracle数据操作和控制语言详解
- iPhone:你知道这 13 年我是怎么过的吗?
- Collectors.maxBy()和minBy()
- Java 正则表达式,正则表达式匹配a标签下的链接,正则表达式基础
- flex java blazeds 注解_flex java blazeds 注解
- 张涵诚对于税务信息化跨入大数据云计算时代的思考
- linux查看压缩文件的大小,Linux下不解压压缩文件如何直接查看某个文件大小
- linux make命令error2,make命令出错,求解释。
- 深度解析当贝盒子B3、腾讯极光5S、小米盒子4S之间的区别
- My设置密码报错:ERROR 1819 (HY000): Your password does not satisfy the current policy requir
- 奇瑞a3中控按键图解_奇瑞A3空调三个键中间键是如何使用?
- java实现谷歌支付后端验证订单
- 傅老师课堂:Oracle高级应用之解锁表
- 中文java_java中文编程
热门文章
- 苹果手机如何深度清理_苹果手机还可以这样清理垃圾,怪不得用这么久还流畅如丝...
- 闲鱼SPU体系构建的背后
- 合肥工业大学计算机与信息学院复试,合肥工业大学计算机与信息学院2018考研大纲(复试)...
- mac居家办公怎么连接公司内网,用tunnelblick
- 李南江HTML5教程学习心得
- jbX和finss的一些问题
- java 批量文件编码转换 GBK to UTF-8(swing界面)
- Window应急响应(七 NesMiner挖矿病毒)
- 生物信息学基础知识Day4
- 基于STM32的0.96寸OLED显示屏显示数据