wordcloud库应用-《唐诗三百首》词云图详解
本文主要介绍用wordcloud库制作《唐诗三百首》的词云图的方法,以及注意点。
根据北京理工大学嵩天老师《Python语言程序设计》课程的代码做了部分修改。
主要思路
- 读取《唐诗三百首》文件
- 使用jieba库分词,使用wordcloud库生成词云图
- 输出词云图
import os
from imageio import imread
import jieba
import wordcloud
d = os.getcwd()
#读取文件
f = open(os.path.join(d,'唐诗三百首.txt'),'r',encoding = 'utf-8') #这里可以直接输入路径,就不需要使用os.path.join()了,下面同理
t = f.read()
f.close()
#jieba分词
ls = jieba.lcut(t)
txt = ' '.join(ls)
#生成词云
mask = imread(os.path.join(d,'dufu.jpg')) #设置蒙版图形
w = wordcloud.WordCloud( width = 1000, height = 700,\background_color = "white",font_path = "msyh.ttc", mask = mask)
w.generate(txt)
#词云图输出
w.to_file(os.path.join(d,'tangshi2.png'))
生成的词云图效果如下
从中可以看出,唐诗三百首出现次数较多的诗人有杜甫、王维、李白、孟浩然等;而较常出现的词有万里、不见、何处、明月、故人、芙蓉、青山、相思、琵琶等。
注意点
模板图形的读入:最初使用的是代码是from scipy.misc import imread
,但是运行之后报错,如下:
DeprecationWarning:
imread
is deprecated!
imread
is deprecated in SciPy 1.0.0, and will be removed in 1.2.0.
Useimageio.imread
instead.
所以,改用imageio库的imread指令。
欢迎指正交流~
wordcloud库应用-《唐诗三百首》词云图详解相关推荐
- 用Python画出好看的词云图(详解)
相信很多人在第一眼看到下面这些图时,都会被其牛逼的视觉效果所吸引,下面我就带领大家一起来学习怎么用Python画出这种图. 前期准备 上面的这种图叫做词云图,主要用途是将文本数据中出现频率较高的关键词 ...
- python唐诗分析综合_Python利器之胎教《唐诗三百首》文本分析
事情是这样的,你们听我讲: 有一天,孕妈妈在家庭群里对准爸爸说,在某猫上买本<唐诗三百首>吧,每天给宝宝读一首唐诗,作为胎教.有图有真相: 作为好吃懒做的准爸爸,听到这个消息的瞬间,表情是 ...
- python+jieba分析唐诗三百首
python+jieba分析唐诗三百首 代码及源文件地址:poem_300 代码保证符合命名规范.遵循PEP8规则.导包顺序清晰.尽量做到复用性和不罗嗦 记得修改文件路径哟(^U^)ノ~YO 如果有帮 ...
- 【Pygame小游戏】史上最全:《唐诗三百首》合集,每一首都是精华,果断收藏~(学诗+锻炼记忆+Python诗句填空小程序上线啦)
前言 岁岁年龄岁岁心,不负时光不负卿 哈喽!我是你们的栗子同学,今天给大家来点儿有趣的-- 有句话说:"读史使人明智,读诗使人灵秀."唐诗本来就是中国文化的绚丽瑰宝,是每个人都 ...
- 《唐诗三百首》中的童年记录
这是学习笔记的第 2192 篇文章 读完需要 9 分钟 速读仅需7分钟 唐诗三百首在最近读了几遍,你可能不了解的<唐诗三百首>,看了下<诗词大会>发现真是人才济济.一方面是词穷 ...
- 你可能不了解的《唐诗三百首》
这是学习笔记的第 2189 篇文章 读完需要 9 分钟 速读仅需3分钟 对于唐诗,自己其实是一种复杂的心情,好像会背些,但是用的时候却都想不起.<唐诗三百首>算是重温古诗的一种方式,借着让 ...
- python爬取唐诗三百首
python讨论qq群:996113038 导语: 最近一直在写爬虫,写过一些爬取"妹子图","小视频"之类的爬虫,但是我想了想.咱们公众号虽然是个技术类公众号 ...
- 唐诗三百首出现最多的字是什么?大数据分析告诉你
一个人要是长时间一直做一件事,思维容易固化. 就像那些从太空回来的宇航员,吃饭时容易丢开拿在手里的勺子.当勺子掉在地上时,哦,我已经回到地球了^_^. 所以,适当尝试新鲜事物,既是对大脑的放松,也是开 ...
- 使用maven构建一个基于Java的spark应用程序用于统计唐诗三百首中各汉字出现的次数
目的:统计唐诗三百首全集每个汉字出现的次数 软件需求: 下载 Eclipse ,安装Maven 安装好JDK1.8 下载并配置了hadoop-2.7.3 spark-2.2.0-bin-had ...
- 唐诗三百首微电影合集(300集)
诗词是最美的语言,是迷醉心怀的智慧.古典诗词,寥寥数语,却四两拨千斤,字字千锤百炼,就这么几个字,或勾勒出恢弘清雅的画卷,或传递出幽咽情愫.苍茫之志.以下是我们推荐给大家的古诗词微电影合集,大家可以收 ...
最新文章
- [APB VNext 笔记] UI
- 产品策略研究期的数据分析与挖掘
- how does SAP UI5 filter for list work in xml view
- 华东理工计算机与金融专业,2019年华东理工大学各专业录取分数线
- 《C和指针》——宏中容易出现的错误
- 温故而知新 js 的错误处理机制
- python中str是什么_Python中str字符串的功能介绍
- 向虚拟机发短信(android SMS 调试)
- 统计学习导论_统计学习导论 | 读书笔记15 | 广义可加模型
- ubuntu18.04 server配置静态ip
- linux命令查bin中所有变量名,Linux--文件查找命令
- linux的shell命令
- 使用hMailServer邮箱服务器收发邮件
- 冒险岛历代版本科普(干货)-琳琳冒险岛
- 好多网友都不知道怎么阅读Linux内核源码,这篇让你快速理解
- 运维基本功(六):Linux用户管理与远程管理
- php机房图形资产管理系统,机房资产管理系统(CMDB)
- Typora Emoji图标
- 利用viewbag把数据对象传到前端并转换成json对象,及解决json字符串被转义问题
- 网页视频播放php拉伸代码,网页在线播放mp4/flv等格式视频方法,CuPlayer(酷播)详细使用方法(附源代码)...