本文主要介绍用wordcloud库制作《唐诗三百首》的词云图的方法,以及注意点。
根据北京理工大学嵩天老师《Python语言程序设计》课程的代码做了部分修改。

主要思路
  • 读取《唐诗三百首》文件
  • 使用jieba库分词,使用wordcloud库生成词云图
  • 输出词云图
import os
from imageio import imread
import jieba
import wordcloud
d = os.getcwd()
#读取文件
f = open(os.path.join(d,'唐诗三百首.txt'),'r',encoding = 'utf-8') #这里可以直接输入路径,就不需要使用os.path.join()了,下面同理
t = f.read()
f.close()
#jieba分词
ls = jieba.lcut(t)
txt = ' '.join(ls)
#生成词云
mask = imread(os.path.join(d,'dufu.jpg')) #设置蒙版图形
w = wordcloud.WordCloud( width = 1000, height = 700,\background_color = "white",font_path = "msyh.ttc", mask = mask)
w.generate(txt)
#词云图输出
w.to_file(os.path.join(d,'tangshi2.png')) 

生成的词云图效果如下

从中可以看出,唐诗三百首出现次数较多的诗人有杜甫、王维、李白、孟浩然等;而较常出现的词有万里、不见、何处、明月、故人、芙蓉、青山、相思、琵琶等。

注意点

模板图形的读入:最初使用的是代码是from scipy.misc import imread ,但是运行之后报错,如下:

DeprecationWarning: imread is deprecated!
imread is deprecated in SciPy 1.0.0, and will be removed in 1.2.0.
Use imageio.imread instead.

所以,改用imageio库的imread指令。
欢迎指正交流~

wordcloud库应用-《唐诗三百首》词云图详解相关推荐

  1. 用Python画出好看的词云图(详解)

    相信很多人在第一眼看到下面这些图时,都会被其牛逼的视觉效果所吸引,下面我就带领大家一起来学习怎么用Python画出这种图. 前期准备 上面的这种图叫做词云图,主要用途是将文本数据中出现频率较高的关键词 ...

  2. python唐诗分析综合_Python利器之胎教《唐诗三百首》文本分析

    事情是这样的,你们听我讲: 有一天,孕妈妈在家庭群里对准爸爸说,在某猫上买本<唐诗三百首>吧,每天给宝宝读一首唐诗,作为胎教.有图有真相: 作为好吃懒做的准爸爸,听到这个消息的瞬间,表情是 ...

  3. python+jieba分析唐诗三百首

    python+jieba分析唐诗三百首 代码及源文件地址:poem_300 代码保证符合命名规范.遵循PEP8规则.导包顺序清晰.尽量做到复用性和不罗嗦 记得修改文件路径哟(^U^)ノ~YO 如果有帮 ...

  4. 【Pygame小游戏】史上最全:《唐诗三百首》合集,每一首都是精华,果断收藏~(学诗+锻炼记忆+Python诗句填空小程序上线啦)

    前言   岁岁年龄岁岁心,不负时光不负卿 哈喽!我是你们的栗子同学,今天给大家来点儿有趣的-- 有句话说:"读史使人明智,读诗使人灵秀."唐诗本来就是中国文化的绚丽瑰宝,是每个人都 ...

  5. 《唐诗三百首》中的童年记录

    这是学习笔记的第 2192 篇文章 读完需要 9 分钟 速读仅需7分钟 唐诗三百首在最近读了几遍,你可能不了解的<唐诗三百首>,看了下<诗词大会>发现真是人才济济.一方面是词穷 ...

  6. 你可能不了解的《唐诗三百首》

    这是学习笔记的第 2189 篇文章 读完需要 9 分钟 速读仅需3分钟 对于唐诗,自己其实是一种复杂的心情,好像会背些,但是用的时候却都想不起.<唐诗三百首>算是重温古诗的一种方式,借着让 ...

  7. python爬取唐诗三百首

    python讨论qq群:996113038 导语: 最近一直在写爬虫,写过一些爬取"妹子图","小视频"之类的爬虫,但是我想了想.咱们公众号虽然是个技术类公众号 ...

  8. 唐诗三百首出现最多的字是什么?大数据分析告诉你

    一个人要是长时间一直做一件事,思维容易固化. 就像那些从太空回来的宇航员,吃饭时容易丢开拿在手里的勺子.当勺子掉在地上时,哦,我已经回到地球了^_^. 所以,适当尝试新鲜事物,既是对大脑的放松,也是开 ...

  9. 使用maven构建一个基于Java的spark应用程序用于统计唐诗三百首中各汉字出现的次数

    目的:统计唐诗三百首全集每个汉字出现的次数 软件需求: 下载 Eclipse ,安装Maven 安装好JDK1.8 下载并配置了hadoop-2.7.3     spark-2.2.0-bin-had ...

  10. 唐诗三百首微电影合集(300集)

    诗词是最美的语言,是迷醉心怀的智慧.古典诗词,寥寥数语,却四两拨千斤,字字千锤百炼,就这么几个字,或勾勒出恢弘清雅的画卷,或传递出幽咽情愫.苍茫之志.以下是我们推荐给大家的古诗词微电影合集,大家可以收 ...

最新文章

  1. [APB VNext 笔记] UI
  2. 产品策略研究期的数据分析与挖掘
  3. how does SAP UI5 filter for list work in xml view
  4. 华东理工计算机与金融专业,2019年华东理工大学各专业录取分数线
  5. 《C和指针》——宏中容易出现的错误
  6. 温故而知新 js 的错误处理机制
  7. python中str是什么_Python中str字符串的功能介绍
  8. 向虚拟机发短信(android SMS 调试)
  9. 统计学习导论_统计学习导论 | 读书笔记15 | 广义可加模型
  10. ubuntu18.04 server配置静态ip
  11. linux命令查bin中所有变量名,Linux--文件查找命令
  12. linux的shell命令
  13. 使用hMailServer邮箱服务器收发邮件
  14. 冒险岛历代版本科普(干货)-琳琳冒险岛
  15. 好多网友都不知道怎么阅读Linux内核源码,这篇让你快速理解
  16. 运维基本功(六):Linux用户管理与远程管理
  17. php机房图形资产管理系统,机房资产管理系统(CMDB)
  18. Typora Emoji图标
  19. 利用viewbag把数据对象传到前端并转换成json对象,及解决json字符串被转义问题
  20. 网页视频播放php拉伸代码,网页在线播放mp4/flv等格式视频方法,CuPlayer(酷播)详细使用方法(附源代码)...

热门文章

  1. opencv-图片识别参考代码
  2. 20162327WJH 实验三 《敏捷开发与XP实践》 实验报告
  3. 样条函数--spline
  4. [C#]Excel画斜线以及Excel宏的利用
  5. antd 踩坑之 javascriptEnabled配置
  6. agent实现apm上报
  7. Excel中输入整数却总是显示小数,如何调整?
  8. Instrument初识
  9. 2018天梯赛第一次训练题解和ac代码
  10. 周末C语言基础学习小结