原文连接
咱们书接上回,讲到我们使用Python把红楼梦中的核心词汇给绘画出来了,但是,红楼梦这么唯美的书,给我们乌漆麻黑的搞了一张词云,宝宝们肯定接受不了。
我们先来找照片,这张照片不错,不过还是要处理一下,把背景处理称为白色,这个时候,PS工具可以简单地达到这个效果。
接着,我们就要来写程序了,老规矩,我们先来导入包:
from scipy.misc import imread
import matplotlib.pyplot as plt
from wordcloud import WordCloud, ImageColorGenerator
把图片读取进去,然后重新设置一下WordCloud对象,设置mask为我们的图片。
bimg = imread("D:\\贾宝玉.png")
wordcloud = WordCloud(
background_color="white", 
mask=bimg, font_path='D:\\simhei.ttf'
)
接着,我们就可以美美地绘制词云了。
wordcloud = wordcloud.fit_words(segStat.head(1000).itertuples(index=False))
bimgColors = ImageColorGenerator(bimg)
plt.axis("off")
plt.imshow(wordcloud.recolor(color_func=bimgColors))
plt.show()
长腿欧巴虽然好,但是画起来,很明显我们的词汇分成两大部分了,这样子会分散我们的注意力,因此,我们使用人物作为背景绘制词云的时候,最好只是使用上半身,使用头像就更好了。因此,长腿欧巴拜拜。
bimg = imread("D:\\贾宝玉2.png")
wordcloud = WordCloud(
background_color="white", 
mask=bimg, font_path='D:\\simhei.ttf'
)
wordcloud = wordcloud.fit_words(segStat.head(1000).itertuples(index=False))
bimgColors = ImageColorGenerator(bimg)
plt.axis("off")
plt.imshow(wordcloud.recolor(color_func=bimgColors))
plt.show()
这样子画出来的词云,是不是就唯美了很多了呢?希望你们喜欢,欲知后事如何,欢迎微博关注@大数据分析实战,我们下回再见。

用Python读红楼梦之——二、词云美化相关推荐

  1. python红楼梦词云_用Python读红楼梦之——二、词云美化

    原文链接 咱们书接上回,讲到我们使用Python把红楼梦中的核心词汇给绘画出来了,但是,红楼梦这么唯美的书,给我们乌漆麻黑的搞了一张词云,宝宝们肯定接受不了. 我们先来找照片,这张照片不错,不过还是要 ...

  2. 用Python读红楼梦之——一、词云绘制

    原文连接 Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦 ...

  3. python红楼梦人物词频统计_用Python绘制红楼梦词云图,竟然发现了这个!

    原标题:用Python绘制红楼梦词云图,竟然发现了这个! Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具 ...

  4. python红楼梦_用Python读红楼

    用Python读红楼 最近受到这篇文章用Python读金庸武侠的启发.作为古典文(zhuang)学(bi)青年,一定要用Python来试试我读了20年的<红楼梦>. 首先从网上找到了红楼梦 ...

  5. python红楼梦绘制词云形状图_python数据挖掘实战笔记——文本挖掘(5):词云美化之绘制《红楼梦》词云图...

    词云图的美化就是把词云图的背景和颜色进行美化,以<红楼梦>词云图为例,如下所示: 首先绘制词云,跟之前的代码操作一样: import jieba import numpy import c ...

  6. python分析红楼梦出现的虚词词频统计,python对红楼梦的每一章节进行词频统计

    python对红楼梦的每一章节进行词频统计 python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r" ...

  7. python对红楼梦的每一章节进行词频统计

    python对红楼梦的每一章节进行词频统计 import jieba f=open("G:\\红楼梦.txt","r",encoding="utf-8 ...

  8. python十角星_使用 Python 绘制《星战》词云

    作者介绍 Rafael Schultze-Kraft "前神经科学家,数据挖掘及机器学习的狂热爱好者,Python 的狂热粉丝" 使用 Python 绘制<星战>词云 ...

  9. python爬取微博数据词云_用Python爬取微博数据生成词云图片

    原标题:用Python爬取微博数据生成词云图片 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 对商业智能BI.大数 ...

最新文章

  1. VC6.0制作OCX并web调用 .
  2. Qt 汽车仪表再次编写,Widget,仪表显示,绘制界面
  3. Android --- 如何使状态栏和标题栏底色相同
  4. 信息抽取新SOTA!首个结构化生成式信息抽取预训练模型,一统信息抽取四大任务...
  5. 【Linux网络编程学习】socket API(socket、bind、listen、accept、connect)及简单应用
  6. java 3%3_Java 代码界 3% 的王者?看我是如何解错这 5 道题的
  7. Struts结合梅花雪实现动态生成树
  8. 二分查找向上还是向下取整_113、股市中的跳空缺口判断技巧是向上还是向下
  9. 【USACO】sprime
  10. 孙鑫VC学习笔记:第十六讲 (二) 利用关键代码段实现线程间的同步
  11. 终于忙完了,要开启代码生涯了
  12. android6.0加内存卡,Android 6.0 TF卡 手机扩容的新选择
  13. 分布式智能微电网的体系结构操作系统
  14. 安装VMware虚拟机及镜像文件
  15. 音视频技术开发周刊 | 251
  16. Linux2.6--中断机制中的 ksoftirqd
  17. 数据可视化 信息可视化_可视化数据操作数据可视化与纪录片的共同点
  18. VB.net 删除文件、文件夹
  19. 什么是数据库备份DBS
  20. pjsip 设置麦克风语音输入量 扬声器播放

热门文章

  1. 原生Mysql之and和or混合使用
  2. env.render() 出现 your graphic drives do not support OpenGL 2.0
  3. Python中的单引号、双引号、三引号
  4. 小白从零开始学习区块链的个人笔记(一) 什么是区块链
  5. android pad查看cpu,苹果还是安卓?一图教你如何选择适合自己的平板
  6. Swing 使用方法
  7. 数商云:“沸腾的”数字经济大时代,平台战略提速工业数字化转型
  8. Chapter15 Principles of Metabolic Regulation
  9. 重磅 联想企业网盘发布全新功能!
  10. 法雷奥ScaLa核心人物加入:如何带领速腾聚创踏上车规激光雷达量产之路?...