前言

在大数据时代,你竟然会在网上看到的词云,例如这样的。

看到之后你是什么感觉?想不想自己做一个?

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!??¤
QQ群:961562169

如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据、做数学题、写脚本替你偷懒……

如果你之前没有编程基础,没关系。希望你不要限于浏览,而是亲自动手尝试一番。到完成的那一步,你不仅可以做出第一张词云图,而且这还将是你的第一个有用的编程作品。

安装 wordcloud库

请确保你的python环境没有问题,我用的开发工具是VsCode,首先你要在Python扩展中安装python开发环境(当然,这不是为你的windows安装python)

那么你还需要安装所需要的第三方库,那么在VSCode中并没有PyCharm那么专业,这里需要获得你自己的Python脚本位置。

我们可以发现里面有一个名为pip.exe文件,这个文件就是python官方给我们去安装python第三方库的一个程序,那么我们可以在VsCode的终端中就可以去通过它,这也是我们为什么要获取python安装位置的根本原因。

例如我们安装WordCloud,我们的操作如下:

pip nstall WordCloud

数据

这个时候我们就要开始Code了,我们一定需要数据,这里我自己找了一个绕口令,内容如下:

Betty Botter bought some butter but she said the butter's bitter. If I put it in my batter it will make my batter bitter. So, she bought some better butter, better than the bitter butter and she put it in her batter and her batter was not bitter. So 'twas good that Betty Botter bought some better butter.

翻译: 贝蒂·波特买牛油, 可她说:“牛油是苦的。 不过加上一点好牛油—— 可以使苦牛油更好点。” 于是她买了一点牛油, 比苦牛油好点的牛油。 掺了之后苦牛油真的变的好多了。 所以这就是贝蒂·波特买的一点比苦牛油好点的牛油。

我把其中的文字存储成了一个文本,叫做minister.txt。

Code

python做词云呢,需要导入的包有wordcloud和PIL,其中PIL(Python Image Library)是python平台图像处理标准库,功能是真的强大。首先需要读取文件 。

首先我们要读取我们的txt文件,那么代码如下:

运行脚本结果如下:

接下来导包,我们看看如何生成最简单的词云:

如果python引入无误,并代码无误,那么会弹出你生成的图片,该图片会储存在你的系统。详细位置一般为: C:UsersMACHENIKEAppDataLocalTemp 中。

带形状的词云

一般来说,我们不想要这么方的词云,肯定喜欢一些有形状的,

接下来是生成那种有轮廓的词云,这里就需要继续导入其他包,这里导入的包为numpy,numpy系统是python的一种开源的数值计算扩展,这种工具可以用来存储和处理大型矩阵。这里在处理的时候将给出形状的图片表示为一个大型矩阵,再有颜色的地方来进行填词(导包 :import numpy as np)。导包之后需添加一个遮罩层,遮罩层就是用来限制生成图片的形状 。

网上随便找个图片放入到项目当中(这里我找的是一个:heartpulse:),然后开始code:

结果如下:

不支持中文的解决方案

我又从网上摘抄了一段文字,文字内容如下:

生活星期天早上和朋友一起聊天,朋友说了一个他们听过的故事:“一尊佛像前有一条铺着石板的路,人们每天都踏着这一阶一阶的石板去膜拜佛像。石阶看着人们踏着自己去膜拜佛像,心里很不舒服。石阶心里想,自己和佛本来就来自同一块石头,为什么自己要成为踏脚石,让人们踩着自去去膜拜它呢!它对佛抱怨说这样太不公平!佛像说:这没有什么不公平,你们成为台阶只需挨了四刀,而我是挨了千刀万剐才成了人们膜拜的佛像。

重新运行,发现雪崩了。

如果需要生成中文的词云,还需导入jieba分词的包。jieba分词的切分还是蛮准的。

C盘中有font字体,那么这些呢你可以自己去找,trans_CN方法是分词用的,通过font-path就可以指定里面的生成文本。这大概就是词云的基础了,可以将爬虫和词云生成结合在一起,在爬取信息之后生成这样的词云。

利用Python生成漂亮的词云,云的形状由你定相关推荐

  1. python程序创建词云 中国地图_就这么简单!使用Python生成漂亮的词云

    原标题:就这么简单!使用Python生成漂亮的词云 作者:Linux迷 链接:https://www.linuxmi.com 词云是一种数据可视化技术,用于表示文本数据,其中每个单词的大小表示其出现的 ...

  2. 利用python制作漂亮的词云图_利用python制作词云,wordcloud神器你值得拥有

    相信许多人都看到过下面这样的词云图,词云图是一种很好的可视化工具,其作用主要是为了文本数据的视觉表示,既酷炫又能突出重点. 关于词云图的制作,网上能够搜集到很多的教程,许多都是利用了专用的工具,这些工 ...

  3. Python生成漂亮的词云,云的形状由你定

    前言 在大数据时代,你竟然会在网上看到的词云,例如这样的. 看到之后你是什么感觉?想不想自己做一个? 如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流 ...

  4. 利用python制作漂亮的词云图

    作者:黎智煊 叩丁狼高级讲师.原创文章,转载请注明出处. 前言:现在制作一个词云图还是简单的事, 例如这个-> https://wordart.com (选择Noto Sans S Chines ...

  5. 利用python制作漂亮的词云图_利用python制作漂亮的词云图

    新建一个新的目录 随便找个地方新建一个目录,比如我在F盘下面新建一个word_cloud文件夹(名字都是随便取),并且打开这个文件夹. 把刚刚下载的msyh.ttc复制到这里. 新建一个my_word ...

  6. python 词云_利用Python生成词云

    利用Python生成词云 一.第三方库的安装与介绍 1.1  Python第三方库jieba(中文分词) 1.介绍 "结巴"中文分词:做最好的 Python 中文分词组件. 2.特 ...

  7. 利用python做微信聊天记录词云分析——记录美好回忆

    目录 1 概述 2 数据准备 2.1 安卓设备 2.1.1 Root手机,安装Root Explorer 2.1.2 用Root Explorer将聊天记录的数据文件导出并存入电脑 2.1.3 对En ...

  8. 【Python例】利用 python 进行用户画像词云图的生成 --- wordcloud

    [Python例]利用 python 进行用户画像词云图的生成 - wordcloud 本文主要用于记录,并使用 python 脚本进行用户画像的词云图的生成. 前言 对于词云图来说,是一个用户画像数 ...

  9. 独家 | 手把手教你怎样用Python生成漂亮且精辟的图像(附教程代码)

    作者:Fabian Bosler 翻译:车前子 校对:吴振东 本文约4800字,建议阅读15分钟. 本文将介绍如何利用Python生成图像并将结果做出可视化分析. 在上周的文章<用python从 ...

最新文章

  1. 收藏功能_微信强大的收藏功能,你们用了吗?
  2. Java面试之Java基础下册(含答案)
  3. Socket/ServerSocket 选项
  4. js实现表格的增删改查
  5. 好程序员web前端分享Nodejs学习笔记之Stream模块
  6. 洛谷P1337 [JSOI2004]平衡点 / 吊打XXX(模拟退火)
  7. 许昌电气学校电话计算机,许昌电气职业学院
  8. php 获取html中图片不显示,HTML中img标签src属性用PHP设置后不显示
  9. 【Jenkins持续集成】docker部署+配置+操作Jenkins
  10. 烂泥:更换ESXI5.0管理网卡及管理IP地址
  11. BZOJ1370 [Baltic2003]Gang团伙
  12. Excel员工考勤表模板,这三套送给您
  13. android硬盘加密方法,Android硬盘加密工具
  14. canvas压缩图片方法
  15. 产品经理求职方法指南:面试通关
  16. ubuntu18 配置静态IP地址(详细版)
  17. JAVA String时间转化为数据库Date类型
  18. 网络传输前三层——物理层、数据链路层、网络层
  19. Ruff Chain韩国Meetup回顾:物联网因区块链而改变
  20. 网络安全观察报告 漏洞观察

热门文章

  1. 看了那么多博客,还是不懂 TCC,不妨看看这个案例!
  2. 测量误差?什么误差?测量什么?
  3. oracle的hints类型,Oracle Hints详解
  4. 机器学习入门——梯度下降算法详解
  5. 设计世界中的阴阳:带有微妙文字的强大英雄形象
  6. 【转】 Qt 学习资料 相关论坛网站
  7. mysql入门经典 王雨竹_MySQL入门经典
  8. DS18B20温度传感器在树莓派下获取实时温度
  9. ACE 安装指南及示例
  10. 生于硬核 DTCC2020Hubble与技术硬核“同生共荣”