大前天我们通过Python网络爬虫对朋友圈的数据进行了抓取,感兴趣的朋友可以点击进行查看,如何利用Python网络爬虫抓取微信朋友圈的动态(上)和如何利用Python网络爬虫爬取微信朋友圈动态——附代码(下)。今天小编带大家通过词云去将其进行可视化,具体的教程如下。

1、在Python中做词云,需要用到wordcloud库和jieba分词库,没有安装的伙伴可以直接pip安装即可。

2、之后你可能还需要一些字体,如simhei.ttf等,这些字体在网上都有,可以直接进行下载,在做词云的时候会用得到,如下图所示。

3、在items.py的同级目录下建立analyse.py文件,定义analyse_words方法,用于实现词云可视化,jieba.cut用于得到分词结果,具体的代码实现,如下图所示。因为得到的moment.json数据是以JSON格式存储的,所以需要在该文件中导入JSON模块对其进行解析。

这个地方需要注意一下,由于我们的memoent.json文件中是中文字符,如果在open()函数中没有加入encoding=’utf-8’的话会导致gbk编码错误,记得将编码加上即可。

4、之后运行程序,得到keys.png图片文件,程序运行的效果如下图所示。可以看到keys.png已经在items.py目录下了。

5、双击keys.png,如下图所示。

6、不得不承认,这个词云图片内容确实丰富,不过也十分的丑。小编利用wordart(一个词云网站)将朋友圈数据进行更加美化的可视化。

7、比方说用动物的图案进行可视化,效果图如下图所示。

8、如果直接将数据进行导入的话,wordart会直接将整段话进行可视化,这样显得十分冗余,看上去也不太友好,因此还需要通过Python对数据进行分频统计,之后再导入到wordart中就可以看到想要的效果了。首先,我们需要对json文件进行处理一下,将文本全部导出来,形成一个moment.txt文件。内容如下图所示。

9、编写代码,将文本进行分词,代码实现如下所示。

10、程序运行完成之后,得到的moment_outputs.txt文件,内容如下图所示,可以很清楚的看到分词情况。红色部分是程序运行的过程。

11、继续编写代码,将词频进行统计汇总,代码实现如下图所示。

12、程序运行之后,得到一个txt和Excel文件,里边是关于词频统计的信息,如下图所示。红色部分是程序运行的结果,并没有报错。

13、将这些关键字导入到wordart中进行可视化,如下图所示。

14、设置一下图案、字体、排版、颜色等等,就可以生成绚丽的词云图了,下图是汪星人词云图。

15、下图是小云朵词云图,可以给视觉带来一场饕餮盛宴。

小伙伴们,你们有没有觉得很神奇呢?喜欢的话欢迎收藏和转载噢~~

如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化展示相关推荐

  1. python数据预测_利用Python编写一个数据预测工具

    利用Python编写一个数据预测工具 发布时间:2020-11-07 17:12:20 来源:亿速云 阅读:96 这篇文章运用简单易懂的例子给大家介绍利用Python编写一个数据预测工具,内容非常详细 ...

  2. [Python] 利用 Python 制作“飞花令”小工具

    转载请注明:陈熹 chenx6542@foxmail.com (简书号:半为花间酒) 若公众号内转载请联系公众号:早起Python 介绍:飞花令是古时候人bai们经常玩一种"行酒令" ...

  3. 利用python从网页查找数据_利用Python模拟淘宝的搜索过程并对数据进行可视化分析...

    数据挖掘入门与实战 公众号: datadw 本文讲述如何利用Python模拟淘宝的搜索过程并对搜索结果进行初步的数据可视化分析. 搜索过程的模拟:淘宝的搜索页面有两种形式, 一种形式是, 2019/2 ...

  4. 数据可视化 工具_卓越中心和数据可视化工具2020中的组织中的数据聚合

    数据可视化 工具 人工智能 (ARTIFICIAL INTELLIGENCE) Data consumption is rising steadily in 2020 with estimates s ...

  5. 推荐三款高级可视化工具,解决90%的数据可视化大屏需求

    对于数据分析师来说,可视化可能是最能表现自己工作价值的一个途径,因为领导喜欢看这种直观的.炫酷的.具有科技感的可视化大屏,我们也能把数据分析结果直接展示给领导,比一份纸面报告要强不知多少倍! 那么领导 ...

  6. python点云可视化工具_救命!点云可视化(不需配置PCL)

    分享一波简单的可视化bin格式点云的方法. 先大概讲下背景,目前激光雷达采集的点云文件大多基于ROS,然后转化为pcd.bin格式进行处理.(ros-pcd-bin格式之间相互转换格式有相应的工具,如 ...

  7. 【可视化工具】二维矩形装箱可视化 + JS-Canvas实现

    文章目录 一.说明 二.可视化效果展示 三.代码 一.说明 本代码文件为.vue文件,其中使用了Element-UI组件.可视化代码主要用了JS的Canvas画布. 如果需要可视化,需要在程序中按照一 ...

  8. python展示全部好友_利用Python网络爬虫抓取微信好友的签名及其可视化展示

    前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所 ...

  9. python爬虫好友聊天记录_利用Python网络爬虫抓取微信好友的签名及其可视化展示...

    前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所 ...

最新文章

  1. 项目开发中使用IDEA创建多个maven子模块
  2. SQLSERVER2005的安装目录结构(下)
  3. H5 postMessage跨文档消息传递
  4. java character是什么意思_Java Character 类
  5. 有了这个运维方案,让IT信息化人员头疼的系统宕机再也没出现
  6. 深入理解Java泛型
  7. linux 驱动读写文件,Linux下读写寄存器
  8. 张一鸣早期创业的访谈还挺有启发,不知道他现在的观念有没有改变
  9. PHP 生成csv的遇到的分隔符问题
  10. Oracle 9.2.0.4的一个简单安装脚本(含安装前补丁p3006854)
  11. hadoop菜鸟教程 Hadoop学习资料(云计算学习电子书)
  12. AI发票扫描识别sdk软件接口
  13. 联想g510拆键盘的简单方法_联想G510重点笔记本拆机教程.doc
  14. 使用 Power Query 制作工资条
  15. 微信公众号项目录音上传功能
  16. 比 Xshell 还好用的 SSH 客户端神器!
  17. 程序员兼职接私活平台大全,兼职也能月薪上万!
  18. FileZilla Server 中文版
  19. gdkoi 2023
  20. 天创速盈带您速读:怎么提升拼多多关键词综合排名?方案如下

热门文章

  1. React 基础----1
  2. 图像特征提取之LoG特征
  3. 深圳 IT 男打人后疯狂凡尔赛,还教育民警,这回把 IT 人的脸都丢尽了……
  4. HACK彩虹易支付超完整源码+内附11个模板
  5. matlab字符模板在哪,新人求助!车牌识别系统里的字符模版存放路径是哪里
  6. 把Excel转换成xml文件
  7. 亲测可用~ Ubuntu20.04 findfont: Font family [‘sans-serif‘] not found. Times New Roman 字体缺失
  8. android 全选功能,Android Recyclerview实现多选,单选,全选,反选,批量删除的功能
  9. 利用qwinsta和rwinsta察看连接到一个机器的连接数
  10. canvas动画及案例