前言:

上次看知乎的时候,看到了一位python大神爬取了一些人们在疫情结束后第一件事要干嘛的评论,并做成了云图,当时就觉得特别有意思,所以就来学习一下。

下载的话就不过多介绍了,百度上都有,主要说一下编辑云词很好用的工具以及如何去制作词云。

0x00:jupyter notebook工具

工具的介绍以及下载可以查知乎大神写的
https://zhuanlan.zhihu.com/p/33105153
安装好之后,更改一下默认目录,之后运行的话只需输入

jupyter notebook

即可运行

0x01:制作一个简单的词云

因为默认是无法加载汉字的,所以需要复制一下本地字体进行导入

复制一个到你设置的jupyter notebook目录,导入即可

from wordcloud import WordCloud
import numpy as np
from PIL import Image
#实例化一个WordCloud对象
wcd = WordCloud(background_color="white",repeat=True,max_words=500,height=480,
width=854,max_font_size=100,font_path="fonts/msyh.ttc",colormap="YlGnBu_r",
mask=mask,contour_width=8,contour_color='white')
#很多选项都可以通过shite+tab键查看
#加载图片,白底的图片才可以
mask = np.array(Image.open("4.png"))
text = "剑姬 剑魔 杰斯 奥恩 VN 圣枪游侠 阿卡丽 吸血鬼 船长 "
#加载字符串
wcd.generate(text)
#生成词云
wcd.to_image()
#保存图片
wcd.to_file("shy.png")

背景图片

生成的词云图

但如果想要透明背景的话应该怎么做

wcd = WordCloud(background_color="None",repeat=True,max_words=500,height=480,
width=854,max_font_size=100,font_path="fonts/msyh.ttc",colormap="YlGnBu_r",
mask=mask,mode='RGBA')
#这里有一个bug,如果不去掉contour_width=8,contour_color='white',便会发生报错


去掉之后,再运行就OK了

这里我设置的字符串是

text = "剑姬 剑魔 杰斯 奥恩 VN 圣枪游侠 阿卡丽 吸血鬼 船长 "

如果是这么长的一段话,又该怎么处理那?

text = "TheShy:首先第一个是个人认为薇恩打铁男是一个很好的英雄之一。在玩铁男的立场上,如果说不Ban薇恩的话,铁男是很难玩的。因为薇恩也是没有玩过这个英雄,所以当时也在犹豫到底要不要用这个英雄,但是当时队友说可以用这个英雄,就拿薇恩了。"

使用\进行分割

也可以导入一个第三方自然语言处理库

import jiebatext= "TheShy:首先第一个是个人认为薇恩打铁男是 \
一个很好的英雄之一。在玩铁男的立场上,如果说不Ban薇恩的话,\
铁男是很难玩的。因为薇恩也是没有玩过这个英雄,\
所以当时也在犹豫到底要不要用这个英雄,但是当时队友说可以用这个英雄\
,就拿薇恩了"
#jieba.lcut()可以生成一个list
jieba.lcut(text)


空格、符号会被自动去掉,但是wcd.generate(text)需要传入的是字符串不是列表,而且传入的字符串需要每个字间隔都要有空格,可以改成如下的格式

" ".join(jieba.lcut(text))


这样generate方法就可以进行处理了

这个只是一个最简单的例子,之后会每天进行学习做一个不同的云图!!!

未完待续!!!

Python词云学习之旅相关推荐

  1. python 词云学习

    词云入门 三步曲 数据获取:使用爬虫在相关网站上获取文本内容 数据清洗:按一定格式对文本数据进行清洗和提取(文本分类,贴标签) 数据呈现:多维度呈现和解读数据(计算,做表,画图) 一 模块的安装 pi ...

  2. 【小盐巴学习笔记】—美团吃饭哪家强?Python词云分析告诉你

    [小盐巴学习笔记]-美团吃饭哪家强?Python词云分析告诉你 效果图 前言 一.爬虫分析 1.分析网址 2.分析数据 二.完整代码 1.爬取美团牛排店评论 2.绘制词云图 3.词云分析 总结 效果图 ...

  3. python词云进阶——三国版

    1 实验内容 在进行了上一个实验<利用Python定制个性化词云>之后,掌握了初步的词云制作.出于对三国历史的喜爱,因此想制作一个关于<三国演义>版的词云,以一个新的角度去看这 ...

  4. Python词云的实现

    Python词云的实现 前言 一.词云是什么? 二.使用步骤 1.引入库 导入库时可能会遇到的困难 2.去除分词结果中的无用词汇 3.渲染词云 4.主函数 5. 完整代码 总结 前言 昨天看到了B站u ...

  5. python词云安装什么库_python词云安装什么库

    python词云需要安装wordcloud库. 安装方法: 在cmd使用pip install wordcloud命令即可安装. wordcloud库把词云当作一个WordCloud对象:wordcl ...

  6. python词云_python词云

    python词云[编辑] 概述 python词云是一种构建词云的方法,利用通用的编程语言Python来做词云,虽然不如专用工具便捷,但是适用范围很广,满足了不同人对词云的个性化需求. 一.Python ...

  7. python词云乱码_python词云库wordCloud使用方法详解(解决中文乱码)

    文章中的例子主要借鉴wordColud的examples,在文章对examples中的例子做了一些改动. 一.wordColud设计中文词云乱码 使用wordColud设计词云的时候可能会产生乱码问题 ...

  8. python词云下载什么_python词云安装什么库

    python词云需要安装wordcloud库. 安装方法: 在cmd使用pip install wordcloud命令即可安装. wordcloud库把词云当作一个WordCloud对象:wordcl ...

  9. 建议收藏chatGPT说的Python词云教程

    写在前面 这个是当下最流行最时髦的AI神器chatGPT和我一起合作写的一篇通用技术文章,请读者笑纳! Python词云教程 介绍 Python是一种流行的编程语言,它可以用于许多不同的应用程序,包括 ...

最新文章

  1. java.lang包含_原因:java.lang.IllegalArgumentException:包含(1)...
  2. example:利用impdp通过dblink导入数据库
  3. 关于8位AD_DA转换芯片的采样率问题
  4. java+session+存在哪_JAVA中Session
  5. SELinux相关内容
  6. ubuntu16.04安装virtualbox5.2
  7. JavaScript基础函数体中的唯一var模式(002)
  8. 开课吧Java课堂之SortedSet接口如何去用?
  9. 《循序渐进Oracle:数据库管理、优化与备份恢复》一一第1章 Oracle数据库的创建...
  10. java开发特殊技能怎么填_【程序员简历】IT技能/编程技能应当怎么写?
  11. DM7达梦数据库介绍和安装
  12. 《高效能人士的七个习惯》读后感
  13. 730-高并发下秒杀系统怎么设计?
  14. 超级艺术家:DeepStyle for Mac
  15. 房屋装修(卫生间/浴室)
  16. 小程序 Serverless: 解放生产力,驱动研发效能提升 1
  17. layui自定义工具栏
  18. Hive体系结构介绍
  19. 连续语音信号的短时倒谱分析及其参数用途
  20. SpringBoot:Bean生命周期介绍

热门文章

  1. C语言中前面有四个空格,在C语言编程中什么叫前导空格,什么叫尾随空 – 手机爱问...
  2. Mybatis源码解析之Mybatis初始化过程
  3. 二十、Pyecharts数据可视化
  4. 语音识别 | GMM-HMM、DNN-HMM等主流算法及前沿技术
  5. CVPR 2020 Oral | 无域标签下高清场景时移变换
  6. “玩转标签,发现层次的力量!”:跨模态哈希方法研究
  7. 本周有哪些值得读的 AI 论文?我们替你挑选了 18 篇
  8. 岗位推荐 | 微软小冰团队招聘数据挖掘/算法工程师实习生
  9. java第一章Java语言概述和入门程序
  10. 机器学习常见知识点自查50问与答