由上图所示,有很多的这样的 到位 这样的关键词,这样的关键词是没有什么实际意义的,我们可以在词云设置中设置 停用词.

stopwords={'到位'}

如果你想要输入的图片不是正方形的图片,想要设置成自己想要的形状,需要先找一张 透明图

导入 imageio 模块.

import jieba

import wordcloud

import imageio

# 导入imageio库中的imread函数,并用这个函数读取本地图片,作为词云形状图片

py = imageio.imread('.\\0.jpg') # 如何你想要改变词云图的形状,可以添加

# 读取文件内容

f = open('B站弹幕.txt', encoding='utf-8')

txt = f.read()

# jiabe 分词 分割词汇

txt_list = jieba.lcut(txt)

string = ' '.join(txt_list)

# 词云图设置

wc = wordcloud.WordCloud(

width=1000, # 图片的宽

height=700, # 图片的高

background_color='white', # 图片背景颜色

font_path='msyh.ttc', # 词云字体

mask=py, # 所使用的词云图片

scale=15,

stopwords={'到位'}, # 停用词

# contour_width=5,

# contour_color='red' # 轮廓颜色

)

# 给词云输入文字

wc.generate(string)

# 词云图保存图片地址

wc.to_file('out.png')

java制作云图,Python爬虫 制作词云图相关推荐

  1. 你真的会用wordcloud制作词云图吗?

    前言 对于文本分析而言,大家都绕不开词云图,而python中制作词云图,又绕不开wordcloud,但我想说的是,你真的会用吗?你可能已经按照网上的教程,做出来了一张好看的词云图,但是我想今天这篇文章 ...

  2. Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图

    目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import jsonfrom PIL import Image from pyque ...

  3. python爬取豆瓣小组_Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图

    目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import json from PIL import Image from pyqu ...

  4. 利用python爬虫抓取虎扑PUBG论坛帖子并制作词云图

    作为一个PUBG迷,刷论坛是每天必不可少的事,上面有很多技术贴和职业比赛的帖子,突发奇想,想知道论坛里谈论最多的是什么,便做了一个爬虫爬取了论坛上最新的帖子标题和部分回复,然后利用jieba与word ...

  5. e分钟带你利用Python制作词云图

    随着大数据时代的来临,数据分析与可视化,显得越来越重要,今天给小伙伴们带来一种最常见的数据可视化图形-词云图的制作方法. 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语 ...

  6. python用selenium爬取b站评论并制作词云图

    文章目录 前言 一.爬取b站评论 1.selenium配置 2.代码 二.制作词云图 1.下载停用词 2.代码 3.注意事项 三.制作成品 1.初期成品 2.成品 前言 b站视频下的评论是下拉加载的. ...

  7. Python数据分析---回力评论关键字统计并制作词云图

    背景 想起前天爬虫拿回来的数据好像没怎么用,看了一下1000条评论有3w4千多字,然后今天决定对爬回来的回力帆布鞋的评论进行数据分析,把评论里面的关键字关键词统计出来并且制作词云图 一.思路 既然要统 ...

  8. 数据可视化之利用Python制作词云图

    制作词云图 一.词云图介绍 二.wordcloud方法 二. stylecloud方法 一.词云图介绍 词云图可以看作是文本数据的视觉表示,由词汇组成类似云的彩色图形.相对其它诸多用来显示数值数据的图 ...

  9. 利用python制作词云图,分词,提取关键词

    利用python制作词云图保姆及教程 前言 一.环境配置 1.要有python的运行环境 2.需要导入jieba ,wordcloud等模块 pip install jieba pip install ...

最新文章

  1. php heredoc 开启,PHP中nowdoc和heredoc使用需要注意的一点
  2. 浅谈Javascript中的void操作符
  3. 转:Linux下应用tgtadm构建iSCSI Target(SAN)
  4. 深度学习核心技术精讲100篇(四十七)-做推荐系统之余,我们该思考什么?
  5. asp.net+mysq 数据库操作类
  6. .net 连接php,NetBeans平台如何连接到PHP解析器?
  7. 常用的sql server 函数、存储过程、临时表总结
  8. Hibernate的几个关键类的详解及Hibernate的运行过程
  9. 青禾BBS数据库查询语句(动网)
  10. Java设计模式汇总
  11. 毕啸南专栏 | 对话王小川:搜狗不是谁的“变量”,是行业主要玩家
  12. SQLite B/S使用(一)
  13. Sublime Text 3.1 编辑管理工程(项目)
  14. 查看安卓app包名的5种方法
  15. 编译原理(第四版)胡元义第三章部分习题答案(2)
  16. C专家编程 模块化与有限机编写cdecl声明程序
  17. 微信小程序 修改radio样式
  18. 学习金字塔:输出式主动学习
  19. 上传Android应用到腾讯应用宝,乐固加固应用使用
  20. 除了Navicat和DBeaver,还有没有免费又好用的数据库管理工具推荐

热门文章

  1. 终于找到原因!大厂面试被拒,是你不会数据结构
  2. 月薪3k和30k的程序员,差距就在这道坎...
  3. 故宫网站遭“围攻”!
  4. 程序员爬虫竟构成犯罪?
  5. 程序员技术测评平台,猿圈宣布获智联数千万 A+轮战略融资
  6. 现在,AI 已经能预测病人什么时候死亡了,准确率达 90%
  7. 身陷 Bug 时,优秀的开发工程师是如何寻求帮助的?
  8. 电脑创建java文件_HelloWorld.java文件如何创建?
  9. matplotlib 中文_看了这个总结,其实 Matplotlib 可视化,也没那么难
  10. php dom xml解析,PHP使用DOM解析XML