java制作云图,Python爬虫 制作词云图
由上图所示,有很多的这样的 到位 这样的关键词,这样的关键词是没有什么实际意义的,我们可以在词云设置中设置 停用词.
stopwords={'到位'}
如果你想要输入的图片不是正方形的图片,想要设置成自己想要的形状,需要先找一张 透明图
导入 imageio 模块.
import jieba
import wordcloud
import imageio
# 导入imageio库中的imread函数,并用这个函数读取本地图片,作为词云形状图片
py = imageio.imread('.\\0.jpg') # 如何你想要改变词云图的形状,可以添加
# 读取文件内容
f = open('B站弹幕.txt', encoding='utf-8')
txt = f.read()
# jiabe 分词 分割词汇
txt_list = jieba.lcut(txt)
string = ' '.join(txt_list)
# 词云图设置
wc = wordcloud.WordCloud(
width=1000, # 图片的宽
height=700, # 图片的高
background_color='white', # 图片背景颜色
font_path='msyh.ttc', # 词云字体
mask=py, # 所使用的词云图片
scale=15,
stopwords={'到位'}, # 停用词
# contour_width=5,
# contour_color='red' # 轮廓颜色
)
# 给词云输入文字
wc.generate(string)
# 词云图保存图片地址
wc.to_file('out.png')
java制作云图,Python爬虫 制作词云图相关推荐
- 你真的会用wordcloud制作词云图吗?
前言 对于文本分析而言,大家都绕不开词云图,而python中制作词云图,又绕不开wordcloud,但我想说的是,你真的会用吗?你可能已经按照网上的教程,做出来了一张好看的词云图,但是我想今天这篇文章 ...
- Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图
目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import jsonfrom PIL import Image from pyque ...
- python爬取豆瓣小组_Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图
目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import json from PIL import Image from pyqu ...
- 利用python爬虫抓取虎扑PUBG论坛帖子并制作词云图
作为一个PUBG迷,刷论坛是每天必不可少的事,上面有很多技术贴和职业比赛的帖子,突发奇想,想知道论坛里谈论最多的是什么,便做了一个爬虫爬取了论坛上最新的帖子标题和部分回复,然后利用jieba与word ...
- e分钟带你利用Python制作词云图
随着大数据时代的来临,数据分析与可视化,显得越来越重要,今天给小伙伴们带来一种最常见的数据可视化图形-词云图的制作方法. 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语 ...
- python用selenium爬取b站评论并制作词云图
文章目录 前言 一.爬取b站评论 1.selenium配置 2.代码 二.制作词云图 1.下载停用词 2.代码 3.注意事项 三.制作成品 1.初期成品 2.成品 前言 b站视频下的评论是下拉加载的. ...
- Python数据分析---回力评论关键字统计并制作词云图
背景 想起前天爬虫拿回来的数据好像没怎么用,看了一下1000条评论有3w4千多字,然后今天决定对爬回来的回力帆布鞋的评论进行数据分析,把评论里面的关键字关键词统计出来并且制作词云图 一.思路 既然要统 ...
- 数据可视化之利用Python制作词云图
制作词云图 一.词云图介绍 二.wordcloud方法 二. stylecloud方法 一.词云图介绍 词云图可以看作是文本数据的视觉表示,由词汇组成类似云的彩色图形.相对其它诸多用来显示数值数据的图 ...
- 利用python制作词云图,分词,提取关键词
利用python制作词云图保姆及教程 前言 一.环境配置 1.要有python的运行环境 2.需要导入jieba ,wordcloud等模块 pip install jieba pip install ...
最新文章
- php heredoc 开启,PHP中nowdoc和heredoc使用需要注意的一点
- 浅谈Javascript中的void操作符
- 转:Linux下应用tgtadm构建iSCSI Target(SAN)
- 深度学习核心技术精讲100篇(四十七)-做推荐系统之余,我们该思考什么?
- asp.net+mysq 数据库操作类
- .net 连接php,NetBeans平台如何连接到PHP解析器?
- 常用的sql server 函数、存储过程、临时表总结
- Hibernate的几个关键类的详解及Hibernate的运行过程
- 青禾BBS数据库查询语句(动网)
- Java设计模式汇总
- 毕啸南专栏 | 对话王小川:搜狗不是谁的“变量”,是行业主要玩家
- SQLite B/S使用(一)
- Sublime Text 3.1 编辑管理工程(项目)
- 查看安卓app包名的5种方法
- 编译原理(第四版)胡元义第三章部分习题答案(2)
- C专家编程 模块化与有限机编写cdecl声明程序
- 微信小程序 修改radio样式
- 学习金字塔:输出式主动学习
- 上传Android应用到腾讯应用宝,乐固加固应用使用
- 除了Navicat和DBeaver,还有没有免费又好用的数据库管理工具推荐
热门文章
- 终于找到原因!大厂面试被拒,是你不会数据结构
- 月薪3k和30k的程序员,差距就在这道坎...
- 故宫网站遭“围攻”!
- 程序员爬虫竟构成犯罪?
- 程序员技术测评平台,猿圈宣布获智联数千万 A+轮战略融资
- 现在,AI 已经能预测病人什么时候死亡了,准确率达 90%
- 身陷 Bug 时,优秀的开发工程师是如何寻求帮助的?
- 电脑创建java文件_HelloWorld.java文件如何创建?
- matplotlib 中文_看了这个总结,其实 Matplotlib 可视化,也没那么难
- php dom xml解析,PHP使用DOM解析XML