更多实用工具在这里点击

只需要输入txt文档所在路径,就可以输出词云图,词云图图形可自定义。
停用词库需要自己下载,作用是分词更准确。
mask遮罩图片需要自己搞一张,弄一张椭圆的图片,必须背景色是白色,那么词云图输出就是椭圆。

mask.png

代码

#coding=utf-8#@Time : 2020/11/14 22:16
#@Author :java川
#@File : 词云图
#@Software: PyCharm
## 包的作用
import timeimport jieba  #分词
from wordcloud import WordCloud  #词云
from PIL import Image   #图片处理
import numpy as np  #将图片变成数组
import collections  #计数器
from matplotlib import pyplot as plt  #绘图def cut_word(text):#分词:cut_all=False:精确模式 HMM=True:使用隐式马尔科夫cut = jieba.cut(text,cut_all=False,HMM=True)object_list = []#读取停用词with open("stop_word.txt", 'r', encoding='UTF-8') as meaninglessFile:stopwords = set(meaninglessFile.read().split('\n'))stopwords.add(' ')#如果单词不在停用词里,则添加for word in cut:if word not in stopwords:object_list.append(word)#collections.Counter 计数器,统计单词个数word_counts = collections.Counter(object_list)print(word_counts)return word_counts#生成词云图保存
def get_cloud(word_counts):#遮罩图:必须是白底的img = Image.open('mask.png')img_array = np.array(img)  #将图片变为数组wc = WordCloud(background_color = 'white', # 背景颜色mask = img_array,  #遮罩图片relative_scaling=0.3, #字体关联度max_font_size = 40,height=400,width=1000,max_words=150, #字体数量显示font_path='msyh.ttc',#字体格式)wc.generate_from_frequencies(word_counts,150)  #生成词云图fig = plt.figure(1)plt.imshow(wc)  # 显示词云plt.axis('off') # 关闭坐标wc.to_file(r"C:\Users\MI\Desktop\词云图{}javachuan.png".format(str(int(time.time()))))#调整边框#plt.subplots_adjust(top=0.99, bottom=0.01, right=0.99, left=0.01, hspace=0, wspace=0)#保存图片  plt 绘图保存 不高清# plt.savefig(r'C:\Users\MI\Desktop\词云图{}javachuan.png'.format(str(int(time.time()))),dpi=600)plt.show()def main():print("\n*********建议直接拖拽txt文档到黑框**********\n")path = str(input("请输入 txt 文档路径:"))try:with open(path, 'r', encoding='UTF-8') as f:text = f.read()except:print(" ---------------文档路径 {} 不存在!!!---------------- ".format(path))main()word_counts = cut_word(text)get_cloud(word_counts)if __name__ == '__main__':main()

结果图:

python词云图生成脚本相关推荐

  1. [Python]*词云图生成——默认和图片蒙版词云图

    1.生成默认画布词云图 : import wordcloud as wc #导入词云库 import jieba #jieba中文分词库 import matplotlib.pyplot as plt ...

  2. python词云图素材_用Python制作酷炫词云图,原来这么简单!

    一.简介 词云图是文本挖掘中用来表征词频的数据可视化图像,通过它可以很直观地展现文本数据中地高频词:! 图1 词云图示例 在Python中有很多可视化框架可以用来制作词云图,如pyecharts,但这 ...

  3. python词云图制作壮观天体照_用Python制作酷炫词云图,原来这么简单!

    二.利用wordcloud绘制词云图 wordcloud 是Python中制作词云图比较经典的一个模块,赋予用户高度的自由度来创作词云图: 图2 wordcloud制作词云图示例2.1 从一个简单的例 ...

  4. python词云图词频统计

    目录 一:安装必要的库 二:数据分析 条形图可视化 三:数据分析 词频统计 词云图可视化 一:安装必要的库 导入必要的库 import collections # 词频统计库 import os im ...

  5. python image stiching_Python自然语言处理,词云图生成

    自然语言处理 本节介绍如何使用Python中的库,生成词云图,涉及自然语言处理的相关问题,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向.它研究能实现人与计算机之间用自然语言进行有效通信的 ...

  6. python词云图实验报告_Python实现Wordcloud生成词云图的示例

    wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概. 首先贴出一张词云图(以哈利波特小说为例): 在生成词云图之前 ...

  7. 拿来就用能的Python词云图代码|wordcloud生成词云详解

    词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息.今天,我们就来学习一下Python生成词云 ...

  8. python词云图片生成

    在进行垃圾邮件分类的时候,虽然可以通过预先类别和现在预测类别的对比来看垃圾与非垃圾邮件的类别,但是还是没有直接看词云图片比较直观.所以这里就来做下简单的词云生成. 1. 安装第三方库 pip inst ...

  9. python词云图_Python生成一篇文章的词云图

    使用前需要确保安装以下第三方库: jieba, wordcloud, imageio, sklearn,csv imageio.csv和sklearn在安装anaconda时默认是安装的,另外两个库需 ...

  10. python词云图代码示例 无jieba_【词云图】如何用python的第三方库jieba和wordcloud画词云图...

    一直想学一下如何用python画词云图,觉得很好玩,本文就写一下我自己的一些尝试. 1.提前准备 一般准备以下四样就可以啦. 第一,电脑安装python,我装的是3.6. 第二,安装第三方库jieba ...

最新文章

  1. 从hello world 说程序运行机制
  2. Python字符串方法:字符串拼接、截取、转数字
  3. jquery1.8 获取option的对象进行操作
  4. 55种数据可视化开源工具_6种用于撰写书籍的开源工具
  5. python开发最受欢迎的十款工具
  6. LibreOJ β Round #2 E. 数论只会 GCD
  7. 鸟类的大脑处理数据模式,可以启发CPU/GPU的设计
  8. edui 富文本编辑_百度umeditor富文本编辑器插件扩展
  9. php宠物社交领养网站
  10. IT管理到底是做什么
  11. Vue Mapbox 发布高德瓦片地图
  12. Linux系统管理、系统安全命令概述
  13. 当公司倒闭时,你在干什么?
  14. 数学建模 MATLAB绘制心形线
  15. 服务器什么系统好用点,服务器用什么系统好
  16. CleanMyMac X2023Mac电脑空间内存清理工具
  17. Android几种数据存储的对比(MMKV、DataStore、SharedPreference)
  18. 现在的微博营销方案具备哪些特点呢?
  19. 大数据分析平台哪个好?
  20. 运用DCM4CHEE docker镜像模拟医院PACS系统进行数据传输的测试

热门文章

  1. 小学计算机课知识点内容,小学信息技术教案九篇
  2. 您该选择PRINCE2 还是 PMP认证
  3. 汇川技术小型PLC梯形图编程系列教程(1)小型PLC型号H123U简介
  4. 电容 电阻0201/0402/0603/等封装长宽高定义
  5. 黑马程序员python入门学习笔记
  6. python转bat_bat 转换为python
  7. WPS国际版2019 中文
  8. web应用系统性能测试的种类
  9. 快速搭建基于CoreUI,Python Flask的管理框架
  10. 计算机类中英附录,欧盟GMP附录11-计算机系统(中英文对照).pdf