首先安装以下库

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple WordCloud

运行以下代码,即可生成简单的词云

from wordcloud import WordCloud
import matplotlib.pyplot as plt  #绘制图像的模块
import  jieba                    #jieba分词path_txt='in.txt'
f = open(path_txt,'r',encoding='UTF-8').read()# 结巴分词,生成字符串,wordcloud无法直接生成正确的中文词云
cut_text = " ".join(jieba.cut(f))wordcloud = WordCloud(#设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的font_path="C:/Windows/Fonts/simfang.ttf",#设置了背景,宽高background_color="white",width=1000,height=880).generate(cut_text)plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()

效果:

Python 通过文本生成词云相关推荐

  1. Python 任意中文文本生成词云 最终版本

    前叙 利用下面的代码你将可以将任意中文文本生成词云,其分词部分由jieba,NLPIR2016两个部分组成,生成词语由worldcloud负责,默认会自动发现文本中的20个新词并添加到词库中,当然你也 ...

  2. Python + wordcloud + jieba 十分钟学会用任意中文文本生成词云

    前述 本文需要的两个Python类库  jieba:中文分词分词工具  wordcloud:Python下的词云生成工具 写作本篇文章用时一个小时半,阅读需要十分钟,读完该文章后你将学会如何将任意中文 ...

  3. python根据文本生成词云图

    python根据文本生成词云图 效果 代码 from wordcloud import WordCloud import codecs import jieba #import jieba.analy ...

  4. Python 三国演义文本可视化(词云,人物关系图,主要人物出场次数,章回字数)

    文章目录 效果展示 介绍 软件架构 使用说明 导入需要的库 执行main.py 这里以三国演义为例 三国演义.txt alice_mask.png 效果展示 介绍 Python读取小说文本,绘制词云图 ...

  5. 在线词云加载慢,有水印?作为程序员,教你如何使用Java,Python和JS生成词云!

    声明:本文转载huaairen作者一文<制作词云库图片>,如有侵权,请联系删除. 前言 某天心血来潮,想搞搞词云这玩意,网上很多在线生成词云的网站,但是加载都比较慢,或者有水印,再或者是无 ...

  6. python词频统计 生成词云

    博客简介 本篇博客介绍2个第三方库,中文分词库jieba和词云库WordCloud,我们将完成三个例子: 统计英文词汇频率 统计中文文本词汇频率使用jieba库 生成词云 在正式开始之前,我们先安装两 ...

  7. python中wordcloud生成词云_python使用WordCloud生成词云

    前言 当我们想快速了解 书籍.小说.电影剧本中的内容是时,则可以采用绘制 WordCloud 词云图,显示主要的关键词,可以非常直观的看到结果 核心代码 from wordcloud import W ...

  8. 钱钟书《围城》 使用 Python wordcloud jieba 生成词云分析图

    文章目录 Intro Requirements 分析结果(4张图) 代码 Intro 这几天看了钱钟书老先生的<围城>,读过之后有种感觉:如果对全文分词,按照出现频率从高到低应该是: 小姐 ...

  9. 【Python】文本分析——词云

    做的第一个文本分析练习,主要是构建词云,文本以朱自清老师的"背影"为例. 分词 文本分析第一步就是分词,使用jieba库进行分词,因为要做词云,所以同时引入wordcloud和ma ...

最新文章

  1. 《预训练周刊》第9期:TABBIE:表格数据的预训练表示、「视觉预训练神作」:不用图片却训出图像识别SOTA?...
  2. php arrayaccess 二维,php的ArrayAccess(数组式访问接口)
  3. 如何保证MongoDB的安全性?
  4. Win10 calc.exe 无法打开计算器的解决方法
  5. IA-32系统编程指南 - 第三章 保护模式的内存管理【2】
  6. mysql redis教程_MySQL redis学习与应用
  7. 百度AI城市又搞事情!一天三场签约 上海市民要全面迎来AI了
  8. TwinCAT3实现OPCUA通讯问题总结
  9. 译:25个面试中最常问的问题和答案
  10. [金工实习报告]金工实习基本方法,车工/焊接/钳工/铣工/铸造/安全生产/3D打印等
  11. kubectl命令的使用、滚动更新以及回滚操作
  12. php include file_PHP Include文件实例讲解
  13. 2022新版域名防红系统源码+功能强大
  14. 【网络游戏植入案例】
  15. Charles的Mock测试map local方法将response保存本地并修改
  16. node.js 系列——Buffer
  17. 2020年浙江大学软件学院预推免面经
  18. 2020年12月CFA一二三级考试重要时间点公布!
  19. Firefox火狐浏览器如何屏蔽CSDN页面上的广告(亲测有效!)
  20. 编写函数统计数字出现次数

热门文章

  1. 西安公交车路线汇总(1)
  2. Hawk-数据抓取工具:简明教程
  3. 22 信息系统安全管理
  4. 粒子群算法matlab代码实例使用与参数解读(二维数据)
  5. Matlab 如何使用hold on与hold off
  6. 计算机视觉中的传统特征提取方法总结
  7. 《VTL语法参考指南》中文版[转]
  8. 使用python Basemap测站分布图(含站名)
  9. 阿龙的学习笔记---《程序员自我修养-链接、装载与库》读书笔记(一)
  10. 2021年目标,我打算这样去实现