Python 通过文本生成词云
首先安装以下库
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple WordCloud
运行以下代码,即可生成简单的词云
from wordcloud import WordCloud
import matplotlib.pyplot as plt #绘制图像的模块
import jieba #jieba分词path_txt='in.txt'
f = open(path_txt,'r',encoding='UTF-8').read()# 结巴分词,生成字符串,wordcloud无法直接生成正确的中文词云
cut_text = " ".join(jieba.cut(f))wordcloud = WordCloud(#设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的font_path="C:/Windows/Fonts/simfang.ttf",#设置了背景,宽高background_color="white",width=1000,height=880).generate(cut_text)plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()
效果:
Python 通过文本生成词云相关推荐
- Python 任意中文文本生成词云 最终版本
前叙 利用下面的代码你将可以将任意中文文本生成词云,其分词部分由jieba,NLPIR2016两个部分组成,生成词语由worldcloud负责,默认会自动发现文本中的20个新词并添加到词库中,当然你也 ...
- Python + wordcloud + jieba 十分钟学会用任意中文文本生成词云
前述 本文需要的两个Python类库 jieba:中文分词分词工具 wordcloud:Python下的词云生成工具 写作本篇文章用时一个小时半,阅读需要十分钟,读完该文章后你将学会如何将任意中文 ...
- python根据文本生成词云图
python根据文本生成词云图 效果 代码 from wordcloud import WordCloud import codecs import jieba #import jieba.analy ...
- Python 三国演义文本可视化(词云,人物关系图,主要人物出场次数,章回字数)
文章目录 效果展示 介绍 软件架构 使用说明 导入需要的库 执行main.py 这里以三国演义为例 三国演义.txt alice_mask.png 效果展示 介绍 Python读取小说文本,绘制词云图 ...
- 在线词云加载慢,有水印?作为程序员,教你如何使用Java,Python和JS生成词云!
声明:本文转载huaairen作者一文<制作词云库图片>,如有侵权,请联系删除. 前言 某天心血来潮,想搞搞词云这玩意,网上很多在线生成词云的网站,但是加载都比较慢,或者有水印,再或者是无 ...
- python词频统计 生成词云
博客简介 本篇博客介绍2个第三方库,中文分词库jieba和词云库WordCloud,我们将完成三个例子: 统计英文词汇频率 统计中文文本词汇频率使用jieba库 生成词云 在正式开始之前,我们先安装两 ...
- python中wordcloud生成词云_python使用WordCloud生成词云
前言 当我们想快速了解 书籍.小说.电影剧本中的内容是时,则可以采用绘制 WordCloud 词云图,显示主要的关键词,可以非常直观的看到结果 核心代码 from wordcloud import W ...
- 钱钟书《围城》 使用 Python wordcloud jieba 生成词云分析图
文章目录 Intro Requirements 分析结果(4张图) 代码 Intro 这几天看了钱钟书老先生的<围城>,读过之后有种感觉:如果对全文分词,按照出现频率从高到低应该是: 小姐 ...
- 【Python】文本分析——词云
做的第一个文本分析练习,主要是构建词云,文本以朱自清老师的"背影"为例. 分词 文本分析第一步就是分词,使用jieba库进行分词,因为要做词云,所以同时引入wordcloud和ma ...
最新文章
- 《预训练周刊》第9期:TABBIE:表格数据的预训练表示、「视觉预训练神作」:不用图片却训出图像识别SOTA?...
- php arrayaccess 二维,php的ArrayAccess(数组式访问接口)
- 如何保证MongoDB的安全性?
- Win10 calc.exe 无法打开计算器的解决方法
- IA-32系统编程指南 - 第三章 保护模式的内存管理【2】
- mysql redis教程_MySQL redis学习与应用
- 百度AI城市又搞事情!一天三场签约 上海市民要全面迎来AI了
- TwinCAT3实现OPCUA通讯问题总结
- 译:25个面试中最常问的问题和答案
- [金工实习报告]金工实习基本方法,车工/焊接/钳工/铣工/铸造/安全生产/3D打印等
- kubectl命令的使用、滚动更新以及回滚操作
- php include file_PHP Include文件实例讲解
- 2022新版域名防红系统源码+功能强大
- 【网络游戏植入案例】
- Charles的Mock测试map local方法将response保存本地并修改
- node.js 系列——Buffer
- 2020年浙江大学软件学院预推免面经
- 2020年12月CFA一二三级考试重要时间点公布!
- Firefox火狐浏览器如何屏蔽CSDN页面上的广告(亲测有效!)
- 编写函数统计数字出现次数