python制作中文词云_Python如何生成词云(详解)
前言
今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图:
效果图一:
效果图二:
根据效果图分析的还是比较准确的,小说中的主人公就是“程理”,所以出现次数最多。图中有两种模式,一种是默认的模式,另一种是自己添加图片作为背景。下面我就带大家一起来学习怎样去生成词云!
wordcloud的安装
对于新人来说安装wordcloud模块就是一大关,我们一般都是通过Pycharm或者PIP安装的,但是在安装wordcloud时会提示错误,如下:
我的解决方法是直接访问下面的网址,根据你的电脑和py版本下载对应的whl文件
下载完成后,把whl文件放在pip路径下,输入下面的代码,记住代码的whl文件名一定是适合你的文件名,我只是举例:
pip install wordcloud-1.4.1-cp36-cp36m-win32.whl
运行后会显示安装成功
wordcloud的简单用法
wordcloud的基本方法,看源码如下:
各个参数大家应该一看就明白,另外wordcloud还有几个其他方法,比如fit_words,generate(text),to_file(filename)等等都是非常好理解的。
wordcloud生成词云
效果图一的代码:
from wordcloud import WordCloud
import matplotlib.pyplot as plt #绘制图像的模块
import jieba #jieba分词
path_txt='C://Users/Administrator/Desktop/all.txt'
f = open(path_txt,'r',encoding='UTF-8').read()
# 结巴分词,生成字符串,wordcloud无法直接生成正确的中文词云
cut_text = " ".join(jieba.cut(f))
wordcloud = WordCloud(
#设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
font_path="C:/Windows/Fonts/simfang.ttf",
#设置了背景,宽高
background_color="white",width=1000,height=880).generate(cut_text)
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()
运行后:
效果图二,给词云加上图片背景,代码如下:
from PIL import Image
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import numpy as np
import jieba
def GetWordCloud():
path_txt = 'C://Users/Administrator/Desktop/all.txt'
path_img = "C://Users/Administrator/Desktop/timg.jpg"
f = open(path_txt, 'r', encoding='UTF-8').read()
background_image = np.array(Image.open(path_img))
# 结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云,感兴趣的朋友可以去查一下,有多种分词模式
#Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
cut_text = " ".join(jieba.cut(f))
wordcloud = WordCloud(
# 设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
font_path="C:/Windows/Fonts/simfang.ttf",
background_color="white",
# mask参数=图片背景,必须要写上,另外有mask参数再设定宽高是无效的
mask=background_image).generate(cut_text)
# 生成颜色值
image_colors = ImageColorGenerator(background_image)
# 下面代码表示显示图片
plt.imshow(wordcloud.recolor(color_func=image_colors), interpolation="bilinear")
plt.axis("off")
plt.show()
if __name__ == '__main__':
GetWordCloud()
运行后:
如果有不懂的朋友可以直接在公众号上加我的微信,希望对大家有所帮助!
大家可以关注我的微信公众号:「秦子帅」一个有质量、有态度的公众号!
python制作中文词云_Python如何生成词云(详解)相关推荐
- python中split啥意思_python中split的用法详解_后端开发
如何用python正则表达式匹配字符串?_后端开发 用python正则表达式匹配字符串的方法:1.当匹配单个位置的字符串时,可以使用[(.+?)]正则表达式来提取:2.当连续多个位置的字符串匹配时,可 ...
- python用列表推导式_python 列表推导式使用详解
所谓的列表推导式,就是指的轻量级循环创建列表. 基本使用方式 # 创建一个0-10的列表 a = [x for x in range(11)] print(a) """ ...
- python如何强制转换数据类型_python数据类型强制转换实例详解
如果是字符串进行强制转换, 仅仅就是在原数据类型的两边套上引号 2.list : 强制转换成列表""" 如果是字符串,会把每一个字符都单独作为一个元素放到新的列表中 如果 ...
- python中importlib模块安装_Python中标准模块importlib详解
Python中标准模块importlib详解 模块简介 Python提供了importlib包作为标准库的一部分.目的就是提供Python中import语句的实现(以及__import__函数).另外 ...
- python读yaml的库_Python读取YAML文件过程详解
这篇文章主要介绍了Python读取YAML文件过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Python读取方法: import yaml ...
- python模拟银行存取款_python 模拟银行转账功能过程详解
首先画出流程图,流程图与现实代码有出入,因为刚开始画流程图的时候,有些东西没考虑进去,后来写着写着就慢慢能想起来并实现了. 另有一点经验推荐给新手朋友,如果说碰到一个项目无从下手的话,就先慢慢去写,写 ...
- python中的sep参数_Python sep参数使用方法详解
Python sep参数使用方法详解 这篇文章主要介绍了Python sep参数使用方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Pyth ...
- python爬虫框架实例项目_python爬虫框架scrapy实例详解
生成项目 scrapy提供一个工具来生成项目,生成的项目中预置了一些文件,用户需要在这些文件中添加自己的代码. 打开命令行,执行:scrapy start tutorial/ scrapy.cfg t ...
- python解释器的工作原理_Python GIL全局解释器锁详解(深度剖析)
通过前面的学习,我们了解了 Pyton 并发编程的特性以及什么是多线程编程.其实除此之外,Python 多线程还有一个很重要的知识点,就是本节要讲的 GIL. GIL,中文译为全局解释器锁.在讲解 G ...
最新文章
- echarts数据变了不重新渲染,以及重新渲染了前后数据会重叠渲染的问题
- mysql导入导出sql文件
- 未来软件是什么样呢?数据库篇(转载)
- ❤️拿到offer的成长之路与经验感悟分享❤️
- java代码god类_java – 如何编写Controller而不将其作为God对象?
- Python 标准库—— datetime(运行时间的判断)
- 两年内赚到60万美元?走近以色列在线攻击服务vDOS
- 前端实现打印页面的指定内容 + 快递面单的模板
- android系统体系结构,Android系统的五层体系结构解析
- .NET学习路线总结之LINQ查询
- 查杀linux服务器木马,定时查杀病毒并隔离
- 答应了邮件offer还能反悔吗?
- Android APP memory用量如何回收
- iOS 图标icon尺寸大全
- 苹果6s解除耳机模式_苹果耳机戴着耳朵痛
- Docker 三剑客-------docker swam,visualizer监控、stack部署集群、Portainer可视化
- 电动车进入电梯自动监控识别系统-楚纳
- java计算机毕业设计旧货网上交易系统源程序+mysql+系统+lw文档+远程调试
- RS485网关如何对施耐德PLC进行数据采集和无线通信
- java连接as400数据库,原创:用JDBC访问AS/400数据 配置与JDBC编程要点Windows系统 -电脑资料...
热门文章
- oracle 根据分隔符提取,oracle使用指定分隔符导出数据到文件
- Android fragmnet标签,在Android中为Fragment添加标签?
- C++判断字符是字母或数字
- matlab显示曲线图中某个点的坐标值
- Linux学习之嵌入式Linux编程文件IO(C语言版)
- 怎样在MySQL中显示中文,而不出现乱码?
- Linux文件空洞与稀疏文件
- vue 接口节流_vue防抖节流之v-debounce--throttle使用指南
- software engineering homework, product analysis
- 金坛区实验幼儿园服务器不稳定,2019年金坛城区部分公办幼儿园服务区划分方案(试行)...