版权声明:转载附链接哦。https://blog.csdn.net/weixin_43886356/article/details/86711292

此篇教程划分为两种情况,原文本为汉字和原文本为英文,教程最后有实例提供参考。

Part1 原文本为汉字

若原文本为汉字,则需要指定WordCloud方法中的font_path为要使用的汉字字体路径,因为默认的wordcloud字体DroidSansMono.ttf 不支持汉字,且指定的字体文件需要放在wordcloud安装的文件夹下,我电脑中的路径为D:\Program Files\Python37\Lib\site-packages\wordcloud\simhei.ttf

否则生成的词云图片上会是彩色方框,而不会出现汉字。

源代码如下:

import jieba

from wordcloud import WordCloud

from scipy.misc import imread

mask= imread('picture.png') #此处为使用遮罩的情况,即生成的词云形状

file = open("sample.txt", "r", encoding='utf-8')

content = file.read()

words=jieba.lcut(content) # 使用jieba进行精确分词获取词语列表

txt=" ".join(words) #使用空格拼接获得字符串

wordcloud = WordCloud(background_color="white", # 词云图片的背景颜色

width=800, # 词云图片的宽度,默认400像素

height=600, # 词云图片的高度,默认200像素

font_path='D:\Program Files\Python37\Lib\site-packages\wordcloud\simhei.TTF', # 词云指定字体文件的完整路径

max_words=200,  #词云图中最大词数,默认200

max_font_size=80, # 词云图中最大的字体字号,默认None,根据高度自动调节

min_font_size=20, # 词云图中最小的字体字号,默认4号

font_step=1, # 词云图中字号步进间隔,默认1

mask=mask, # 词云形状,默认None,即方形图

).generate(txt) # 由txt文本生成词云

wordcloud.to_file("sample.png") # 将词云图保存为名为sample的文件

Part2 原文本为英文

from wordcloud import WordCloud

from scipy.misc import imread

mask= imread('picture.png') #此处为使用遮罩的情况,即生成的词云形状

file = open("sample.txt", "r", encoding='utf-8')

txt = file.read()

wordcloud = WordCloud(background_color="white", # 词云图片的背景颜色

width=800, # 词云图片的宽度,默认400像素

height=600, # 词云图片的高度,默认200像素

font_path='D:\Program Files\Python37\Lib\site-packages\wordcloud\simhei.TTF', # 词云指定字体文件的完整路径

max_words=200, #词云图中最大词数,默认200

max_font_size=80, # 词云图中最大的字体字号,默认None,根据高度自动调节

min_font_size=20, # 词云图中最小的字体字号,默认4号

font_step=1, # 词云图中字号步进间隔,默认1

mask=mask, # 词云形状,默认None,即方形图

).generate(txt) # 由txt文本生成词云

wordcloud.to_file("sample.png") # 将词云图保存为名为sample的文件

mask为遮罩,限定词云的形状,选择图片作为遮罩,图片中白色的部分不显示词,非白色部分显示词。

若遮罩图片为png格式,则使用scipy库:

from scipy.misc import imread

mask= imread('picture.png')

若遮罩图片为jpg格式,则使用matplotlib库:

import matplotlib.pyplot as plt

mask= plt.imread('psb.jpg')

Part3 运行实例

不使用遮罩源代码如下:

运行结果:

使用遮罩:

遮罩图片picture.png如下:

源代码如下:

运行结果如下:

python词云形状为六边形怎么做_python第三方库wordcloud绘制任意形状词云教程相关推荐

  1. 霍兰德人格分析:利用Python第三方库matplotlib绘制雷达图

    美国约翰霍普金斯大学霍兰德教授认为,个人职业兴趣特性与职业之间应有一种内在的对应关系.根据兴趣的不同,人格可分为研究型(I).艺术型(A).社会型(S).企业型(E).传统型(C).现实型(R)六个维 ...

  2. python + wordcloud实现任意形状标签云

    公司最新App--AirOh已经上线三个多月,积累了首批原始用户.后台分别对用户和功能进行了统计分析,得到了丰富的数据结果.除了常规的表格.曲线.柱状图及污染热图等展示形式,亦对数据进行标签化处理,得 ...

  3. 优秀的词云展示第三方库——wordcloud

    概述 wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本. 库安装 网络正常情况下命令行输入pip install wordcloud 基本使 ...

  4. python库源码分析_python第三方库Faker源码解读

    源码背景 Faker是一个Python第三方库,GITHUB开源项目,主要用于创建伪数据创建的数据包含地理信息类.基础信息类.个人账户信息类.网络基础信息类.浏览器信息类.文件信息类.数字类 文本加密 ...

  5. python官网如何下载wordcloud_分享一种下载python第三方库wordcloud库的一种方法

    这周我在学习python过程中,我接触到了wordcloud库,因为它是python的第三方库,需要通过下载才能够继续使用.因为上周在学习下载第三方库jieba库后,我已经知道了下载python的第三 ...

  6. python第三方库jieba下载_Python第三方库____jieba

    jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个词语 jieba是优秀的中文分词第三方库,需要额外安装  (pip install jieba) jieba库提供三种分词模式,最简单只 ...

  7. Windows下Python安装及pycharm,pip下载和安装第三方库

    Python是方便的编程语言,基于其的文本处理工具非常方便. 1. python安装不详细赘述,非常方便,但是安装好后需要在系统中设置环境变量,具体进入步骤为"我的电脑--属性--高级系统属 ...

  8. 用于计算机视觉领域的python第三方库是什么_大量Python开源第三方库资源分类整理,含菜鸟教程章节级别链接...

    Python是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明.因其具有丰富和强大的库,它常被称为胶水语言,能够把用其它语言制作的各种模块(尤其是C/C ...

  9. 用于安装python第三方库的工具是_Python第三方库安装

    Python有一个全球社区:在这里,我们可以搜索Python第三方库的任何话题.PyPI的全称是Python包指数指Python包的指数.它是由PSF (Python软件基金会)和显示全球Python ...

最新文章

  1. java位运算符取反_java运算符
  2. java gt_JAVA泛型知识--gt; lt;? extends Tgt;和lt;? super Tgt;
  3. win10电脑开机密码忘了怎么办_Mac电脑忘记开机密码怎么办?Mac开机密码快速恢复方法...
  4. python-opencv学习笔记(三)
  5. 代理网络中安装tomcat的注意事项
  6. Linux命令:SAMBA配置与win10共享
  7. python中startswith()函数的用法
  8. Docker日志自动化: ElasticSearch、Logstash、Kibana以及Logspout
  9. 三级java_java三级(最全的题库).doc
  10. 创业怎么写商业计划书?
  11. js监听移动端手机横竖屏事件
  12. ACM比赛代码文件读写调试方案
  13. mcreator安装教程
  14. 如何实现微信和淘宝的扫码登录 ?
  15. 花间一壶酒,独酌无相亲。—第四天
  16. 华硕笔记本没有无线服务器,华硕电脑搜不到wifi怎么回事
  17. BPMN在线流程设计器
  18. 2022年十大数据泄露事件
  19. 乔布斯走后的日子:苹果盛世暗藏危机
  20. 差旅费用管理:苦海无边,Concur是岸

热门文章

  1. 华丰科技将于12月13日上会:业绩波动明显,海通证券等为股东
  2. 西电捷通: Windows LWF驱动如何兼容TISec客户端
  3. 这五个资源超多的资源网站 请务必珍藏起来
  4. 原来SqlSession只是个甩手掌柜?真香
  5. vue初始化ajax方法,vue问题辑录-页面初始化ajax
  6. java只有高跟很高_个子155cm的你,身上穿准“这三样”,增高效果比穿高跟鞋好!...
  7. 给刚工作不久的你:你可一定要加油加油加油加油撑住啊
  8. 良心SQL注入手工教程(看完血虐sqlilabs全关)
  9. IOS文本框事件--委托方式实现
  10. 论文:Exploring Phrase Grounding without Training: Contextualisation and Extension to Text-Based Image