词云图是将词汇按照频率的高低显示不同大小而形成的图,可以一目了然地看出关键词。下面是词云图的python代码~

#导入需要模块

import jieba

import numpy as np

import matplotlib.pyplot as plt

from PIL import Image

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

text_road=str(input('请输入文章的路径:'))

picture_road=str(input('请输入图片的路径:'))

#加载需要分析的文章

text = open(text_road,'r',encoding='utf-8').read()

#对文章进行分词

wordlist_after_jieba = jieba.cut(text, cut_all=False)

wl_space_split = " ".join(wordlist_after_jieba)

#读取照片通过numpy.array函数将照片等结构数据转化为np-array

mask=np.array(Image.open(picture_road))

#选择屏蔽词,不显示在词云里面

stopwords = set(STOPWORDS)

#可以加多个屏蔽词

stopwords.add("
")

#创建词云对象

wc = WordCloud(

background_color="white",

font_path='/Library/Fonts/Arial Unicode.ttf',

max_words=1000, # 最多显示词数

mask=mask,

stopwords=stopwords,

max_font_size=100 # 字体最大值

)

#生成词云

wc.generate(text)

#从背景图建立颜色方案

image_colors =ImageColorGenerator(mask)

#将词云颜色设置为背景图方案

wc.recolor(color_func=image_colors)

#显示词云

plt.imshow(wc,interpolation='bilinear')

#关闭坐标轴

plt.axis("off")

#显示图像

plt.show()

#保存词云

wc.to_file('词云图.png')

下面这张图是我爬了阿里巴巴招聘网站上所有数据分析职位需求,生成的词云图,大家可以看看阿里对数据分析师的要求~

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持聚米学院。

python中词云图是用来描述_Python制作词云图代码实例相关推荐

  1. python自动化爬取网易云歌词并制作词云图

    图片需要用透明图片:这就体现你的搜索能力了 import jieba # 中文分词库 import wordcloud # 词云图库 import imageio # 图像模块#读取图片 file = ...

  2. python爬虫框架Scrapy采集数据,并制作词云图分析!

    scrapy介绍 Scrapy 是一套基于Twisted.纯python实现的异步爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,相当的方便- 整体架构和组 ...

  3. python win32转pdf 横版竖版_python word转pdf代码实例

    原理 使用python win32 库 调用word底层vba,将word转成pdf 安装pywin32 pip install pywin32 python代码 from win32com.clie ...

  4. Python制作词云图根据蒙板图像确定形状和文字颜色

    问题描述:制作词云图,根据蒙板图像确定词云图形状,根据蒙板图像中像素的颜色确定词云图中相同位置上文字的颜色. 阅读原文

  5. python爬取豆瓣小组_Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图

    目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import json from PIL import Image from pyqu ...

  6. python画统计图代码_python读取excel某列内容制作词云图并用条形图统计词频

    有的时候我们把数据整理收集整理到excel中,那么要把excel中的某列文本数据制作词云图怎么做呢? 从最简单的说起. 最简单的词云图就是这种,英文的,不读取文件,不指定背景形状图片,不指定字体. # ...

  7. e分钟带你利用Python制作词云图

    随着大数据时代的来临,数据分析与可视化,显得越来越重要,今天给小伙伴们带来一种最常见的数据可视化图形-词云图的制作方法. 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语 ...

  8. python处理数据集并制作词云图

    python处理数据集并制作词云图 处理数据 使用自定义词典 去掉停用词 词频统计 绘制词云图+美化 1.处理数据 这里是老师给的新闻数据集,里面有5个类别的新闻数据,我以cars这一类为例. 将cs ...

  9. Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图

    目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import jsonfrom PIL import Image from pyque ...

最新文章

  1. Linux上部署、安装nodejs
  2. python xpath语法-Python爬虫之XPath语法
  3. Android自定义View实现滴滴验证码输入框效果
  4. windows socket----select模型
  5. Boost::context模块callcc的jump测试程序
  6. 【Linux】Linux中常用操作命令
  7. CSS Hide(隐藏元素)
  8. Java正常关闭资源的方式
  9. 静态与实例变量的区别——(面试题)
  10. oracle10g 数据源管理器找不到应用程序,可能是程序没有正确安装问题解决
  11. 蓝宝石会升级bios吗_浴火重生 蓝宝石HD7950 Flex测BIOS提速
  12. 获取所有QQ好友列表以及好友信息
  13. python报错: list object has no attribute shape的解决
  14. c语言编程温度转换源,c语言编程,将华氏温度转换成摄氏温度。转换公式为:c=5/9 * (f-32),其中f代表华氏温度...
  15. 女孩取名:带日字旁好听有内涵的女孩名字
  16. 技术中台的作用是什么,在什么情况下才有必要做技术中台?
  17. 把 14 亿人都拉到一个微信群,在技术上能实现吗?
  18. 编程(代码、软件)规范(适用嵌入式、单片机、上位机等)
  19. 阿里智能化接口测试平台--暴雪
  20. freeswitch智能语音开发之ASR

热门文章

  1. No input file specified.问题的解决
  2. Vue-router 报NavigationDuplicated的可能解决方案
  3. 机器学习中常见的过拟合解决方法
  4. Mac系统git clone 慢【解决方案】
  5. Gitlab+Gerrit+Jenkins完整对接
  6. Weex控制Android返回键解决方案
  7. P2241 统计方形(数据加强版)
  8. Unity3D 多平台 预编译 宏定义
  9. PHP 简单的数字过滤函数
  10. 领域驱动设计实践(一)(转)