词云图是将词汇按照频率的高低显示不同大小而形成的图,可以一目了然地看出关键词。下面是词云图的python代码~

#导入需要模块

import jieba

import numpy as np

import matplotlib.pyplot as plt

from PIL import Image

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

text_road=str(input('请输入文章的路径:'))

picture_road=str(input('请输入图片的路径:'))

#加载需要分析的文章

text = open(text_road,'r',encoding='utf-8').read()

#对文章进行分词

wordlist_after_jieba = jieba.cut(text, cut_all=False)

wl_space_split = " ".join(wordlist_after_jieba)

#读取照片通过numpy.array函数将照片等结构数据转化为np-array

mask=np.array(Image.open(picture_road))

#选择屏蔽词,不显示在词云里面

stopwords = set(STOPWORDS)

#可以加多个屏蔽词

stopwords.add("
")

#创建词云对象

wc = WordCloud(

background_color="white",

font_path='/Library/Fonts/Arial Unicode.ttf',

max_words=1000, # 最多显示词数

mask=mask,

stopwords=stopwords,

max_font_size=100 # 字体最大值

)

#生成词云

wc.generate(text)

#从背景图建立颜色方案

image_colors =ImageColorGenerator(mask)

#将词云颜色设置为背景图方案

wc.recolor(color_func=image_colors)

#显示词云

plt.imshow(wc,interpolation='bilinear')

#关闭坐标轴

plt.axis("off")

#显示图像

plt.show()

#保存词云

wc.to_file('词云图.png')

下面这张图是我爬了阿里巴巴招聘网站上所有数据分析职位需求,生成的词云图,大家可以看看阿里对数据分析师的要求~

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

python词云图_Python制作词云图代码实例相关推荐

  1. python处理数据集并制作词云图

    python处理数据集并制作词云图 处理数据 使用自定义词典 去掉停用词 词频统计 绘制词云图+美化 1.处理数据 这里是老师给的新闻数据集,里面有5个类别的新闻数据,我以cars这一类为例. 将cs ...

  2. python session模块_Python requests模块session代码实例

    http协议本身是无状态的,为了让请求之间保持状态,有了session和cookie机制.requests也提供了相应的方法去操纵它们. requests中的session对象能够让我们跨http请求 ...

  3. python结构体_Python实现结构体代码实例

    Python实现结构体代码实例 这篇文章主要介绍了Python实现结构体代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 # python 使 ...

  4. python画烟花_python烟花效果的代码实例

    天天敲代码的朋友,有没有想过代码也可以变得很酷炫又浪漫?今天就教大家用Python模拟出绽放的烟花,工作之余也可以随时让程序为自己放一场烟花秀. 这个有趣的小项目并不复杂,只需一点可视化技巧,100余 ...

  5. python中词云图是用来描述_Python制作词云图代码实例

    词云图是将词汇按照频率的高低显示不同大小而形成的图,可以一目了然地看出关键词.下面是词云图的python代码- #导入需要模块 import jieba import numpy as np impo ...

  6. Python爬虫入门-python之jieba库制作词云图

    在简书上看了很多人分享高大上的词云图的制作,在研究了一番之后,决定自己也动手试一试,奈何小白一个,中间碰到问题老是卡壳老半天,写一写制作过程,啥什么忘了我再来看看. 在看了 向右奔跑大哥的文章后,知道 ...

  7. python随机验证码_Python生成随机验证码代码实例解析

    生成6位随机验证码的3种实现方式如下: 1. 简单粗暴型:所有数字和字母都放入字符串: 2. 利用ascii编码的规律,遍历获取字符串和数字的字符串格式: 3. 引用string库. 方法1代码: i ...

  8. python图像文件压缩_python实现图片压缩代码实例

    前言 项目中大量用到图片加载,由于图片太大,加载速度很慢,因此需要对文件进行统一压缩 一:导入包 from PIL import Image import os 二:获取图片文件的大小 def get ...

  9. python画统计图代码_python读取excel某列内容制作词云图并用条形图统计词频

    有的时候我们把数据整理收集整理到excel中,那么要把excel中的某列文本数据制作词云图怎么做呢? 从最简单的说起. 最简单的词云图就是这种,英文的,不读取文件,不指定背景形状图片,不指定字体. # ...

  10. python爬取豆瓣小组_Python 爬虫实例+爬取豆瓣小组 + wordcloud 制作词云图

    目标 利用PYTHON爬取如下图中所有回答的内容,并且制作词云图. 用到的库 import requests # import json from PIL import Image from pyqu ...

最新文章

  1. 刷新后控制TAB键到下一个控件
  2. java动态代理和cglib动态代理
  3. 实战_23_高可用负载均衡集群的实现(Mycat+ZK +HAProxy + Keepalived)
  4. apache web_Web发明家预测文化将发生变化,Apache推动一半的互联网发展,等等
  5. day 7-13 数据库的数据类型
  6. ibatis java_iBatis.java
  7. c++与unreal 的uc脚本交互
  8. php curl 下载文件
  9. 管程由哪三部分组成_换热器是几壳程?几管程的?
  10. 新偶像时代:被直播重构的粉丝经济和社交平台
  11. dell机架式服务器型号,戴尔R910机架式服务器
  12. 节奏大师-触动脚本(源码)
  13. 涂鸦小程序——为自己的人生画上一笔
  14. 如何开发Android安卓RFID读卡APP
  15. 洛谷 P1162填图颜色
  16. html立体图表样式,项目进度可视化图表
  17. IE10访问Apache2.4卡死的问题
  18. 科林明伦杯哈尔滨理工大学第八届程序设计竞赛——Hrbust-2378 小H的问题(模拟)
  19. 安装opencv3.4遇到Download: opencv_ffmpeg.dll、ippicv等失败的解决方法
  20. win10中插入的耳机没有耳麦如何使用笔记本本身的麦克风

热门文章

  1. 实现元素水平垂直居中的4种方法
  2. 怎样用计算机控制插座,电脑顺序开、关机控制插座 二
  3. 71 Climbing staring C++
  4. 3D 文件格式 - 对应厂商
  5. vip地址能ping不通_ping不通地址
  6. matlab中disparity,matlab disparity函数
  7. slideup_jQuery slideUp,slideDown,slideToggle
  8. PROC FORMAT过程
  9. 拼图 html5,HTML5 拼图游戏
  10. sizeof 知多少