Python实现词云的库有很多,较为常见的就是wordcloud,这个库基于PIL,PIL是必不可少的,需要用的还有matplotlib和numpy。

本文使用解释器为python2.7.13 32位。

安装pip install wordcloud

使用

针对库示例做了一个简单修改,直接使用generate_from_frequencies方法,而没有使用generate()方法。有这样几个原因,generate_from_frequencies是基础的方法,generate()仍然还是要调用generate_from_frequencies方法;实验比较直接。

库的使用方法很简单,但是中文使用的话会有几个问题,一个是字符编码问题,二是字体问题,默认的字体不支持中文,因此需要加入font_path = "simfang.ttf"指定字体,这是把字体指定为同一个文件夹下的simfang.ttf。

示例:#encoding=utf-8

from os import path

from wordcloud import WordCloud

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

fre={"哈哈".decode('utf-8'): 1.2,"呵呵".decode('utf-8'):6}

wordcloud = WordCloud(font_path = "simfang.ttf").generate_from_frequencies(fre)

import matplotlib.pyplot as plt

plt.imshow(wordcloud, interpolation='bilinear')

plt.axis("off")

plt.show()

效果如下:

先抽取网页的文本,然后再进行分词,将分词结果根据频率作为字典传给generate_from_frequencies,生成词云。

更简单,比如直接抽取文章的关键词,比如博客每篇文章就有关键词,用Counter库,直接生成频率调用。

使用背景图片生成词云

对上面的代码做了一点简单的改动:#encoding=utf-8

from os import path

from wordcloud import WordCloud

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

d = path.dirname(__file__)

text = open(path.join(d, 'constitution.txt')).read().decode('utf-8')

import numpy as np

from PIL import Image

football = np.array(Image.open(path.join(d, "timg.jpg")))

fre={"哈哈".decode('utf-8'): 1.2,"呵呵".decode('utf-8'):6,"咯咯".decode('utf-8'):6,

"呵呵".decode('utf-8'):6,"咯咯".decode('utf-8'):6,

"啦啦".decode('utf-8'):1,"哦哦".decode('utf-8'):6,

"恩恩".decode('utf-8'):3,"呃呃".decode('utf-8'):6,

"饿饿".decode('utf-8'):3,"嗯嗯".decode('utf-8'):6,

"哼哼".decode('utf-8'):5,"丽丽".decode('utf-8'):6,

"咔咔".decode('utf-8'):7,"咳咳".decode('utf-8'):6,

"乐乐".decode('utf-8'):6,"呐呐".decode('utf-8'):6,

"嘎嘎".decode('utf-8'):6,"嘻嘻".decode('utf-8'):6}

#wordcloud = WordCloud(font_path = "simfang.ttf").generate(text)

wordcloud = WordCloud(font_path = "simfang.ttf",mask=football).generate_from_frequencies(fre)

import matplotlib.pyplot as plt

plt.imshow(wordcloud, interpolation='bilinear')

plt.axis("off")

plt.show()

效果如下:

更多技术请关注云海天Python教程。

python词云图片在哪儿打开_如何用python创建词云图片相关推荐

  1. python中词云图怎样变成特殊图案_如何利用python画出一个多变的词云图?(1)...

    问题描述: 如何利用python画出一个多变的词云图? 解决方法:import numpy as np import matplotlib import matplotlib.pyplot as pl ...

  2. python制作微信个人二维码_如何用Python制作微信好友个性签名词云图

    前言 上次查看了微信好友的位置信息,想了想,还是不过瘾,于是就琢磨起了把微信好友的个性签名拿到,然后分词,接着分析词频,最后弄出词云图来. 1.环境说明 Win10 系统下 Python3,编译器是 ...

  3. 'python program'.count('p')的值是_如何用Python分析泰坦尼克号生还率?

    原标题:如何用Python分析泰坦尼克号生还率? 1912年当时世界上最大的豪华客轮泰坦尼克号在处女航中撞上冰山沉没,船上船员及乘客共有2224人,只有710人生还.当灾难突然降临时,所有人的生死瞬间 ...

  4. python缩进的用途和使用方法_如何用Python减少循环层次和缩进的技巧

    本文实例分析了Python减少循环层次和缩进的技巧.分享给大家供大家参考,具体如下: 我们知道Python中冒号和缩进代表大括号,这样写已经可以节省很多代码行数,但是可以更优化,尽可能减少循环的层次和 ...

  5. python如何绘制两点间连线_如何用 Python 绘制玫瑰图等常见疫情图

    新冠疫情已经持续好几个月了,目前,我国疫情已经基本控制住了,我们会看到很多网站都提供了多种疫情统计图,今天我们使用 Python 的 pyecharts 框架来绘制一些比较常见的统计图. 1. 玫瑰图 ...

  6. python数据透视表计数去除重复_如何用Python实现数据透视表?解除你对透视表的疑惑!...

    相信接触过Excel的小伙伴都知道,Excel有一个非常强大的功能数据透视表可以自由选择不同字段,用不同的聚合函数进行汇总,并建立交叉表格,用以从不同层面观察数据.这么强大的功能,在Python中怎么 ...

  7. 用python输出一张九九乘法表_如何用python输出九九乘法表?有哪些方法?

    大家学了学习python这么久,大概都可以将python融汇贯通使用了吧,今天小编就教大家一个案例,融汇python主要的方法内容,一起来看下吧~ 概述 今天主要介绍如何用Python实现九九乘法表( ...

  8. python写入一个文件之前可以不打开_如何用python实现真正的打开和关闭文件

    file_name:file_name变量是一个包含了你要访问的文件名称的字符串值. access_mode:access_mode决定了打开文件的模式:只读,写入,追加等.所有可取值见如下的完全列表 ...

  9. python自动打开_如何用Python自动打开和关闭Tor浏览器

    我在玩网页抓取和Tor.在 我设法让它同时使用requests和{}+PhantomJS.但是,我需要打开Tor浏览器才能使脚本工作.在 这就是为什么我现在试图自动化整个过程:也就是说:自动打开Tor ...

  10. python 依据某几列累加求和_如何用Python找出OBV金叉的股票?

    话不多说先上代码,此代码经过反复验证,确认计算结果与通达信完全一致,这里周期取30日: #请使用前复权的日K线数据import os#缓存数据class SecurityData: code = '' ...

最新文章

  1. Androidの多线程之更新ui(AsyncTask)
  2. DSS转发中sdp文件的简化
  3. Oracle 创建dblink
  4. 这里有一份面筋请查收(二)
  5. kaggle中的Two-Stage比赛规则以及metadata数据的使用规定
  6. 使用回溯法解决编辑距离问题(C语言)
  7. 我与计算机作文450字,打电脑作文450字
  8. 按规律插入一个数字到数组中
  9. 为啥我的Python这么慢 - 项查找 (二)
  10. Windows启动管理器
  11. 机器视觉软包装行业质量检测解决方案
  12. 2.1KaliLinux的安装
  13. 英伟达各版本CUDA地址以及与驱动对应关系
  14. GitHub绑定阿里云域名
  15. 记录一下 git 一个项目推送到2个不同的仓库遇到的问题
  16. 蒜头君给出若干个整数,询问其中是否有一对数的和等于给定的数。
  17. 百度VR智拍再升级,3D环物拍摄一站生成
  18. CSP基础-CSP入门简介
  19. 电子爱好者都应该至少有一台示波器
  20. 百钱百鸡php穷举法,PHP经典题:百钱百鸡问题(穷举算法)

热门文章

  1. html如何设置自动点击事件,使用javascript给html元素添加click事件
  2. html5在线裁剪,HTML5和JQuery裁剪图像实时预览缩略图并上传
  3. XTUOJ-1281-Cute String
  4. 梨花带雨html音乐播放器源码,梨花带雨 - 雨陌文化传媒 - 5SING中国原创音乐基地...
  5. Tensorflow基础学习:自动求导函数tape.gradient
  6. 优秀程序员的八个好习惯
  7. 有哪些管理类书籍值得推荐?
  8. hhkb mac设置_HHKB 键盘 使用攻略 Karabiner
  9. linux usb转串口驱动报错,[驱动]内核添加USB转串口驱动支持
  10. 北京邮电大学计算机考研资料汇总