毕设中期答辩,想展示一下前期数据抓取和聚类的成果,感觉词云这种形式不错,于是简单学习了一下wordcloud。
首先是安装
我是使用pip直接安装的,
pip install wordcloud
没有报错,如果有错误可以从http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud下载whl文件直接安装。
基本用法
(直接上代码吧)

# -*- coding: utf-8 -*-
__author__ = 'leilu'
#wordcloud生成中文词云from wordcloud import WordCloud
import codecs
import jieba
#import jieba.analyse as analyse
from scipy.misc import imread
import os
from os import path
import matplotlib.pyplot as plt
from PIL import Image, ImageDraw, ImageFont# 绘制词云
def draw_wordcloud():#读入一个txt文件comment_text = open('F:\program\MyProjects\clustering\\fenci1.0\wordseg_result.txt','r').read()#结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云cut_text = " ".join(jieba.cut(comment_text))d = path.dirname(__file__) # 当前文件文件夹所在目录color_mask = imread("Anne_Hathaway.png") # 读取背景图片cloud = WordCloud(#设置字体,不指定就会出现乱码font_path="HYQiHei-25J.ttf",#font_path=path.join(d,'simsun.ttc'),#设置背景色background_color='white',#词云形状mask=color_mask,#允许最大词汇max_words=2000,#最大号字体max_font_size=40)word_cloud = cloud.generate(cut_text) # 产生词云word_cloud.to_file("pjl_cloud4.jpg") #保存图片#  显示词云图片plt.imshow(word_cloud)plt.axis('off')plt.show()if __name__ == '__main__':draw_wordcloud()

用法比较简单,注释很详细。有个坑人的地方在于font_path设置,尝试了一下几种形式均报错IO error: cannot open resource

font = ImageFont.truetype("arial.ttf", 15),
FONT_PATH = os.environ.get("FONT_PATH", "/Library/Fonts/Times New Roman.ttf"),
font_path="汉仪旗黑25简.ttf",

尝试了下述形式报错TypeError: init() got an unexpected keyword argument ‘FONT_PATH’

FONT_PATH = os.environ.get("FONT_PATH", os.path.join(os.path.dirname(__file__), "simhei.ttf"))

所以最后只有代码里的那两种形式可用,其中HYQiHei-25J.ttf文件是放在代码目录下的,但同样放在代码目录下的汉仪旗黑25简.ttf就找不到,应该是不支持中文名字吧。

参考网址:
python wordcloud 对电影《我不是潘金莲》制作词云
Python word_cloud 部分文档翻译 标签云系列(二)
Python word_cloud 样例 标签云系列(三)

python——wordcloud生成中文词云相关推荐

  1. Java爬取B站弹幕 —— Python云图Wordcloud生成弹幕词云

    一 . Java爬取B站弹幕 弹幕的存储位置 如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号, ...

  2. 封装汉语自然语言处理中的常用方法(附代码:生成中文词云)

    前叙 该文章写作共花费二十分钟,阅读只需要七分钟左右,读完该文章后,你将学会使用少量代码,将中文小说,中文新闻,或者其他任意一段中文文本生成词云图 背景 在进行汉语自然语言处理时候,经常使用的几个方法 ...

  3. python学习笔记---中文词云

    python学习笔记–中文词云 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 发现词云的展示还挺有意思的,比较多的应用场景是给用户打标签,社交软件应用较多.今天随便找了一些文字电影 ...

  4. python生成中文词云的代码_[python] 基于词云的关键词提取:wordcloud的使用、源码分析、中文词云生成和代码重写...

    1. 词云简介 词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意 ...

  5. Python NLPIR2016 与 wordcloud 结合生成中文词云

    前叙 该博文继承之前的文章,进一步介绍NLPIR2016的使用,三个内容(利用NLPIR 的发现新词功能自动提取文本内的新词汇,解决worldcloud中英文混合只显示中文的问题,NLPIR与worl ...

  6. Python + wordcloud + jieba 十分钟学会生成中文词云

    前述 本文需要的两个Python类库 jieba:中文分词分词工具 wordcloud:Python下的词云生成工具 写作本篇文章用时一个小时半,阅读需要十分钟,读完该文章后你将学会如何将任意中文文本 ...

  7. Python 爬取生成中文词云以爬取知乎用户属性为例

    代码如下: # -*- coding:utf-8 -*-import requests import pandas as pd import timeimport matplotlib.pyplot ...

  8. python爬取数据生成词云_Python 爬取生成中文词云以爬取知乎用户属性为例

    代码如下: # -*- coding:utf-8 -*- import requests import pandas as pd import time import matplotlib.pyplo ...

  9. 基于python的词云生成-中文词云(指定词云形状)

    基于python的词云生成(二) 1.简介    本文是在基于python的词云生成(一)的基础上,进一步对云词进行编写,本文还使用了jieba分词对中文进行分词处理,以做出更好的效果.    jie ...

最新文章

  1. 如何将 Linux 系统转移至 LVM 卷
  2. Intel 64/x86_64/IA-32/x86处理器 - 通用指令(1) - 数据传输指令
  3. pandas删除index与某一列有重复值所在的行
  4. Future 接口介绍
  5. Win10常用命令:定时关机(shutdown命令)
  6. layer.js之回调销毁对话框
  7. 两种SOA平台建设方案比较
  8. WireGuard 的使用与配置详解
  9. 【Travis CI使用教程】如何让定制你的travis.yml配置文件
  10. 小样儿老师:我的嵌入式学习之路(一)
  11. Filebeat+Kafka+Logstash+ElasticSearch+Kibana搭建完整版
  12. dubbo问题:forbid consumer报错
  13. data单复数一样吗_data的用法
  14. Java中arraylist和数组的相互转换
  15. 【Python异常】 NPM创建Vue项目遇到ERROR command failed: npm install --loglevel error
  16. Tcpreplay让协议测试从此无忧
  17. 为 Cobalt Strike exe 木马添加图标
  18. android视频聊天软件推荐
  19. 软件工程期末复习【速成】
  20. 使用PHP创建 PowerPoint2007 文档

热门文章

  1. 第一周-基于循环谱的水声通信信号特征分析和提取
  2. 【转载】Mathematica查自带帮助
  3. 2020-3.31-26-超能陆战队-第一次需求讨论记录
  4. ubuntu 安装网络打印机(hp laserjet 3055 pcl5)
  5. PHP的json操作
  6. 普罗米修斯监控mysql数据库实战
  7. 2022年全国职业院校技能大赛(中职组)网络安全竞赛试题(9)(总分100分)
  8. App Store Review Guidelines中文版
  9. S5700交换机如何配置链路聚合
  10. 链路聚合Eth-trunk以及华为交换机配置实例