一、词云

“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

二、python实现中文词云显示

1、需要准备的python库包括,matplotlib,jieba和wordcloud,可以通过pip install ---进行安装。

2、代码实现

#-*-coding:utf-8-*-###生成txt文件的词云import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jiebatext = open("zeTianji.txt","rb").read()
#结巴分词
wordlist = jieba.cut(text,cut_all=True)
wl = " ".join(wordlist)
#print(wl)#输出分词之后的txt#把分词后的txt写入文本文件
#fenciTxt  = open("fenciHou.txt","w+")
#fenciTxt.writelines(wl)
#fenciTxt.close()#设置词云
wc = WordCloud(background_color = "black", #设置背景颜色#mask = "图片",  #设置背景图片max_words = 2000, #设置最大显示的字数#stopwords = "", #设置停用词font_path = "fangsong_GB2312.ttf",#设置中文字体,使得词云可以显示(词云默认字体是“DroidSansMono.ttf字体库”,不支持中文)max_font_size = 50,  #设置字体最大值random_state = 30, #设置有多少种随机生成状态,即有多少种配色方案)
myword = wc.generate(wl)#生成词云#展示词云图
plt.imshow(myword)
plt.axis("off")
plt.show()

说明:wordcloud 默认使用了DroidSansMono.ttf 字体库,要显示中文需要添加一个支持中文的ttf 字库;

代码中用到了字体:仿宋-GB2312字体

3、效果截图

以下显示的是《择天记》中的一章内容。

三、参考链接

http://python.jobbole.com/87496/?repeat=w3tc

python中文词云生成相关推荐

  1. python中文词云生成_Python 词云生成

    图片来自网络所谓"词云"就是对网络文本中出现频率较高的"关键词"予以视觉上的突出,形成"关键词云层"或"关键词渲染",从 ...

  2. 基于python的词云生成-中文词云(指定词云形状)

    基于python的词云生成(二) 1.简介    本文是在基于python的词云生成(一)的基础上,进一步对云词进行编写,本文还使用了jieba分词对中文进行分词处理,以做出更好的效果.    jie ...

  3. python词云需要导入什么包_[python] 词云:wordcloud包的安装、使用、原理(源码分析)、中文词云生成、代码重写...

    词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思.常见于博客. ...

  4. python生成中文词云的代码_[python] 基于词云的关键词提取:wordcloud的使用、源码分析、中文词云生成和代码重写...

    1. 词云简介 词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意 ...

  5. python爬虫+词云生成小说简介

     我每个月都要读一本书写一个书评,平时写书评用的插图都是在网上找的图,前段时间觉得这样不够炫酷要做一点炫酷的东西.最开始的想法是提取小说中的高频词做成词云,实践下来发现效果并不理想,主要是有吸引力的词 ...

  6. Python实现词云生日祝福图片,快拿去给心爱的人送上祝福

    前言 程序员也是懂浪漫的,比如说很常见的一个生成玫瑰花的小项目,就可以哄自己喜欢的人开心好久,那么如果能够在她生日的时候,送上一个有词云组成的生日祝福,对方肯定会更加的开心,程序员也可以稳稳地拿捏住自 ...

  7. 圣诞节快到啦,我可以有python圣诞树词云吗?(中英文版及代码)

      一周以后就是圣诞节啦,作为程序猿的你,--   好了,前言结束(哈哈哈自行脑补),下面是代码: ps: 所有素材掩码已经打包好,文末领取    1 依赖库安装   程序用到了wordcloud.P ...

  8. Python + wordcloud + jieba 十分钟学会生成中文词云

    前述 本文需要的两个Python类库 jieba:中文分词分词工具 wordcloud:Python下的词云生成工具 写作本篇文章用时一个小时半,阅读需要十分钟,读完该文章后你将学会如何将任意中文文本 ...

  9. python制作中文词云_Python如何生成词云(详解)

    前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图: 效果图一: 效果图二: 根据效果图分析的还是比较准确的,小说中的主人公就是"程理" ...

最新文章

  1. 一个基于J2EE的web应用程序运行起来需要什么?
  2. 湖北工业大学c语言作业答案,湖北工业大学C语言PPT
  3. 文本省略并显示省略号
  4. 谭浩强课后题之----输出10个数中最大的
  5. 今日推荐:如何设计一个支撑数亿用户的系统
  6. sql读取excel数据_Python 读取 Excel 数据,并插入到MySQL
  7. ioprofile mysql_使用pt-ioprofile对MySQL作IO剖析
  8. pandas 选取第一行_用pandas中的DataFrame时选取行或列的方法
  9. MySQL Date and Time Functions(日期和时间)
  10. OPEN(SAP) UI5 学习入门系列之四:更好的入门系列-官方Walkthrough
  11. 【Vegas原创】导入结构一致表的SQL语句
  12. 微软发布.NET 6,NET Framework的最新版本现已推出
  13. 中国Linux内核开发者大会
  14. Android Studio 更换个性化主题
  15. 网页浏览速度慢的排查原因
  16. 软件开发一般学什么?
  17. 怎么分析淘宝店铺市场竞争选品 淘宝产品选品具体该怎么做
  18. 3D Vision Rebuttal
  19. macOS Monterey升级
  20. E.164号码,E.214号码,E.212号码

热门文章

  1. 上海美女和德国富商行骗富豪圈 3年净赚3亿
  2. Leetcode.912 排序数组
  3. 关于spyder闪退打不开的解决方法
  4. Java堆内存溢出解决方案
  5. 黑科技读写内存,修改植物大战僵尸内存值
  6. xunsearch详细教程
  7. Spark:基于PySpark的逻辑回归和决策树模型对泰旦尼克号幸存者预测的机器学习流程
  8. SVM推导过程注解(一)
  9. matlab中找出能被5整除的数,matlab~~求解1到m以内,所有能被3整除的数。
  10. 老黄历java_老黄历.html