Python生成中文词云图

什么是词云?

首先,什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。

本文目的:

本篇博客主要介绍利用python的wordcloud包实现生成中文词云。可指定特定的词云形状和颜色。
Python生成英文词云图请参见博客Python生成英文词云图。

电脑环境要求:

安装好Pycharm或者Anaconda。建议同时安装Pycharm和Anaconda,并且将Pycharm配置好Anaconda,这样就不用手动安装wordcloud包和jieba分词包等了,以后也不用安装其他一些常用的包了。
安装Pycharm和Anaconda请参见Pycharm中使用Anaconda。

代码实现:

#coding=utf-8
#Version:python3.6.0
#添加自定义分词import jieba
from os import path  #用来获取文档的路径#词云
from PIL import Image
import numpy as  np
import matplotlib.pyplot as plt
#词云生成工具
from wordcloud import WordCloud,ImageColorGenerator
#需要对中文进行处理
import matplotlib.font_manager as fm#背景图
bg=np.array(Image.open("tuoyuan.jpg"))#获取当前的项目文件加的路径
d=path.dirname(__file__)
#读取停用词表
stopwords_path='stopwords.txt'
#添加需要自定以的分词
# jieba.add_word("叶文洁")#读取要分析的文本
text_path="ziranyuyan.txt"
#读取要分析的文本,读取格式
text=open(path.join(d,text_path),encoding="utf8").read()
#定义个函数式用于分词
def jiebaclearText(text):#定义一个空的列表,将去除的停用词的分词保存mywordList=[]#进行分词seg_list=jieba.cut(text,cut_all=False)#将一个generator的内容用/连接listStr='/'.join(seg_list)#打开停用词表f_stop=open(stopwords_path,encoding="utf8")#读取try:f_stop_text=f_stop.read()finally:f_stop.close()#关闭资源#将停用词格式化,用\n分开,返回一个列表f_stop_seg_list=f_stop_text.split("\n")#对默认模式分词的进行遍历,去除停用词for myword in listStr.split('/'):#去除停用词if not(myword.split()) in f_stop_seg_list and len(myword.strip())>1:mywordList.append(myword)return ' '.join(mywordList)
text1=jiebaclearText(text)
#生成
wc=WordCloud(background_color="white", #设置背景为白色,默认为黑色width=990,              #设置图片的宽度height=440,              #设置图片的高度margin=10,               #设置图片的边缘max_font_size=50,random_state=30,font_path='C:/Windows/Fonts/simkai.ttf'   #中文处理,用系统自带的字体).generate(text1)
#为图片设置字体
my_font=fm.FontProperties(fname='C:/Windows/Fonts/simkai.ttf')
#产生背景图片,基于彩色图像的颜色生成器
image_colors=ImageColorGenerator(bg)
#开始画图
plt.imshow(wc)
#为云图去掉坐标轴
plt.axis("off")
#画云图,显示
#保存云图
wc.to_file("tuoyuan3.png")

生成的中文词云图:

参考资料:

1、基于python的词云生成(二)
2、Pycharm中使用Anaconda

Python生成中文词云图(一):可指定特定的词云形状和颜色。相关推荐

  1. Python生成中文词云图(二):不可指定词云特定的形状和颜色。

    Python生成中文词云图(二):不可指定词云特定的形状和颜色. 什么是词云? 首先,什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关 ...

  2. python词云图代码示例 无jieba_【词云图】如何用python的第三方库jieba和wordcloud画词云图...

    一直想学一下如何用python画词云图,觉得很好玩,本文就写一下我自己的一些尝试. 1.提前准备 一般准备以下四样就可以啦. 第一,电脑安装python,我装的是3.6. 第二,安装第三方库jieba ...

  3. python生成中文词云图

    jieba库是一个非常优秀的中文分词软件,其中一个应用就是来完成一个词云图的设计 首先你需要准备这些库 import jieba import matplotlib.pyplot as plt imp ...

  4. python生成中文词云的代码_[python] 基于词云的关键词提取:wordcloud的使用、源码分析、中文词云生成和代码重写...

    1. 词云简介 词云,又称文字云.标签云,是对文本数据中出现频率较高的"关键词"在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意 ...

  5. python 可以用excel做词云图嘛_word_cloud-用Python之作个性化词云图

    原标题:word_cloud-用Python之作个性化词云图 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 对商业 ...

  6. python生成xml文件工具_Python根据指定文件生成XML的方法

    因项目需要根据指定格式的文件生成XML标注文件,可以方便使用LabelImg打开进行编辑和查看.其原始文件默认使用逗号进行分隔,如下所示: 第1个值:原始图片中切图小文件,以AIpng_x,其中x代表 ...

  7. python生成中文、字母、数字等字符图片

    代码功能: 生成指定颜色.大小.字体的中文.字母.数字等字符图片 代码 from PIL import Image, ImageDraw, ImageFont import random# 设置背景颜 ...

  8. 怎样用python生成中文字符画_如何利用Python实现图片转字符画详解

    本篇文章主要介绍了Python实现图片转字符画的示例,小编觉得挺不错的,现在分享给大家,也给大家做个参考.一起跟随小编过来看看吧 字符画真的很有意思,将图片中的像素用字符代替,就生成了字符画. 但是像 ...

  9. python生成中文字符画_在线汉字转为字符字,字符字生成器,在线生成字符字

    待转化的文字: 字体大小: 背景字符: 前景字符: 字体:仿宋 方正姚体 微软黑体 华文行楷 华文新魏 隶书 幼圆 黑体 文字方向:横向 纵向 M中 转换后的文字: ◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇◇ ...

最新文章

  1. react 当前时间_如何使用 useRef 优化 React 性能问题
  2. 5GS 协议栈 — PFCP 协议 — BAR 缓存行为规则
  3. C++ 性能剖析 (四):Inheritance 对性能的影响
  4. android往天气接口里面传城市,Android使用中国天气网API数据通过城市名称获取天气情况...
  5. 【经典回放】多种语言系列数据结构算法:串(C版)
  6. android 来电拒接_[系统漏洞]模拟耳机广播实现来电自动接听和拒接
  7. html左边图片右边文字_有了这些网站,不用PS也可以做出文字云效果
  8. 1.2Sakura语法基础篇
  9. 我的世界服务器java启动脚本_教程/服务器启动脚本
  10. mysql中字段长度到底是字符数还是字节数?
  11. matlab 反走样,如何在python中使用Matlab的imresize
  12. C++编译时提示类型未定义(undefined)的可能原因
  13. SAP系统md04例外消息说明
  14. golang进程启动及监控
  15. 基于ERP系统的仓储管理系统?
  16. 神奇了!AR技术可测量实物体积!
  17. zabbix mysql 密码_zabbix小结(十二)zabbix密码修改
  18. python爬虫网页文字游戏_python爬虫下载某网站156个网页小游戏素材
  19. 【LeetCode】Day119-找到小镇的法官可达所有点的最少点数目
  20. git之branch分支增删改查、切换、更新远程代码到本地仓库

热门文章

  1. tiny4412学习(二)之移植linux-4.x支持设备树
  2. 关于DCDC模块电源滤波的问题 (输出正负±5V)及X,Y安规电容区别
  3. 2021-11-25 Google Chrome浏览器下载/安装
  4. 2021考研历程总结
  5. 低代码开发平台领域有哪些新的发展趋势?
  6. 5-AT命令交互之-APN
  7. 给自己的微信小程序客服回话添加头像!
  8. ros(Melodic)记录
  9. 关于读写论文的那些神网站
  10. 【ZZULIOJ】1089: 阶乘的最高位