pyecharts的wordcloud使用

1.主文件 WordCut.py

# 导入pandas,用于数据提取
import pandas as pd
# 导入jieba分词,可用于文章分词
import jieba
# 导入collection模块的Counter方法,对分完词后的词进行频数统计
from collections import Counter
# 导入wordCloud及配置模块,利用pyecharts绘制词云WordCloud,当然你也也可以安装WordCloud库进行词云绘制
from pyecharts import options as opts
from pyecharts.charts import WordCloud
from pyecharts.globals import SymbolType# 可根据你的数据集来判断是否使用pandas进行文本数据获取,如要获取爬取出来的csv文件等,下面例子展示了获取评论文件中关于某种商品(goods)的评论(str)text
# def get_text(goods):
#     path ='comments.csv'
#     with open(path,encoding='utf-8') as f:
#         data =pd.read_csv(f)
#     #商品种类
#     types = data['cat'].unique()
#     #获取该商品种类的评论文本
#     text = data[(data['cat']==goods)]['review'].values.tolist()
#     text = str(text)[1:-1]
#     print(types)
#     return text# 读取停用词
def stopwordslist(filepath):stopwords=[line.strip() for line in open(filepath,'r',encoding='utf-8').readlines()]# strip() 方法用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。# readlines()读取所有行并返回列表return stopwordsif __name__ == '__main__':# 读取样例文本(你需要在此文件中修改你自己的数据,可采用多种停用词的分割符、空格、空行进行关键词分割)with open('WordCloud_Test.txt','r',encoding='utf-8') as f:sentence = f.read()# 如果使用pandas# sentence = get_text(goods)# 读取停用词stopwords = stopwordslist(r"stopwords.txt")  # 读取停用词,原文件无转译符# 以下1.2种方法,根据自己的情况选用一种即可# # -------------------1.大段文字,需利用jieba分词----------------------------# # 如果你是一大段文字,可以采用结巴分词进行分词# sentence = jieba.lcut(sentence)  # 调用结巴分词,获得generator类型数据# # 给停用词添加换行符号# stopwords.append('\n')# # 将分词结果消除空格形成列表# dict = []# for word in sentence:#     if word not in stopwords:#         dict.append(word.replace(' ', ''))# sentence = "".join(dict)## # ------------------------------------------------------------------------# --------------2.段内有明显分割符号,仅利用停用词文件进行分割--------------------#将可能出现在停用词中的符号全部转换为空格dict = []for word in sentence:if word in stopwords:dict.append(" ")else: dict.append(word)#else: dict = sentence.split()sentence = "".join(dict)# 以空格分割字符串并形成列表dict = sentence.split()# --------------------------------------------------------------------------# 分词结果print("分词结果为:")print(dict)# 词频统计,使用Count计数方法words_counter = Counter(dict)# 将Counter类型转换为列表words_list = words_counter.most_common(2000)# 统计词频出现次数print("统计结果为:")print(words_list)#WordCloud模块,链式调用配置,最終生成htmL文件c = (WordCloud().add("",words_list,word_size_range=[15,80],word_gap=5,is_draw_out_of_bound=True,shape=" ").set_global_opts(title_opts=opts.TitleOpts(title="词云"),tooltip_opts=opts.TooltipOpts(is_show=True),).render("WordCloud_diamond.html"))# 进入html,在浏览器打开即可看到效果print("\n词云已生成!请到WordCloud_diamond.html文件中查看!")

2.停用词 stopwords.txt(更多常见中文停用词,请参考文末)

 ='',"";;,、、/”“‘’

3.1 示例文本1 WordCloud_Test.txt(示例1.大段连续文字,需利用jieba分词)

光调制解调器由发送、接收、控制、接口及电源等部分组成。数据终端设备以二进制串行信号形式提供发送的数据,经接口转换为内部逻辑电平送入发送部分,经调制电路调制成线路要求的信号向线路发送。接收部分接收来自线路的信号,经滤波、反调制、电平转换后还原成数字信号送入数字终端设备。类似于电通信中对高频载波的调制与解调,光调制解调器可以对光信号进行调制与解调。不管是模拟系统还是数字系统,输入到光发射机带有信息的电信号,都通过调制转换为光信号。光载波经过光纤线路传输到接收端,再由接收机通过解调把光信号转换为电信号。
光调制器是由微波封装的高频DFB激光二极管与APC、ATC控制电路组成E/O转换部件,利用射频微波信号直接调制超高频激光二极管产生强度调制光信号,再耦合到单模光纤中,经约5km光纤传输后,再由光解调器接收完成O/E转换,光解调器是由高速跨阻放大器的PD组件与宽带低噪声放大器组成。
该转换必须保证高线性、低失真传输,因此,要通过减小射频输入功率,增加放大器增益而完成。设计的重点在于器件的微波封装,阻抗匹配,对器件等效电路进行模拟,设计出合理共平面微带线电路,用CAD优化最终达到行波与复数共轭匹配,还要解决系统中高增益前置放大以及减小三阶交调等技术问题。

效果图1

3.2 示例文本2 WordCloud_Test.txt(示例2.仅利用停用词文件进行分割)

电子科技大学
电子科技大学
电子科技大学
中国科学院大学
西南交通大学
电子科技大学
电子科技大学
电子科技大学
武汉理工大学
西北大学
电子科技大学
吉林大学
上海大学
成都理工大学
华东师范大学
华中师范大学
华中师范大学

效果图2

参考资料:https://www.zhihu.com/question/265915035;https://zhuanlan.zhihu.com/p/105138552

附:常用中文停用词参考(主要用于方法1,根据业务需求展开,切勿盲目CV)

* 此附件参考自:https://blog.csdn.net/Youkirrr_/article/details/105376157

一
一下
一个
一些
一何
一切
一则
一则通过
一天
一定
一方面
一旦
一时
一来
一样
一次
一片
一番
一直
一致
一般
一起
一转眼
一边
一面
万一
三天两头
三番两次
三番五次
上
上下
上升
上去
上来
上述
上面
下
下列
下去
下来
下面
不
不一
不下
不久
不了
不亦乐乎
不仅
不仅仅
不仅仅是
不会
不但
不光
不免
不再
不力
不单
不变
不只
不可
不可开交
不可抗拒
不同
不外
不外乎
不够
不大
不如
不妨
不定
不对
不少
不尽
不尽然
不巧
不已
不常
不得
不得不
不得了
不得已
不必
不怎么
不怕
不惟
不成
不拘
不择手段
不敢
不料
不断
不日
不时
不是
不曾
不止
不止一次
不比
不消
不满
不然
不然的话
不特
不独
不由得
不知不觉
不管
不管怎样
不经意
不胜
不能
不能不
不至于
不若
不要
不论
不起
不足
不过
不迭
不问
不限
与
与其
与其说
与否
与此同时
专门
且
且不说
且说
两者
严格
严重
个
个人
个别
中小
中间
丰富
临
临到
为
为主
为了
为什么
为什麽
为何
为止
为此
为着
主张
主要
举凡
举行
乃
乃至
乃至于
么
之
之一
之前
之后
之後
之所以
之类
乌乎
乎
乘
乘势
乘机
乘虚
乘隙
也
也好
也就是说
也是
也罢
了
了解
争取
二来
二话不说
二话没说
于
于是
于是乎
云云
云尔
互相
些
交口
亦
产生
亲口
亲手
亲眼
亲自
亲身
人
人人
人们
人家
什么
什么样
什麽
今
今后
今天
今年
今後
介于
仍
仍旧
仍然
从
从不
从严
从中
从事
从今以后
从优
从古到今
从古至今
从头
从宽
从小
从新
从无到有
从早到晚
从未
从来
从此
从此以后
从而
从轻
从速
从重
他
他人
他们
他是
他的
代替
以
以上
以下
以为
以便
以免
以前
以及
以后
以外
以後
以故
以期
以来
以至
以至于
以致
们
任
任何
任凭
任务
企图
伙同
会
伟大
传说
传闻
似乎
似的
但
但凡
但愿
但是
何
何乐而不为
何以
何况
何处
何妨
何尝
何必
何时
何止
何苦
何须
余外
作为
你
你们
你是
你的
使
使得
使用
例如
依
依据
依照
依靠
便于
促进
保持
俺
俺们
倍加
倍感
倒不如
倒不如说
倒是
倘
倘使
倘或
倘然
倘若
借
借以
借此
假使
假如
假若
偏偏
做到
偶尔
偶而
傥然
像
儿
允许
充其极
充其量
充分
先不先
先后
先後
先生
光是
全体
全力
全年
全然
全身心
全部
全都
全面
八成
公然
兮
共同
共总
关于
其
其一
其中
其二
其他
其余
其后
其它
其实
其次
具体
具体地说
具体来说
具体说来
具有
兼之
内
再
再其次
再则
再有
再次
再者
再者说
再说
冒
冲
决不
决定
决非
况且
准备
凑巧
凝神
几
几乎
几度
几时
几番
几经
凡
凡是
凭
凭借
出于
出去
出来
出现
分别
分头
分期分批
切不可
切切
切勿
切莫
则
则甚
刚好
刚巧
刚才
别
别人
别处
别是
别的
别管
别说
到
到了儿
到处
到头
到头来
到底
到目前为止
前后
前此
前者
前进
前面
加上
加之
加以
加入
加强
动不动
动辄
勃然
匆匆
十分
千万千万
单单
单纯
即
即令
即使
即便
即刻
即如
即将
即或
即是说
即若
却
却不
原来
去
又
又及
及
及其
及时
及至
双方
反之
反之亦然
反之则
反倒
反倒是
反应
反手
反映
反而
反过来
反过来说
取得
取道
受到
变成
另
另一个
另一方面
另外
另悉
另方面
另行
只
只当
只怕
只是
只有
只消
只要
只限
叫
叫做
召开
叮咚
可
可以
可好
可是
可能
可见
各
各个
各人
各位
各地
各式
各种
各级
各自
合理
同
同一
同时
同样
后
后来
后者
后面
向
向使
向着
吓
吗
否则
吧
吧哒
吱
呀
呃
呆呆地
呕
呗
呜
呜呼
呢
周围
呵
呵呵
呸
呼哧
呼啦
咋
和
咚
咦
咧
咱
咱们
咳
哇
哈
哈哈
哉
哎
哎呀
哎哟
哗
哗啦
哟
哦
哩
哪
哪个
哪些
哪儿
哪天
哪年
哪怕
哪样
哪边
哪里
哼
哼唷
唉
唯有
啊
啊呀
啊哈
啊哟
啐
啥
啦
啪达
啷当
喂
喏
喔唷
喽
嗡
嗡嗡
嗬
嗯
嗳
嘎
嘎嘎
嘎登
嘘
嘛
嘻
嘿
嘿嘿
因
因为
因了
因此
因着
因而
固然
在
在下
在于
地
坚决
坚持
基于
基本
基本上
处在
处处
处理
复杂
多
多么
多亏
多多
多多少少
多多益善
多少
多年前
多年来
多数
多次
够瞧的
大
大不了
大举
大体上
大凡
大力
大多
大多数
大大
大家
大张旗鼓
大批
大抵
大概
大略
大约
大致
大都
大量
大面儿上
失去
奋勇
她
她们
她是
她的
好
好在
好的
好象
如
如上
如上所述
如下
如今
如何
如其
如前所述
如同
如常
如是
如期
如果
如次
如此
如此等等
如若
始而
姑且
存在
存心
孰料
孰知
宁
宁可
宁愿
宁肯
它
它们
它们的
它是
它的
安全
完全
完成
实现
实际
宣布
容易
密切
对
对于
对应
对待
对方
对比
将
将才
将要
将近
小
少数
尔
尔后
尔尔
尔等
尚且
尤其
就
就地
就是
就是了
就是说
就此
就算
就要
尽
尽可能
尽如人意
尽心尽力
尽心竭力
尽快
尽早
尽然
尽管
尽管如此
尽量
局外
居然
届时
属于
屡屡
屡次
屡次三番
岂但
岂止
岂非
川流不息
左右
巨大
巩固
差一点
差不多
己
已
已矣
已经
巴
巴巴
帮助
常常
常言说
常言说得好
常言道
平素
年复一年
并
并不
并不是
并且
并排
并无
并没
并没有
并肩
并非
广大
广泛
应当
应用
应该
庶乎
庶几
开外
开始
开展
引起
弹指之间
强烈
强调
归
归根到底
归根结底
归齐
当
当下
当中
当儿
当前
当即
当口儿
当地
当场
当头
当庭
当时
当然
当真
当着
形成
彻夜
彻底
彼
彼时
彼此
往
往往
待
待到
很
很多
很少
後来
後面
得
得了
得出
得到
得天独厚
得起
心里
必定
必将
必然
必要
必须
快要
忽地
忽然
怎
怎么
怎么办
怎么样
怎奈
怎样
怎麽
急匆匆
怪不得
总之
总是
总的来看
总的来说
总的说来
总结
总而言之
恍然
恐怕
恰似
恰好
恰如
恰巧
恰恰
恰恰相反
恰逢
您
您们
您是
惟其
惯常
意思
愤然
愿意
慢说
成为
成年累月
成心
我
我们
我是
我的
或
或则
或多或少
或是
或曰
或者
或许
战斗
截然
截至
所
所以
所在
所幸
所有
所谓
才
才能
扑通
打
打从
打开天窗说亮话
扩大
把
抑或
抽冷子
拦腰
拿
按
按时
按期
按照
按理
按说
挨个
挨家挨户
挨次
挨着
挨门挨户
挨门逐户
换句话说
换言之
据
据实
据悉
据我所知
据此
据称
据说
掌握
接下来
接着
接著
接连不断
故
故意
故此
故而
敞开儿
敢于
敢情
整个
断然
方便
方才
方能
方面
旁人
无
无宁
无法
无论
既
既往
既是
既然
日复一日
日渐
日益
日臻
日见
时候
昂然
明显
明确
是
是不是
是以
是否
是的
显然
显著
普通
普遍
暗中
暗地里
暗自
更为
更加
更进一步
曾
曾经
替
替代
最
最后
最大
最好
最後
最近
最高
有
有些
有关
有利
有力
有及
有所
有效
有时
有点
有的
有的是
有着
有著
望
朝
朝着
末##末
本
本人
本地
本着
本身
权时
来
来不及
来得及
来看
来着
来自
来讲
来说
极为
极了
极其
极力
极大
极度
极端
构成
果然
果真
某
某个
某些
某某
根据
根本
格外
次第
欢迎
欤
正值
正在
正如
正巧
正常
正是
此
此中
此后
此地
此处
此外
此时
此次
此间
毋宁
每
每个
每天
每年
每当
每时每刻
每每
每逢
比
比及
比如
比如说
比方
比照
比起
比较
毕竟
毫不
毫无
毫无例外
毫无保留地
沙沙
没奈何
没有
沿
沿着
注意
深入
清楚
满足
漫说
焉
然则
然后
然後
然而
照
照着
牢牢
特别是
特殊
特点
犹且
犹自
独自
猛然
猛然间
率尔
率然
现代
现在
理应
理当
理该
瑟瑟
甚且
甚么
甚或
甚而
甚至
甚至于
用
用来
甭
由
由于
由是
由此
由此可见
略为
略加
略微
的
的确
的话
皆可
目前
直到
直接
相似
相信
相反
相同
相对
相对而言
相应
相当
相等
省得
看
看上去
看出
看到
看来
看样子
看看
看见
看起来
真是
真正
眨眼
着
着呢
矣
矣乎
矣哉
知道
砰
确定
碰巧
离
种
积极
移动
究竟
穷年累月
突出
突然
立刻
立即
立地
立时
立马
竟然
竟而
第
第二
等
等到
等等
策略地
简直
简而言之
简言之
管
类如
精光
紧接着
累年
累次
纯粹
纵
纵令
纵使
纵然
练习
组成
经
经常
经过
结合
结果
给
绝不
绝对
绝非
绝顶
继之
继后
继续
继而
维持
综上所述
缕缕
罢了
老是
老老实实
考虑
者
而
而且
而况
而又
而后
而外
而已
而是
而言
而论
联系
联袂
背地里
背靠背
能
能否
能够
腾
自
自个儿
自从
自各儿
自后
自家
自己
自打
自身
至
至于
至今
至若
致
般的
良好
若
若夫
若是
若果
若非
范围
莫不
莫不然
莫如
莫若
莫非
获得
藉以
虽
虽则
虽然
虽说
行为
行动
表明
表示
被
要
要不
要不是
要不然
要么
要是
要求
规定
觉得
譬喻
譬如
认为
认真
认识
让
许多
论
论说
设使
设或
设若
诚如
诚然
话说
该
该当
说明
说来
说说
请勿
诸
诸位
诸如
谁
谁人
谁料
谁知
豁然
贼死
赖以
赶
赶快
赶早不赶晚
起
起先
起初
起头
起来
起见
起首
趁
趁便
趁势
趁早
趁机
趁热
趁着
越是
距
跟
路经
转动
转变
转贴
轰然
较
较为
较之
较比
边
达到
达旦
迅速
过
过于
过去
过来
运用
近几年来
近年来
近来
还
还是
还有
还要
这
这一来
这个
这么
这么些
这么样
这么点儿
这些
这会儿
这儿
这就是说
这时
这样
这次
这点
这种
这般
这边
这里
这麽
进入
进去
进来
进步
进而
进行
连
连同
连声
连日
连日来
连袂
连连
迟早
迫于
适应
适当
适用
逐步
逐渐
通常
通过
造成
遇到
遭到
遵循
遵照
避免
那
那个
那么
那么些
那么样
那些
那会儿
那儿
那时
那末
那样
那般
那边
那里
那麽
部分
都
鄙人
采取
里面
重大
重新
重要
鉴于
针对
长期以来
长此下去
长话短说
问题
间或
防止
阿
附近
限制
陡然
除
除了
除却
除去
除外
除开
除此
除此之外
除此以外
除此而外
除非
随
随后
随时
随着
随著
隔夜
隔日
难得
难怪
难说
难道
难道说
集中
需要
非但
非常
非徒
非得
非特
非独
靠
顶多
顷刻
顷刻之间
顷刻间
顺
顺着
顿时
风雨无阻
首先
马上
高低
高兴
默然
默默地

利用pyecharts的wordcloud实现词云(可结合Pandas数据分析和jieba分词)相关推荐

  1. 利用python做微信聊天记录词云分析——记录美好回忆

    目录 1 概述 2 数据准备 2.1 安卓设备 2.1.1 Root手机,安装Root Explorer 2.1.2 用Root Explorer将聊天记录的数据文件导出并存入电脑 2.1.3 对En ...

  2. java怎么画词云_Matplotlib学习---用wordcloud画词云(Word Cloud)

    画词云首先需要安装wordcloud(生成词云)和jieba(中文分词). 先来说说wordcloud的安装吧,真是一波三折.首先用pip install wordcloud出现错误,说需要安装Vis ...

  3. python词云模糊_用Python和WordCloud绘制词云(内附让字体清晰的秘笈)

    环境及模块: Win7 64位 Python 3.6.4 WordCloud 1.5.0 Pillow 5.0.0 Jieba 0.39 目标: 绘制安徽省2018年某些科技项目的词云,直观展示热点. ...

  4. python应用学习(四)——wordcloud生成词云

    python应用学习(四)--wordcloud生成词云 前言 一.准备 二.导入库 三.基本功能实现 四.爬取书评并制作词云 最后 前言 朋友最近在公众号发一些好书好剧推荐,然后我想着帮帮忙,做一个 ...

  5. python中wordcloud生成词云_python使用WordCloud生成词云

    前言 当我们想快速了解 书籍.小说.电影剧本中的内容是时,则可以采用绘制 WordCloud 词云图,显示主要的关键词,可以非常直观的看到结果 核心代码 from wordcloud import W ...

  6. python心形词云_用Python和WordCloud绘制词云

    环境及模块: Win7 64位 Python 3.6.4 WordCloud 1.5.0 Pillow 5.0.0 Jieba 0.39 目标: 绘制安徽省2018年某些科技项目的词云,直观展示热点. ...

  7. 网易云音乐评论生成Wordcloud(词云)

    网易云音乐评论生成Wordcloud(词云) 1 前言 1.1 目的 本篇主要介绍网易云音乐爬取歌曲知足的评论生成词云,可以结合新浪微博生成词云学习. 1.2 工具 Wordcloud 词云(pip ...

  8. python词云库wordcloud自定义词云制作步骤详解

    读书使人充实,讨论使人机智,笔记使人准确-.凡有所学,皆成性格. ---- (英国)培根 文章目录 wordcloud库常规方法 第三方库 读取文件 自定义绘制指定形状的词云 wordcloud库常规 ...

  9. matlab可以使用词云分析吗,利用豆瓣短评数据生成词云

    在之前的文章中,我们获得了豆瓣爬取的短评内容,汇总到了一个文件中,但是,没有被利用起来的数据是没有意义的. 前文提到,有一篇微信推文的关于词云制作的一个实践记录,准备照此试验一下. 思路分析 读文件 ...

最新文章

  1. Let's Encrypt 免费SSL配置
  2. StaicArray
  3. 分级显示HTML,SSM框架下,以tree结构分级显示数据
  4. java mvc 菜鸟_Spring MVC 简单入门
  5. 反编译工具Reflector 4.2 汉化版
  6. 从“小白”到“白帽子黑客”的实用指南
  7. routing zuul_zuul自定义SimpleHostRoutingFilter
  8. php接收get参数false是字符串,php怎么接收url参数
  9. 闭包函数 python_python 函数,闭包
  10. Python数据可视化案例二:动态更新数据
  11. 动态网页和静态网页的区别是什么?
  12. 腾讯广告算法大赛 | 这是一篇雪中送炭的赛题宝典
  13. Js与flash交互:在html页面中用js与MyReport插件交互
  14. Fragment学习(二): 管理Fragment和Fragment通讯
  15. 小米路由器3 变砖 ttl 救砖,刷入padavan
  16. 程序员的情人节「GitHub 热点速览 v.22.07」
  17. 用好这些小工具,基金可以更赚钱
  18. virt与virsh常用命令
  19. mc网站服务器设置家怎么圈地,我的世界怎么圈地 教你设置自己的领地
  20. 随笔——雪雁飞过马赛克群导

热门文章

  1. 模块与模块之间通信设计-组件设计思想
  2. C#开发BIMFACE系列18 服务端API之获取模型数据3:获取构件属性
  3. 大牛深入讲解!java语言程序设计第二版答案朱庆生
  4. 从抓包砍到接口测试,五分钟看完全过程解析,还说你不会测试?
  5. JAVA Leetcode13. 罗马数字转整数
  6. 面向接口编程之粗暴理解
  7. 图神经网络(一)图信号处理与图卷积神经网络(6)GCN实战
  8. Microsoft Office PPT 编程(VBA)学习 (不定时更新,正在学习 ing)
  9. API网关—Ocelot之服务发现
  10. anaconda 创建虚拟环境报错