python分词、词频统计以及根据词频绘制词云
直接上代码
#导入需要的库
from wordcloud import WordCloud
import collections
import jieba
import matplotlib.pyplot as plt
#首先打开待处理文本
with open("政府工作报告.txt","r",encoding='utf-8') as f:s = f.read()f.close()
#进行文本的初步处理,主要是去除一些不用统计的符号
t = ''
x = ',。?、‘’“”;:)(——'
for i in s:if i not in x:t+=i
#将初步处理后的文本另存(看看处理效果,可去除这一步)
with open("政府工作报告_去除符号.txt",'w') as f:f.write(t)f.close()
#使用jieba进行分词
with open("政府工作报告_去除符号.txt",'r') as f:deal_s = f.read()f.close()
a = jieba.lcut(deal_s)
#对分词之后的结果进行简单筛选,比如很多的单字是没有意义的,直接排除在外
deal_a=[]
for i in a:if len(i)>1:deal_a.append(i)
#使用collections库的Counter函数进行词频统计
x = dict(collections.Counter(deal_a))
#绘制词云,以下r'C:\Windows\fonts\simfang.ttf'非常重要,这个是选择可以正常显示中文的字体,必须添加,不然结果会是一堆方块,后面的参数根据需求更改
wc = WordCloud(r'C:\Windows\fonts\simfang.ttf',max_words=500,background_color="white",width = 1500,height= 960,margin= 10)
#fit_words(参数)是WordCloud的子函数,用于根据词频绘制词云,这里的参数一般是字典类型变量
t = wc.fit_words(x)
t.to_image().save('政府工作报告词频词云.png')
print("词云绘制已完成。")
#以下是生成的词云显示测试:
plt.imshow(wc) # 显示词云
plt.axis('off') # 关闭坐标轴
plt.show() # 显示图像
结果如下:当然了这个绘制的有点粗糙,锦上添花自己加油啦hahaahh
另外有什么问题可以直接在评论区提出来,大家一起讨论。
完结撒花~~~
python分词、词频统计以及根据词频绘制词云相关推荐
- Hadoop的改进实验(中文分词词频统计及英文词频统计)(1/4)
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...
- Hadoop的改进实验(中文分词词频统计及英文词频统计)(4/4)
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...
- Hadoop的改进实验(中文分词词频统计及英文词频统计)(2/4)
声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...
- 使用Python做中文分词和绘制词云
使用Python做中文分词和绘制词云 李小璐出轨云词图 作为一门编程语言,Python的编写简单,支持库强大,应用场景多,越来越多的人开始将它作为自己的编程入门语言. Python一个比较重要的场景是 ...
- Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列)
Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列) 一.环境 二.实现步骤 1.数据 2.主函数 3.第一个MapReduce Map Reduce 4.第二个MapRedu ...
- 用python做词云 包含:处理词云形状+分词+绘制词云
用python制作词云 包含:处理词云形状+分词+绘制词云 以下代码不超过100行 1.处理词云形状 你可能想把词云做成不同的形状,例如方形.圆形,甚至更复杂的,例如一个人体形状. 首先选一张背景为纯 ...
- 【Python】文本情感分析及绘制词云
码字不易,喜欢请点赞!!! 这篇文章主要分享了使用Python来对文本数据进行情感分析以及绘制词云. 主要步骤包括: 1.文本预处理 2.文本分词 3.去除停用词(这里设置为单个词和一些常见的停用词) ...
- python中用来绘制词云的第三方库_如何用Python绘制词云?
如果希望能够看懂代码,那么需要具备: 1. 了解Python语言的语法结构 2. 了解Python语言的标准包.第三方包的区别 3. Python代码基本是英文,意思一定程度上代表了它要做的事,懂英文 ...
- python红楼梦绘制词云形状图_python数据挖掘实战笔记——文本挖掘(5):词云美化之绘制《红楼梦》词云图...
词云图的美化就是把词云图的背景和颜色进行美化,以<红楼梦>词云图为例,如下所示: 首先绘制词云,跟之前的代码操作一样: import jieba import numpy import c ...
- python默认词云颜色_Python 绘制词云
1. 准备 安装好python,安装时包含pip 包管理工具 pip install jieba pip install matplotlib import matplotlib.pyplot as ...
最新文章
- Activiti——工作流程-核心API(二)
- (总结1)HTML5中新增加的表单元素
- linux(centos)下mysql忘记root密码
- java 多线程集合操作_多线程中使用Java集合类
- word里双横线怎么打_美人计 | 精致打工人秀智,教你内双怎么化
- 优达学城深度学习之五——卷积神经网络
- 专为专业音乐行业从业人员打造的AI智能编曲工具:Orb Producer Suite Mac
- 拉电阻、下拉电阻的原理和作用
- vue前端项目上线配置
- C语言 编写加密程序,将用户输入的一个英文句子加密为加密字符串,然后输出加密字符串。
- Scratch实现打字游戏
- mybatis事务处理
- 网络入门-TRANK
- 有道云笔记分享_有道云笔记
- Java 10年回顾:世界各地开发高手谈Java
- python-Counter计数函数以及most_common函数
- 【前端面试宝典】超基础的vue知识
- ACA云原生3阿里云容器产品体系
- HighwayNet网络详解及复现
- 基于 Traefik 的激进 TLS 安全配置实践