直接上代码

#导入需要的库
from wordcloud import WordCloud
import collections
import jieba
import matplotlib.pyplot as plt
#首先打开待处理文本
with open("政府工作报告.txt","r",encoding='utf-8') as f:s = f.read()f.close()
#进行文本的初步处理,主要是去除一些不用统计的符号
t = ''
x = ',。?、‘’“”;:)(——'
for i in s:if i not in x:t+=i
#将初步处理后的文本另存(看看处理效果,可去除这一步)
with open("政府工作报告_去除符号.txt",'w') as f:f.write(t)f.close()
#使用jieba进行分词
with open("政府工作报告_去除符号.txt",'r') as f:deal_s = f.read()f.close()
a = jieba.lcut(deal_s)
#对分词之后的结果进行简单筛选,比如很多的单字是没有意义的,直接排除在外
deal_a=[]
for i in a:if len(i)>1:deal_a.append(i)
#使用collections库的Counter函数进行词频统计
x = dict(collections.Counter(deal_a))
#绘制词云,以下r'C:\Windows\fonts\simfang.ttf'非常重要,这个是选择可以正常显示中文的字体,必须添加,不然结果会是一堆方块,后面的参数根据需求更改
wc = WordCloud(r'C:\Windows\fonts\simfang.ttf',max_words=500,background_color="white",width = 1500,height= 960,margin= 10)
#fit_words(参数)是WordCloud的子函数,用于根据词频绘制词云,这里的参数一般是字典类型变量
t = wc.fit_words(x)
t.to_image().save('政府工作报告词频词云.png')
print("词云绘制已完成。")
#以下是生成的词云显示测试:
plt.imshow(wc)  # 显示词云
plt.axis('off')  # 关闭坐标轴
plt.show()  # 显示图像

结果如下:当然了这个绘制的有点粗糙,锦上添花自己加油啦hahaahh

另外有什么问题可以直接在评论区提出来,大家一起讨论。
完结撒花~~~

python分词、词频统计以及根据词频绘制词云相关推荐

  1. Hadoop的改进实验(中文分词词频统计及英文词频统计)(1/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

  2. Hadoop的改进实验(中文分词词频统计及英文词频统计)(4/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

  3. Hadoop的改进实验(中文分词词频统计及英文词频统计)(2/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

  4. 使用Python做中文分词和绘制词云

    使用Python做中文分词和绘制词云 李小璐出轨云词图 作为一门编程语言,Python的编写简单,支持库强大,应用场景多,越来越多的人开始将它作为自己的编程入门语言. Python一个比较重要的场景是 ...

  5. Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列)

    Hadoop实现词频统计(按照词频降序排列以及相同词频的单词按照字母序排列) 一.环境 二.实现步骤 1.数据 2.主函数 3.第一个MapReduce Map Reduce 4.第二个MapRedu ...

  6. 用python做词云 包含:处理词云形状+分词+绘制词云

    用python制作词云 包含:处理词云形状+分词+绘制词云 以下代码不超过100行 1.处理词云形状 你可能想把词云做成不同的形状,例如方形.圆形,甚至更复杂的,例如一个人体形状. 首先选一张背景为纯 ...

  7. 【Python】文本情感分析及绘制词云

    码字不易,喜欢请点赞!!! 这篇文章主要分享了使用Python来对文本数据进行情感分析以及绘制词云. 主要步骤包括: 1.文本预处理 2.文本分词 3.去除停用词(这里设置为单个词和一些常见的停用词) ...

  8. python中用来绘制词云的第三方库_如何用Python绘制词云?

    如果希望能够看懂代码,那么需要具备: 1. 了解Python语言的语法结构 2. 了解Python语言的标准包.第三方包的区别 3. Python代码基本是英文,意思一定程度上代表了它要做的事,懂英文 ...

  9. python红楼梦绘制词云形状图_python数据挖掘实战笔记——文本挖掘(5):词云美化之绘制《红楼梦》词云图...

    词云图的美化就是把词云图的背景和颜色进行美化,以<红楼梦>词云图为例,如下所示: 首先绘制词云,跟之前的代码操作一样: import jieba import numpy import c ...

  10. python默认词云颜色_Python 绘制词云

    1. 准备 安装好python,安装时包含pip 包管理工具 pip install jieba pip install matplotlib import matplotlib.pyplot as ...

最新文章

  1. Activiti——工作流程-核心API(二)
  2. (总结1)HTML5中新增加的表单元素
  3. linux(centos)下mysql忘记root密码
  4. java 多线程集合操作_多线程中使用Java集合类
  5. word里双横线怎么打_美人计 | 精致打工人秀智,教你内双怎么化
  6. 优达学城深度学习之五——卷积神经网络
  7. 专为专业音乐行业从业人员打造的AI智能编曲工具:Orb Producer Suite Mac
  8. 拉电阻、下拉电阻的原理和作用
  9. vue前端项目上线配置
  10. C语言 编写加密程序,将用户输入的一个英文句子加密为加密字符串,然后输出加密字符串。
  11. Scratch实现打字游戏
  12. mybatis事务处理
  13. 网络入门-TRANK
  14. 有道云笔记分享_有道云笔记
  15. Java 10年回顾:世界各地开发高手谈Java
  16. python-Counter计数函数以及most_common函数
  17. 【前端面试宝典】超基础的vue知识
  18. ACA云原生3阿里云容器产品体系
  19. HighwayNet网络详解及复现
  20. 基于 Traefik 的激进 TLS 安全配置实践

热门文章

  1. 交叉验证和超参数调整:如何优化你的机器学习模型
  2. 中国各省级行政区对应MODIS区块号
  3. java实现行政区域划分_java解析中国行政区域并在页面显示实现动态逐级筛选
  4. web开发--文档下载
  5. 三次hermite插值matlab,三次hermite插值
  6. 广州天河租房随笔记录
  7. vc使用nmake时报错
  8. (休息几天)读曼昆之微观经济学——税收归宿
  9. AxureRP9授权码
  10. Repeater实现批量删除