程序采用wordcloud、jieba分词、matplotlib绘制图像的模块

02.py

# 题目二
# 请你设计一个统计字数的工具,工具要求如下:
# 1、统计的是任意文本文件(txt)内容的字数(不算空格和符号)
# 2、用词云图将统计的字显示出来from wordcloud import WordCloud
import matplotlib.pyplot as plt  #绘制图像的模块
import  jieba                    #jieba分词class Myword:def __init__(self, url):self.url = url# 统计字数def statistics(self):try:# 由于书名不是英文,要加上 encoding='utf8'with open(self.url, encoding='GBK') as f:#读取文件的所有行lines = f.readlines()except FileNotFoundError:print("文件读取错误!!")content = ''words = []words_count = {}for line in lines:# 去除空格line = line.strip()# 如果是空行,则跳过if len(line) == 0:continue# 合并所有行,统计全部字数content = content + line# 统计每一字出现的个数for x in range(0, len(line)):# 如果字符第一次出现 加入到字符数组中if not line[x] in words:words.append(line[x])# 如果是字符第一次出现 加入到字典中if line[x] not in words_count:words_count[line[x]] = 1# 出现次数加一words_count[line[x]] += 1print('全文共有%d个字' % len(content))print('一共有%d个不同的字' % len(words))print(words_count)for a in words_count.keys():print("[", a, "] 共出现 ", words_count[a], "次")f.close()def word_cloud(self):f = open(self.url, 'r', encoding='GBK').read()# 结巴分词,生成字符串,wordcloud无法直接生成正确的中文词云cut_text = " ".join(jieba.cut(f))wordcloud = WordCloud(# 设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的font_path="C:/Windows/Fonts/simfang.ttf",# 设置了背景,宽高background_color="white", width=1000, height=880).generate(cut_text)plt.imshow(wordcloud, interpolation="bilinear")plt.axis("off")plt.show()wordcloud.to_file("test.png")if __name__ == '__main__':url = 'test.txt's = Myword(url)s.statistics()s.word_cloud()

test.txt

2019年5月29日上午10点,本科教学审核评估专家、贵州财经大学副校长缪坤和教授走访了
学校教学督导团,在教育研究与评建中心会议室对督导团团长邹勇、督导团成员
董秀红、杨红芸、穆伯祥等进行了访谈。
访谈中,邹勇团长从督教、督学、督管以及开展教师教学能力培训等方面汇报了
校督导团开展的工作。听完汇报后,缪坤和教授查看了督导团近两年的督导工
作汇编、督导工作简报、督导工作研究成果,就“互联网+”背景下如何进一步
做好教师课堂教学督导工作与大家进行了深入的交流,并对教学督导队伍建设做了指导。

结果展示如下图

python 统计文本字数 生成词云图相关推荐

  1. Python WordCloud 文本分析 生成词云图

    文章目录 环境准备 Code 结果文件 Links 环境准备 Python, pip安装配置: 安装依赖的包(使用-i url指定要使用的镜像源,加快下载速度) pip install wordclo ...

  2. python爬音乐评论生成词云图_python爬虫+词云图,爬取网易云音乐评论

    又到了清明时节,用python爬取了网易云音乐<清明雨上>的评论,统计词频和绘制词云图,记录过程中遇到一些问题 爬取网易云音乐的评论 一开始是按照常规思路,分析网页ajax的传参情况.看到 ...

  3. Python | 根据指定文件生成词云图

    任务:编写程序,编好后,把多个文本文件(中文.英文或中英文语言混合的文本文件,编码格式为UTF-8,扩展名为txt)放到程序所在目录.程序运行时,能把程序所在目录下所有文本文件找出来,并显示出文件基本 ...

  4. python爬取歌词生成词云图_爬取毛不易歌词作词云展示

    爬取毛不易歌词作词云展示 今天我们做一个数据可视化的项目,爬取毛不易的歌词做词云展示. 1.爬取数据 我们主要使用 Python 爬虫获取 HTML,用 XPath 对歌曲的 ID.名称进行解析,然后 ...

  5. python统计文本字数_Python 简单应用--文章字数统计

    Python是做数据处理很好的工具,这里小时牛刀,用Python完成文章的字数统计. 系统:Ubuntu16.04 Python版本:3.4 文本:<西游记>txt片段 结果:存放于res ...

  6. python统计文本字数

    #-*-coding:utf-8-*- contents = open("d:file.ini","r").read() mylen = len(content ...

  7. 【Python】文本文件生成词云图片-单字过滤和任意形状词云和清晰度提高

    [Python]txt文本文件生成词云图片 资源提供 纯方框,无文字 单字过滤 任意形状词云 提高清晰度 完整代码 该程序由pycharm运行,产生的图片文件在项目文件夹内. 资源提供 决胜全面建成小 ...

  8. python 制作高斯mask_【趣味案例】用Python制作各种酷炫词云图,原来这么简单!...

    一.简介词云图是文本挖掘中用来表征词频的数据可视化图像,通过它可以很直观地展现文本数据中地高频词:! 图1 词云图示例 在Python中有很多可视化框架可以用来制作词云图,如pyecharts,但这些 ...

  9. Py之wordcloud:python中非常有趣的词云图wordcloud简介、安装、使用方法、案例应用详细攻略

    Py之wordcloud:python中非常有趣的词云图wordcloud简介.安装.使用方法.案例应用详细攻略 目录 wordcloud简介 wordcloud安装 wordcloud使用方法 案例 ...

最新文章

  1. 桶排序算法(基于Java实现)
  2. 谈谈即时通讯开发平台
  3. java资源争夺_所有满足类似需求,争夺同类资源的组织和个人统称为(   )。...
  4. pythonmysqldb_python中MySQLdb的使用
  5. 初识html 尝试图片标签 0907
  6. Git初始化本地已有项目并上传到远端仓库
  7. 深入解析ES6中let和闭包
  8. HashSet、LinkedHashSet、TreeSet 简明解释
  9. UMl user guide读书笔记
  10. 天题系列:Substring with Concatenation of All Words
  11. 金九银十BAT互联网企业涨薪必备知识点:Jvm性能调优实战
  12. 阿里大佬手把手教你用jmeter做压力测试(详图)
  13. 第一个彻底解决!微信公众号数学公式排版
  14. Chromium OS Developer Guide
  15. 2、服务器系统:Windows Server 2012 操作系统
  16. java——html
  17. DAO:可及性与问责制、分权与效率 、开放与控制的三大权衡
  18. 1009-确认订单-订单流程梳理与订单状态
  19. Lexical Simplification with Pretrained Encoders 论文精读
  20. 过渡篇(1),初步了解Java泛型

热门文章

  1. 9006:单链表的建立和遍历
  2. 面试宝典(一)之程序员必备面试软技能
  3. 一文读懂:股权激励的“三重境界”
  4. 仓库和门店移动出入库 手持移动终端 pda 扫描打印于一身 扫描打印小票和不干胶标签纸
  5. 【taro +vue】初体验
  6. DAVSE VCC-H10004K超高清会议摄像机
  7. ADC芯片ADS1258采集数据的读取
  8. bitset的使用示例
  9. js在浏览器中对cookie进行增删改查
  10. Java Native 方法