import jieba as j                         #jieba库(分词)i=open("31878.txt","r",encoding="utf-8")  #打开一份txt文件,读取,关闭文件
txt=i.read()
i.close()
words=j.lcut(txt)                         #进行对读取的文件进行分词操作
count={}for word in words:if len(word)==1:continueelse:count[word]=count.get(word,0)+1   #统计词频,并删去其中单个词汇a=input("请用空格分割词组,按回车结束:\n")   #对词频中不希望出现的词汇删除
words=a.split()
for word in words:if count[word]!=0:del(count[word])counts=list(count.items())                #将剩余词汇转化为列表形式
counts.sort(key=lambda x:x[1],reverse=True) #进行词频次数排列
for i in range(20):                         #输出统计的词汇词频word,count=counts[i]print("{0:<3}:{1:>5}".format(word,count))

对txt文件的高频词汇统计相关推荐

  1. txt文件英语单词词频统计

    目录 一.需求分析 二.相关库列表 三.代码在此 四.一些问题 一.需求分析 把txt文件里的英语单词按照出现次数排序并生成csv文件,如果次数相同按照单词的md5值来排序 二.相关库列表 panda ...

  2. 基于hadoop下的使用map reduce分布式系统的高考高频词汇统计

    hadoop课程设计报告 一.设计目的与要求 1.设计目的 通过hadoop课程设计可以加深.巩固对本门专业课程理论知识的掌握.通过eclipse和hadoop来编写课设报告等方面的实践训练,筑牢编程 ...

  3. 中文高频词汇统计并绘制词云

    转载自:https://www.jianshu.com/p/2052d21a704c 代码如下: # -*- encoding:utf-8 -*- import sys reload(sys) sys ...

  4. python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...

    问题描述 有时在遇到一个文本需要统计文本内词汇的次数 的时候 ,可以用一个简单的python程序来实现. 解决方案 首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程 ...

  5. 统计本段话的高频词汇——报错:KeyError

    项目场景: 编写程序,实现用户随机输入一段话,统计本段话的高频词汇 原来的代码 import jieba txt = input("请输入一段话:") words = jieba. ...

  6. 统计词频并输出高频词汇

    @统计词频并输出高频词汇 所给数据为某日中国日报英文版的一篇新闻报道,现要求使用 Python 语言编写程序统计其中出线频率最高的十个单词,输出对应的单词内容和频率(以字典形式呈现). import ...

  7. 用python统计水浒传中的高频词汇

    用python统计水浒传中的高频词汇 #词频统计.py import jieba excludes = {"两个","一个","只见",&q ...

  8. java+txt+词语+次数_Java练习2--读取txt文件统计考勤次数并写入一个txt文件中

    Java练习2--读取txt文件统计考勤次数并写入一个txt文件中 Java练习2--读取txt文件统计考勤次数并写入一个txt文件中 面向对象的小练习: 文件attendance.txt中的数据为本 ...

  9. python如何打开txt文件、并算词频_Python 合并多个TXT文件并统计词频的实现

    需求是:针对三篇英文文章进行分析,计算出现次数最多的 10 个单词 逻辑很清晰简单,不算难, 使用 python 读取多个 txt 文件,将文件的内容写入新的 txt 中,然后对新 txt 文件进行词 ...

  10. python遍历文本文件统计字符个数_用python获取txt文件中关键字的数量

    缘起: 开发人员需要tomcat中一个项目在一个月的访问请求量,因其他原因只剩下查找tomcat请求日志的方法获取,刚好最近在学习python,于是就用python摸索了下: 大体思路: 1.把相应t ...

最新文章

  1. JavaWeb监听器
  2. STM32 基础系列教程 6 - PWM
  3. 为你的程序添加监听器
  4. P3243 [HNOI2015]菜肴制作(拓扑排序、贪心)
  5. route add添加静态路由
  6. 0918类对象重载,作业3
  7. DotText研究资料整理
  8. 系统调用----sandir
  9. 谨防欺诈,Facebook 禁止加密货币和 ICO 广告
  10. dyld Library not loaded @rpath libswiftCore dylib 解决
  11. as-conformal-as-possible discrete volumetric mapping
  12. java.lang.IllegalArgumentException: node to traverse cannot be null! HQL语法问题
  13. 论文赏析[AI18]更快的基于非二叉化自底向上策略的转移系统成分句法分析
  14. The Classic IQ Test
  15. 教你从零开始画echarts地图
  16. 火狐不支持css图标,火狐浏览器不支持css缩放样式:zoom,如何完美解决?
  17. MySQL 数据恢复 —— 使用 data 目录
  18. 语音信号处理基础知识之频谱、相位谱、幅度谱、功率谱及语谱图
  19. zscore标准化步骤_matlab标准化和反标准化——zscore
  20. VMware虚拟机中安装的系统共享主机无线网络的方法

热门文章

  1. mac 打开网页慢_老Mac电脑打开网页慢怎么办
  2. 使用Processing制作一个时钟
  3. CDH环境HDFS权限问题
  4. Ceres Solver实现简单的光束法平差
  5. css绘制星星闪烁,CSS3 闪烁的星星
  6. 物联网智能家居有哪些应用
  7. DGraphDTA训练部分源码解读分析(一)2021SC@SDUSC
  8. 常用的计算机优化软件有哪些,计算机常用的硬件和软件优化软件和优化方法有哪些,如何提高WindowsXP系统的运行速度和稳定性...
  9. 团队经理要应掌握的 7 大领导力理论
  10. vim---操作命令大全