import jieba
txt = open("阿甘正传-网络版.txt","r",encoding ="utf-8").read()
words = jieba.lcut(txt)        #用jieba库对文本进行中文分词,输出可能的分词的精确模式
counts ={}            #新建一个空字典
for word in words:if len(word) == 1:            #挑出单个的分词(不计数)continueelse:counts[word] = counts.get(word,0)+1          #对word出现的频率进行统计,当word不在words时,返回值是0,当word在words中时,返回+1,以此进行累计计数
items = list(counts.items())
items.sort(key = lambda x:x[1],reverse = True)
for i in range(10):word,count = items[i]    #返回相对应的键值对print("{0}:{1}".format(word,count))

注: counts[word] = counts.get(word,0)+1 是对进行计数word出现的频率进行统计,当word不在words时,返回值是0,当word在words中时,返回+1,以此进行累计计数。

运行结果:

python中利用jieba库统计词频,counts[word] = counts.get(word,0)+1的使用相关推荐

  1. 协程的概念及Python中利用第三方库gevent使用协程

    提到程序的并发操作,大多数人程序员首先想到的进程或者线程.我们先复习一下进程和线程的概念.   进程: 进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的 ...

  2. jieba库词频统计_运用jieba库进行词频统计

    Python第三方库jieba(中文分词) 一.概述 jieba是优秀的中文分词第三方库 - 中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库,需要额外安装 - jieba库 ...

  3. 利用jieba库对《秦吏》做的简单处理

    刚看完秦吏,想知道除了黑夫谁是出场率最高的角色,所以用Python中的jieba库做了简单分析 import jieba import wordcloud txt = open("秦吏.tx ...

  4. 利用jieba库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化

    目录 利用jieba库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化 安装jieba库 安装wordcloud 打开pycharm 编写代码 利用jieba库和wordcloud库 ...

  5. jieba库词频统计_用jieba库统计文本词频及云词图的生成

    一.安装jieba库 :\>pip install jieba #或者 pip3 install jieba 二.jieba库解析 jieba库主要提供提供分词功能,可以辅助自定义分词词典. j ...

  6. DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出)

    DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出) 目录 利用pandas库统计某一列col中各个值出现的次数(降序输出) 输出结果 实现代码 利用pandas库统计某一 ...

  7. Python:利用collections库实现统计单个字或单个字母的频率统计并进行降序输出、统计一个列表内重复元素并以字典形式输出

    Python:利用collections库实现统计单个字或单个字母的频率统计并进行降序输出.统计一个列表内重复元素并以字典形式输出 目录 利用collections库实现统计单个字或单个字母的频率统计 ...

  8. 利用python中的csv库读写csv文件

    利用python中的csv库读写csv文件 python读写csv文件就我知道的方法有:1)利用csv库,2)利用读写txt文件的方式处理,3)利用numpy或pandas库处理 在这篇博客中,博主就 ...

  9. 利用Python中的PIL库去处理图片

    利用Python处理图片,任选一张图片,用PIL抓取并显示图像轮廓. 安装PIL在cmd中输入 pip install pillow 今天我们所用到的原图为蕾姆的一张图片 下面就让我们看下Python ...

最新文章

  1. Android系统默认Home应用程序(Launcher)的启动过程源代码分析(3)
  2. 在计算机检索系统中常用的检索技术有,计算机检索技术有哪些
  3. 利用DNS Zone Transfers漏洞工具dnswalk
  4. DualCircleList
  5. copy与mutableCopy的内存管理剖析
  6. java内存:堆、栈、常量池、方法区
  7. 学习笔记-AngularJs(十)
  8. 【转】刨根究底字符编码之十三——UTF-16编码方式
  9. hdu2587(递推)
  10. Java -- AWT 画图,图像处理
  11. jsp页面之间传中文参数显示乱码问题的解决
  12. 如何禁用 7 个完全不必要的设置来优化 Mac?
  13. c++:warning: deprecated conversion from string constant to 'char*' [-Wwrite-strings]
  14. c语言小学生入门自学,啊哈C语言:小学生坐在马桶上都可以读懂的C语言编程入门书 PDF 扫描版[20M]...
  15. OC5022B内置MOS的开关降压型恒流驱动芯片
  16. 8位12指令微程序CPU设计
  17. matlab怎么解非满秩矩阵,在numpy或matlab中由满秩非方矩阵求可逆方阵
  18. jmeter性能测试方案
  19. 浅谈渗透测试人员职业发展路线
  20. 对逐飞总钻风和龙邱神眼摄像头引脚的解读

热门文章

  1. 中公教育计算机老师笔试面试题,信息技术教师考试面试“答辩”技巧
  2. 格林公式的原理理解(考研数学)
  3. 一个屌丝程序员的青春(三九)
  4. 经典小游戏js点灯游戏
  5. 1306. 跳跃游戏 III
  6. 清除 Windows 访问共享目录的账号密码
  7. 陈一舟:模仿秀易融资 千橡扩张有风险
  8. php用户第三方登录失败,php 实现网站端qq第三方登录接口及一些注意事项【原创】...
  9. svg android怎么填充颜色,android svg 使用方法及修改颜色
  10. opacity和rgba的区别