python英文词频统计代码_python词频统计_英文
python词频统计_英文
2020-08-15 05:22
阅读数 22
<>代码
大家都在写中文的词频统计,我接触了python都有好几年了,还写英文的,真的是,就。直接贴个代码吧。
text = """ British newspapers are much smaller than they used to be and their
readers are often in a hurry , so newspapermen write as few words as possible .
They tell their readers at once what happened , where , when and how it
happened and what was the result : how many people were killed , what change
was done and so on . Readers want the fact set out as fully and accurately as
possible . Readers are also interested in the people who have seen the accident
. So a newspaperman always likes to get some information from someone who was
there , which can be given in the person’s own words . Because he can use only
a few words , the newspaperman must choose those words carefully , every one
must be effective . Instead of “ he called out in a loud voice ” , he writes ”
he shouted ” ; instead of “the loose stones rolled noisily down the side of the
mountain ” , he will write ” they thundered down the mountainside ” . Because
many of the readers are not very clever, and most of them are in a hurry. """
def getTxt(txt): #对文本预处理(包括) txt = txt.lower()#将所有的单词全部转化成小写 for ch in
",,,.!、!@#$%^'”“;'’": #将所有除了单词以外的符号换成空格 txt=txt.replace(ch, ' ') return txt
txtArr= getTxt(text).split() counts = {} for word in txtArr: counts[word] =
counts.get(word, 0) + 1 countsList = list(counts.items()) countsList.sort(key=
lambda x:x[1], reverse=True) for i in range(20): word, count = countsList[i]
print('{0:<10}{1:>10}'.format(word,count))
<>代码解说
* 在百度找了一篇英语阅读,作为text统计词频。
* str.lower(),将所有的单词全部转化成小写然后返回转化结果,原str不变
* str.replace(‘a’, ‘b’),将str中的所有的a字符换成b字符并返回换后结果,原str不变
*
str.split(),split()不带参数默认为以所有的空字符,包括空格、换行(\n)、制表符(\t)等为分隔符分割str,并返回分割结果(list)
* dic.get(“a”,val),在字典dic中取出键为a对应的值,如果字典中不存在键为a的键值对,则返回val
* list.sort( key=None, reverse=False)
key – 主要是用来进行比较的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。
reverse – 排序规则,reverse = True 降序, reverse = False 升序(默认)。
文中用了lambda表达式,lambda是声明符,后面跟参数,:前面是参数,冒号后面的表达式是lambda的处理结果,这个表达式中,参数是x,处理结果是
x[1]。sort中key参数会给后面的表达式赋值一个list中的元素。如:list为[('a':5),('b':3)],执行sort时会分别把('a':5)和
('b':3)赋值给key后面的lambda表达式,也就是x参数会接受到这两个值。countsList.sort(key=lambda x:x[1],
reverse=True) #等同与 def takeSecond(elem): return elem[1] countsList.sort(key=
takeSecond, reverse=True)
* print在python3 中已经被函数化了,python2中可以print a,python3 中必须print(a).
* 在python3中可以help(print), (注意,在python2中是不能help(print)的,因为其不是一个函数)
* print('{0:<10}{1:>10}'.format(word,count))
参数括号里第一个大括号的0表示这个大括号是给format中第一个参数word占位的,:后<号表示这一列左对齐,10表示这一列长度为10。第二个大括号里的1表示这个大括号是给format中第二个参数count占位的,:后的>表示这一列右对齐,1010表示这一列长度为10。只有单位的话,有人弄清楚可以跟我讲。。。
<>运行结果
* 下一个做。。。中文的分词和词云图吧,看着好像挺好玩的。
python英文词频统计代码_python词频统计_英文相关推荐
- python英文词频统计代码_python实现中文和英文的词频统计功能方法汇总
python的思维就是让我们用尽可能少的代码来解决问题.对于词频的统计,就代码层面而言,实现的方式也是有很多种的.之所以单独谈到统计词频这个问题,是因为它在统计和数据挖掘方面经常会用到,尤其是处理分类 ...
- python英文文本词频统计代码_Python小程序:文本词频统计(英文+中文)
在学习了组合数据类型和文件操作之后就可以做出下面的文本词频统计的小程序了: 1. 下面是英文文本的词频统计,统计了作者的一篇英文论文 #文本词频统计:英文文本 def gettext(): #从文件中 ...
- python 英语词频统计软件_Python实现统计英文文章词频的方法分析
本文实例讲述了Python实现统计英文文章词频的方法.分享给大家供大家参考,具体如下: 应用介绍: 统计英文文章词频是很常见的需求,本文利用python实现. 思路分析: 1.把英文文章的每个单词放到 ...
- python图形统计代码_python tkinter图形界面代码统计工具
本文为大家分享了python tkinter图形界面代码统计工具,供大家参考,具体内容如下 #encoding=utf-8 import os,sys,time from collections im ...
- 易语言php统计代码,易语言统计代码行数与API的工具
DLL命令表 .版本 2 .DLL命令 FindWindowEx, 整数型, "user32", "FindWindowExA", , 在窗口列表中寻找与指定条 ...
- Python使用正则表达式识别代码中的中文、英文和数字实例演示
Python 正则表达式识别代码中的中文.英文和数字 识别中文 识别英文 识别数字 拓展 在文本处理和数据分析中,有时候需要从代码中提取出其中包含的中文.英文和数字信息.正则表达式是一种强大的工具,可 ...
- python求平方根的代码_Python求解平方根的方法
本文实例讲述了Python求解平方根的方法.分享给大家供大家参考.具体如下: 主要通过SICP的内容改写而来.基于newton method求解平方根.代码如下: #!/usr/bin/python ...
- python中怎么复制代码_Python对象怎么引用_Python对象怎么复制代码_一聚教程网
本次文章要给大家讲解的是Python对象引用及复制代码,相信这也是大家问题比较大的一个点,下面为大家具体整理了操作过程,一起来了解下. 可以说Python没有赋值,只有引用.你这样相当于创建了一个引用 ...
- python判别性别的代码_python如何实现性别识别 python实现性别识别代码示例
python如何实现性别识别?本篇文章小编给大家分享一下python实现性别识别代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 使用keras ...
- python读文件完整代码_Python读写文件的代码示例
本篇文章给大家带来的内容是关于Python读写文件的代码示例,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助 一.读取文件 读取文件步骤: 1.找到文件 2.打开文件 3.读取文件内容 ...
最新文章
- vim的一些快捷键,备忘
- 纯 CSS 实现高度与宽度成比例的效果
- VTK修炼之道47:图形基本操作进阶_法向量计算
- python 字典查询比列表快_Python字典vs列表,哪个更快?
- Asp.Net中几种相似数据绑定标记符号的解释及用法
- python3闭包通俗解释_Python|闭包、装饰器,简单的实例,通俗的理解
- JVM性能优化之CPU负载过高
- 让携号转网不再难!但你得了解这几大限制
- 类增量学习(Class-Incremental Learning)领域部分经典论文汇总
- Hadoop 调研笔记
- 【数字通信】Matlab实现16QAM调制与解调,判决,误码率计算
- 扎克伯格让员工学会高效工作的26张PPT
- odoo stock库存模块
- 音乐播放器——SoundManager API介绍
- sar图像matlab,用Matlab制作SAR仿真图像
- 什么叫机械硬盘_企业级机械硬盘和普通机械硬盘有什么区别
- android中base64编码解码,Andorid自带的Base64编解码表
- Excel的最大行数
- DataMatrix编码 关于libdmtx的使用
- Win7——无Internet访问权限