python英文字符频率统计_python统计英文首字母出现的次数
使用python解析有道词典导出的xml格式单词,统计各个首字母出现的次数,并按次数由多到少进行排序
相关实现
导出的xml格式如下
portion
n. 部分;一份;命运vt. 分配;给…嫁妆
['pɔːʃ(ə)n]
2
使用python3自带的xml解析器进行解析,使用字典进行保存统计结果
import time
import xml.etree.ElementTree as et
# get all word
def get_all_word(uri):
tree = et.parse(uri)
root = tree.getroot()
return root.findall('./item/word')
# calculate the first letter frequency of words
def cal_aleph(word_list):
# define dwords to save first letter count
dwords = {}
for cword in word_list:
letter = cword.text.strip()[0].lower()
# judge the letter is english letter
echar = ord(letter)
if(echar >= 97 and echar <= 122):
try:
dwords[letter] += 1
except KeyError:
dwords[letter] = 1;
# order by count desc
dwords = sorted(dwords.items(), key=lambda line:line[1], reverse=True)
return dwords
if __name__ == '__main__':
start_time = time.time()
word_list = get_all_word(r'd:\pyzone\youdao.xml')
result = cal_aleph(word_list)
for row in result:
print("%s : %d"%(row[0], row[1]))
end_time = time.time()
print('Costed time: ' + str((end_time - start_time)) + 's')
统计结果如下:
回顾
使用xml.etree.ElementTree的parse解析指定路径的xml文件,root.findall查找指定节点
sorted方法对列表进行排序
'中文'.isalpha() 结果为True
python英文字符频率统计_python统计英文首字母出现的次数相关推荐
- 英文字符频率统计 python实现
题目:英文字符频率统计.编写一个程序,对给定的字符串中出现的A~Z字母频率分析,忽略大小写,采用降序方式输出. 方法一: 代码: #把每个元素后面都加一个空格 with open('11.txt', ...
- python统计英文首字母出现的次数
使用python解析有道词典导出的xml格式单词,统计各个首字母出现的次数,并按次数由多到少进行排序 相关实现 导出的xml格式如下 <wordbook><item> < ...
- 中文字符频率统计python_python统计字符串出现最多的字母及其出现次数
统计字符串出现最多的字母及其出现次数 另外如果次数相同按字母顺序排序. 方法1 可以使用自定义键对c.most_common()进行排序,该键首先考虑频率的降序,然后考虑字母的降序(请注意lambda ...
- 统计abacbacdadbc中的每个字母出现的次数,输出格式是:a(4)b(3)c(3)d(2)
2019独角兽企业重金招聘Python工程师标准>>> import java.util.Iterator; import java.util.Map; import java.ut ...
- B 字符串处理1000MS64MB Description 输入一个英文名字。去掉该英文名字两端的空格,并首字母大写后,输出问候语Hello, 加名字 Input 一个英文名字 Output 去
B 字符串处理1000MS64MB Description 输入一个英文名字.去掉该英文名字两端的空格,并首字母大写后,输出问候语"Hello, "加名字 Input 一个英文名字 ...
- python中怎么统计英文字符的个数_Python之每日一练统计英文文本单词出现的个数、行数、字符数...
#coding:utf-8 import sys,os """ python实现任一个英文的纯文本文件,统计其中的单词出现的个数.行数.字符数 ""& ...
- python中怎么统计英文字符的个数_python怎样实现字符串中字符分类及个数统计
python怎样实现字符串中字符分类及个数统计 发布时间:2020-11-20 17:31:18 来源:亿速云 阅读:105 作者:小新 小编给大家分享一下python怎样实现字符串中字符分类及个数统 ...
- python统计中文字符的个数_python统计中文字符数量的两种方法
方法一: def str_count(str): '''找出字符串中的中英文.空格.数字.标点符号个数''' count_en = count_dg = count_sp = count_zh = c ...
- python统计字符频次_Python 统计长字符串中字符频次
以下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得.相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度. 通过<Python读取文件内容为字符串的方法> ...
最新文章
- 如何避免重复提交?分布式服务的幂等性设计!
- linux多线程求和_211渣硕,海投200+家Java岗(面40,过7),收获多份offer!
- 开放原子超级链动态内核上线,十分钟可搭建一条区块链
- 一个链表创建、反转、打印的C语言代码
- 支付系统整体设计:整体架构设计以及注意要点(一)
- mysql基础----mybatis的批量插入(一)
- java set 对象去重_JAVA对象去重
- MVVM和MVC有什么区别
- JAVA集合一:ArrayList和LinkedList
- 单片机交通灯灯c语言程序,51单片机控制交通灯原理图及C语言程序
- java实现人民币金额大写
- MapAbc使用体验
- 希腊计数法罗马计数法
- 袋鼠云数据中台专栏(五):数栈,企业级一站式数据中台PaaS
- android图标生成网址
- 旗鱼SailfishOS SDK for Windows初体验
- 从零开始学习Java神经网络、自然语言处理和语音识别,附详解和简易版GPT,语音识别完整代码示例解析
- s8更新系统提示网络或服务器出错,S8决赛IG3:0夺冠,各大区服务器崩溃!IG夺冠为何会全网刷屏?...
- linux下分析webmail代码,Atmail Webmail Client多个HTML代码注入漏洞
- LeetCode笔试刷题一. 贪心算法