使用python解析有道词典导出的xml格式单词,统计各个首字母出现的次数,并按次数由多到少进行排序

相关实现

导出的xml格式如下

portion

n. 部分;一份;命运vt. 分配;给…嫁妆

['pɔːʃ(ə)n]

2

使用python3自带的xml解析器进行解析,使用字典进行保存统计结果

import time

import xml.etree.ElementTree as et

# get all word

def get_all_word(uri):

tree = et.parse(uri)

root = tree.getroot()

return root.findall('./item/word')

# calculate the first letter frequency of words

def cal_aleph(word_list):

# define dwords to save first letter count

dwords = {}

for cword in word_list:

letter = cword.text.strip()[0].lower()

# judge the letter is english letter

echar = ord(letter)

if(echar >= 97 and echar <= 122):

try:

dwords[letter] += 1

except KeyError:

dwords[letter] = 1;

# order by count desc

dwords = sorted(dwords.items(), key=lambda line:line[1], reverse=True)

return dwords

if __name__ == '__main__':

start_time = time.time()

word_list = get_all_word(r'd:\pyzone\youdao.xml')

result = cal_aleph(word_list)

for row in result:

print("%s : %d"%(row[0], row[1]))

end_time = time.time()

print('Costed time: ' + str((end_time - start_time)) + 's')

统计结果如下:

回顾

使用xml.etree.ElementTree的parse解析指定路径的xml文件,root.findall查找指定节点

sorted方法对列表进行排序

'中文'.isalpha() 结果为True

python英文字符频率统计_python统计英文首字母出现的次数相关推荐

  1. 英文字符频率统计 python实现

    题目:英文字符频率统计.编写一个程序,对给定的字符串中出现的A~Z字母频率分析,忽略大小写,采用降序方式输出. 方法一: 代码: #把每个元素后面都加一个空格 with open('11.txt', ...

  2. python统计英文首字母出现的次数

    使用python解析有道词典导出的xml格式单词,统计各个首字母出现的次数,并按次数由多到少进行排序 相关实现 导出的xml格式如下 <wordbook><item> < ...

  3. 中文字符频率统计python_python统计字符串出现最多的字母及其出现次数

    统计字符串出现最多的字母及其出现次数 另外如果次数相同按字母顺序排序. 方法1 可以使用自定义键对c.most_common()进行排序,该键首先考虑频率的降序,然后考虑字母的降序(请注意lambda ...

  4. 统计abacbacdadbc中的每个字母出现的次数,输出格式是:a(4)b(3)c(3)d(2)

    2019独角兽企业重金招聘Python工程师标准>>> import java.util.Iterator; import java.util.Map; import java.ut ...

  5. B 字符串处理1000MS64MB Description 输入一个英文名字。去掉该英文名字两端的空格,并首字母大写后,输出问候语Hello, 加名字 Input 一个英文名字 Output 去

    B 字符串处理1000MS64MB Description 输入一个英文名字.去掉该英文名字两端的空格,并首字母大写后,输出问候语"Hello, "加名字 Input 一个英文名字 ...

  6. python中怎么统计英文字符的个数_Python之每日一练统计英文文本单词出现的个数、行数、字符数...

    #coding:utf-8 import sys,os """ python实现任一个英文的纯文本文件,统计其中的单词出现的个数.行数.字符数 ""& ...

  7. python中怎么统计英文字符的个数_python怎样实现字符串中字符分类及个数统计

    python怎样实现字符串中字符分类及个数统计 发布时间:2020-11-20 17:31:18 来源:亿速云 阅读:105 作者:小新 小编给大家分享一下python怎样实现字符串中字符分类及个数统 ...

  8. python统计中文字符的个数_python统计中文字符数量的两种方法

    方法一: def str_count(str): '''找出字符串中的中英文.空格.数字.标点符号个数''' count_en = count_dg = count_sp = count_zh = c ...

  9. python统计字符频次_Python 统计长字符串中字符频次

    以下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得.相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度. 通过<Python读取文件内容为字符串的方法> ...

最新文章

  1. 如何避免重复提交?分布式服务的幂等性设计!
  2. linux多线程求和_211渣硕,海投200+家Java岗(面40,过7),收获多份offer!
  3. 开放原子超级链动态内核上线,十分钟可搭建一条区块链
  4. 一个链表创建、反转、打印的C语言代码
  5. 支付系统整体设计:整体架构设计以及注意要点(一)
  6. mysql基础----mybatis的批量插入(一)
  7. java set 对象去重_JAVA对象去重
  8. MVVM和MVC有什么区别
  9. JAVA集合一:ArrayList和LinkedList
  10. 单片机交通灯灯c语言程序,51单片机控制交通灯原理图及C语言程序
  11. java实现人民币金额大写
  12. MapAbc使用体验
  13. 希腊计数法罗马计数法
  14. 袋鼠云数据中台专栏(五):数栈,企业级一站式数据中台PaaS
  15. android图标生成网址
  16. 旗鱼SailfishOS SDK for Windows初体验
  17. 从零开始学习Java神经网络、自然语言处理和语音识别,附详解和简易版GPT,语音识别完整代码示例解析
  18. s8更新系统提示网络或服务器出错,S8决赛IG3:0夺冠,各大区服务器崩溃!IG夺冠为何会全网刷屏?...
  19. linux下分析webmail代码,Atmail Webmail Client多个HTML代码注入漏洞
  20. LeetCode笔试刷题一. 贪心算法

热门文章

  1. 升降桌有哪些类型种类
  2. 什么是音频视频比特率,采样率,讲的很不错
  3. matlab查找集合中某个元素的位置/Struct结构体某个字段值的位置
  4. 制作一个图片条幅跑马灯
  5. pageOffice基本使用
  6. 如何提升企业内部的固定资产管理水平?
  7. 国人为什么这么轻视技术?
  8. 移动架构师之EIT开发笔记
  9. Linux系统入门篇(4)- Linux目录简介
  10. 为什么说企业使用劳务外包可以降低成本?