我可以看到你在哪里排序,因为你可以可靠地知道你什么时候打了一个新单词并跟踪每个独特单词的计数。但是,您真正想要做的是使用哈希(字典)来跟踪计数,因为字典键是唯一的。例如:

words = sentence.split()

counts = {}

for word in words:

if word not in counts:

counts[word] = 0

counts[word] += 1现在,它将为您提供一个字典,其中键是单词,值是它出现的次数。您可以使用collections.defaultdict(int)执行某些操作,因此您只需添加以下值即可:

counts = collections.defaultdict(int)

for word in words:

counts[word] += 1但是甚至还有更好的东西...... collections.Counter会将你的单词列表转换成包含计数的字典(字典的扩展名)。

counts = collections.Counter(words)从那里你需要按排序顺序的单词列表及其计数,以便您可以打印它们。 items()将为您提供元组列表,sorted将按每个元组的第一项(在本例中为单词)排序(默认情况下)...这正是您想要的。

import collections

sentence = """As far as the laws of mathematics refer to reality they are not certain as far as they are certain they do not refer to reality"""

words = sentence.split()

word_counts = collections.Counter(words)

for word, count in sorted(word_counts.items()):

print('"%s" is repeated %d time%s.' % (word, count, "s" if count > 1 else ""))OUTPUT

"As" is repeated 1 time.

"are" is repeated 2 times.

"as" is repeated 3 times.

"certain" is repeated 2 times.

"do" is repeated 1 time.

"far" is repeated 2 times.

"laws" is repeated 1 time.

"mathematics" is repeated 1 time.

"not" is repeated 2 times.

"of" is repeated 1 time.

"reality" is repeated 2 times.

"refer" is repeated 2 times.

"the" is repeated 1 time.

"they" is repeated 3 times.

"to" is repeated 2 times.

python去除重复单词_Python重复的单词相关推荐

  1. python将空格分开_python将每个单词按空格分开并保存到文件中

    核心代码 # -*- coding: utf-8 -*- ''' python读取英文文件,将每个单词按照空格分开,并将每个单词独自放一行 ''' def dcfenhang(infile,outfi ...

  2. python去除图片水印_Python | 图中使用类的水印

    python去除图片水印 Sometimes, we need to add watermark as a standard category of plots and therefore, we a ...

  3. python文本统计单词_Python实现文本单词统计

    在以前的文章中,我提到过Python标准库中的collections模块中的Counter类.它的作用非常大,这里我们要用利它来实现单词统计.对于任意一篇全英文的文本文件,我们要列出其中每一个单词各自 ...

  4. python 去除list 里面的重复元素

    # 使用set 去除重复 list_a = [1, 2, 3, 3, 4, 5, 6] print(list(set(list_a)))# 过滤重复 list_b = [] for i in list ...

  5. python语言打印菱形_Python 实现打印单词的菱形字符图案

    Python 实现打印单词的菱形字符图案 我就废话不多说了,还是直接看代码吧! a = [1, 2, 3, 4, 5, 6, 7, 6, 5, 4, 3, 2, 1] b = [' ' * 2 * ( ...

  6. python字符画图形_Python 实现打印单词的菱形字符图案

    我就废话不多说了,还是直接看代码吧! a = [1, 2, 3, 4, 5, 6, 7, 6, 5, 4, 3, 2, 1] b = [' ' * 2 * (7 - i) + 'Good' * i f ...

  7. python去除图片马赛克_python 检测图片是否有马赛克

    首先是canny边缘检测,将图片的边缘检测出来,参考博客 原理讲的很清晰,给原博主一个赞 边缘检测之后按照正方形检索来判定是否是马赛克内容 原理知晓了之后就很好做了 话说matlab转化为python ...

  8. python去除excel空行_python中删除列表中的空元素以及如何读取excel中的数据

    这个暂时也没有找到更好的办法,用的是别人博客中的一种办法http://www.biofacebook.com/?p=186 while " in a: a.remove(") 其中 ...

  9. python去除视频马赛克_python 给视频添加马赛克

    用法: 1. 创建空文件夹:imgs 2. 将倒数第三行中的"222056.mov"改为你的视频路径,如:"a.mov" 3. 运行以下代码 4. 稍等片刻,鼠 ...

  10. python去除excel空行_python中如何删除excel的行?

    Excel删除有两种情况, 一种是,您想删除后,留空 另外一种是,您想删除后,后面数据动态填充前面的数据 针对第二种,有一个不是太高效的办法,就是: 利用column读取后是list这个特点,删除li ...

最新文章

  1. 《Drupal实战》——1.9 小结
  2. foreach_and_函数
  3. 核PCA——从理论到实现
  4. 为什么要保持软件包依赖项自由循环的五个原因
  5. U盘的RUNAUTO..文件的删除
  6. c#给定编码中的字符无效_C#程序检查给定的字符串是否等于(==)运算符
  7. sql游标以及异常处理
  8. debian下使用dpkg来安装/卸载deb包 (转载)
  9. 华为手机灵敏度设置_和平精英灵敏度怎么调最稳华为手机?华为二指灵敏度调整设置一览[多图]...
  10. linux下的/usr目录
  11. 苹果手机有护眼模式吗_暗黑模式=护眼模式?其实手机中的这个设置才真正护眼...
  12. ftp 服务器管理工具,5款最好用的ftp 服务器管理工具
  13. 如何查看计算机所连接的打印机
  14. 文档翻译器怎么用?如何完成整篇word文档翻译
  15. Matlab pcode p文件 p代码 p文件代转m文件 被加密的p文件转换成.m文件
  16. 掌握了这30个机床编程实例,秒变数控编程高手!
  17. 在Facebook广告投放时需要注意这些问题
  18. MD5的介绍,算法和C、VB、Delphi实现
  19. Android窗口机制:六、一定要在主线程才可以更新UI吗?为什么?(源码版本SDK31)
  20. java 单元测试用例_Java 单元测试及JUnit的使用

热门文章

  1. python画概率密度图_绘制概率密度
  2. git 创建本地仓库,再关联远程创库
  3. Bootstrap3部分理解
  4. 不再谷满谷,坑满坑,看苏宁库存架构转变
  5. 十进制转换为三进制数_python3实现
  6. 割线法的C语言程序,割线法实验报告.doc
  7. js+css实现瀑布流
  8. Win7定时任务——提醒自己喝水
  9. 单片机继电器控制实验程序C语言,用单片机通过继电器来控制电热水器的实验...
  10. 新浪微博技术架构分析 2010