现在,我有一个函数来替换countChars函数def countWords(lines):

wordDict = {}

for line in lines:

wordList = lines.split()

for word in wordList:

if word in wordDict: wordDict[word] += 1

else: wordDict[word] = 1

return wordDict

但当我运行这个程序时,它会吐出这种讨厌的东西(这只是一个例子,大约有两页文字旁边有大量的数字)before 1478

battle-field 1478

as 1478

any 1478

altogether 1478

all 1478

ago 1478

advanced. 1478

add 1478

above 1478




我对编程很陌生,所以我有点困惑。。from __future__ import division

inputFileName = 'gb.txt'

def readfile(fname):

f = open(fname, 'r')

s = f.read()


return s.lower()

def countChars(t):

charDict = {}

for char in t:

if char in charDict: charDict[char] += 1

else: charDict[char] = 1

return charDict

def findMostCommon(charDict):

mostFreq = ''

mostFreqCount = 0

for k in charDict:

if charDict[k] > mostFreqCount:

mostFreqCount = charDict[k]

mostFreq = k

return mostFreq

def printCounts(charDict):

for k in charDict:

#First, handle some chars that don't show up very well when they print

if k == '\n': print '\\n', charDict[k] #newline

elif k == ' ': print 'space', charDict[k]

elif k == '\t': print '\\t', charDict[k] #tab

else: print k, charDict[k] #Normal character - print it with its count

def printAlphabetically(charDict):

keyList = charDict.keys()


for k in keyList:

#First, handle some chars that don't show up very well when they print

if k == '\n': print '\\n', charDict[k] #newline

elif k == ' ': print 'space', charDict[k]

elif k == '\t': print '\\t', charDict[k] #tab

else: print k, charDict[k] #Normal character - print it with its count

def printByFreq(charDict):

aList = []

for k in charDict:

aList.append([charDict[k], k])

aList.sort() #Sort into ascending order

aList.reverse() #Put in descending order

for item in aList:

#First, handle some chars that don't show up very well when they print

if item[1] == '\n': print '\\n', item[0] #newline

elif item[1] == ' ': print 'space', item[0]

elif item[1] == '\t': print '\\t', item[0] #tab

else: print item[1], item[0] #Normal character - print it with its count

def main():

text = readfile(inputFileName)

charCounts = countChars(text)

mostCommon = findMostCommon(charCounts)

#print mostCommon + ':', charCounts[mostCommon]






  1. java按行读取txt文件内容_对txt文件中的内容进行排序

    如果您的文件中每行都有单词或术语,则可能需要对其进行排序.Java Arrays.sort是执行此操作的常用功能.Collections.sort()是另一个不错的说法.这是一个示例和代码. 在文件E ...

  2. 把txt文件中逗号改成空格(python)

    简单记录下,希望能帮助到有需要的同学. python把txt文件中逗号改成空格 import sys import math import os import numpy as np import m ...

  3. 将图片名写入txt文件 根据txt文件中的图片名提取特定图像 将图片插入word

    本文讲述3种方法,分别是:1. 将图片名写入txt文件:2. 根据txt文件中的图片名提取特定图像:3. 将图片插入word 将图片名写入txt文件(可将训练集.测试集中图片名分别记录在txt文件中) ...

  4. python找到一行单词中最长的_python - 查找.txt文件中最长的单词,不带标点符号 - SO中文参考 - www.soinside.com...

    我正在做Python文件I / O练习,尽管在尝试查找.txt文件每一行中最长的单词的练习上取得了巨大进步,但我无法摆脱标点符号.] > 这是我的代码:with open("origi ...

  5. python中 t表示什么_在txt文件中\t表示什么?

    我用pandas打开一个txt文件,文件中应该有一个分栏符的地方是\t.在 我在文件里读的是这样的:df=pd.read_csv(r'file.txt') 数据帧如下所示: ^{pr2}$ 我希望它看 ...

  6. python存储大量数据_如何在文件中密集地存储大量数据?

    如果你期望存储一个均匀分布的数字,那么看看疯狂的物理学家的答案.但是,如果您预期存储的大部分是小数字,但需要能够存储一些大的数字,那么这些方案可能也很有用.在 如果只需要考虑长度为255字节或更少字节 ...

  7. python 文件中搜索字符串_在txt文件中搜索字符串Python

    为什么你总是得到True的原因已经给出,所以我只提出另一个建议: 如果你的文件不是太大,你可以读它到一个字符串,只是使用(更容易,通常比每行阅读和检查行更快): if 'blabla' in open ...

  8. python 对 文件内容 搜索_在txt文件中搜索数据

    如果您设计了数据格式,固定宽度的列不是一个很好的格式.但如果你被他们困住了,他们很容易对付.在 首先,要分析数据:addressbook = [] with open('addressbook.txt ...

  9. python读word文档计算字数,Python统计字数并将结果输入到TXT文件中

    import string import pandas as pd def str_count(str): '''找出字符串中的中英文.空格.数字.标点符号个数''' count_en = count ...


  1. DevExpress.XtraReports打印
  2. ejs文件与html,将HTMLWebpackPlugin与EJS文件一起使用
  3. SQL Server 2005 MD5函数
  4. 在一个JS文件中包含中文字符串,通过innerHTML输出后中文乱码?
  5. java identity_仔细研究Java Identity API
  6. [luoguP2760] 科技庄园(背包DP)
  7. 1002-487-3279*北京大学acm-oj-java语言题解
  8. AngularJS中的表单验证机制
  9. python list函数使用总结_python——list总结
  10. (转)AI vs 深度学习 vs 机器学习:人工智能的 12 大应用场景
  11. web项目目录访问 路径
  12. git里面的文件怎么删不掉_彻底删除git中没用的大文件
  13. xcode6.3 ineligible devices解决方法
  14. shape属性详解使用
  15. 2008 go server sql 批处理_Transact-SQL批处理
  16. 数学回味系列之19 - 有趣的数字
  17. 5G通信设备安装,不仅是技术活,更是一门艺术活!(干货图文大全)
  18. 2015多校第9场 HDU 5405 Sometimes Naive 树链剖分
  19. PHP使用socket TCP通信对接富途牛牛
  20. dns被劫持怎么办,一文说清dns劫持与防御


