# 英文文本字母跳转概率统计.py
# 文本示例:hemlet.txt
import csv
def getText():txt = open("hamlet.txt","r").read()txt = txt.lower()for ch in '!"#$%()&*+-,:;<>={}[]\/_.~`“”\'‘’?':txt = txt.replace(ch," ")return txt
hamletTxt = getText()
words = hamletTxt.split()
counts = {}
# for word in words:
#     counts[word] = counts.get(word,0)+1
# items = list(counts.items())
# items.sort(key=lambda x:x[1],reverse= True)
counts_ch={}
PR_counts={}
for word in words:ls_word=list(word)# print(ls_word)for i in range(len(ls_word)-1):Answer_ch="{}->{}".format(ls_word[i],ls_word[i+1])counts_ch[Answer_ch]=counts_ch.get(Answer_ch,0)+1
amount=0
for i in counts_ch.values():amount=amount+i
for key in counts_ch.keys():PR_counts[key]=counts_ch[key]/amount
# print(amount)
# for i in range (10):
#     word,count = items[i]
#     print("{0:<10}{1:>5}".format(word,count))
# print(counts_ch)
items_ch=list(PR_counts.items())
items_ch.sort(key=lambda x: x[1], reverse=True)
Rank=0
for i in range(len(PR_counts)):Rank=Rank+1Answer_ch,PR_count=items_ch[i]print("{0:<3}:{1:<10}{2:>5}".format(Rank,Answer_ch, PR_count))
# print(PR_counts)
matrix_ch=[]
for row in range(0,26):matrix_ch.append([])for column in range(0,26):try:PR=PR_counts["{}->{}".format(chr(row+97),chr(column+97))]except KeyError:PR=0matrix_ch[row].append(PR)
# print(matrix_ch)
Answer_matrix=[]
for row in range(27):Answer_matrix.append([])if row==0:Answer_matrix[0].append(" ")for i in range(26):Answer_matrix[0].append(chr(i+97))else:Answer_matrix[row].append(chr(row+96))for column in range(26):Answer_matrix[row].append(matrix_ch[row-1][column])
writer = csv.writer(open("字母跳转概率输出矩阵.csv",'w',newline=''))
for item in Answer_matrix:writer.writerow(item)

Python 英文文本字母跳转概率统计相关推荐

  1. python英文文本词频统计_python实现简单的英文词频统计

    1 __author__ = 'Oscar_Yang' 2 #-*- coding= utf-8 -*- 3 #copyRight by OSCAR 4 """ 5 本脚 ...

  2. python英文文本词频统计代码_Python小程序:文本词频统计(英文+中文)

    在学习了组合数据类型和文件操作之后就可以做出下面的文本词频统计的小程序了: 1. 下面是英文文本的词频统计,统计了作者的一篇英文论文 #文本词频统计:英文文本 def gettext(): #从文件中 ...

  3. python英文文本分析和提取_英文文本挖掘预处理流程总结

    在中文文本挖掘预处理流程总结中,我们总结了中文文本挖掘的预处理流程,这里我们再对英文文本挖掘的预处理流程做一个总结. 1. 英文文本挖掘预处理特点 英文文本的预处理方法和中文的有部分区别.首先,英文文 ...

  4. python 英文文本中的关键词提取

    python 英文关键词提取详细教程: https://opensourcelibs.com/lib/pytextrank # To install from PyPi: 慢就加镜像 -i pytho ...

  5. python英文文本词频统计_python编程:英文小说词频统计

    一.编程目的: 1.英文小说(The Myths )分词,并进行词频统计 2.绘制词频统计直方图 3.为小说情感分析做准备 二.编程环境: 1.pyhon3+pycharm 2.需安装模块:strin ...

  6. python英文文本词频统计_Python英文文章词频统计(14份剑桥真题词频统计)

    Python剑桥真题词频统计 最好还是要学以致用,自主搜集了19年最近的14份剑桥真题之后,通过Python提供的jieba第三方库,对所有的文章信息进行了词频统计,并选择性地剔除了部分简易词汇,比如 ...

  7. python英文文本高频词统计

    统计出现频率最高的20个词,代码: def getText():txt = open('comment.text','r',encoding='utf-8').read()txt = txt.lowe ...

  8. python英文文本情感分析_舆情信息浩如烟海?看看如何用Python进行英文文本的情感分析...

    市场每天都在生成海量的舆情信息,这些信息可以帮助我们识别市场情绪的转变.如果只是人工地去跟踪大量的舆论和研报显然缺乏效率.我们可以试试让机器来完成这个工作. 数据科学在数值领域中很常见,但这个不断壮大 ...

  9. python英文文本情感分析_sentimentpy模块进行中文文本情感分类

    sentimentpy是我根据R语言的一个文本情感分析包sentiment进行开发的, 开发的初衷有: R的sentiment已经被弃坑, 没人维护 Python比R更擅长文本处理 sentiment ...

最新文章

  1. js_高级_表格排序案例---分别用面向过程和面向对象实现
  2. 新年新征程——写在“微软中国研发集团”更名之际
  3. SVD原理及其应用导论
  4. Ciel and Robot CodeForces - 322C
  5. java跟踪会话_JavaWeb会话跟踪
  6. 第七十五期:Java 2019 生态圈使用报告,这结果你赞同吗?
  7. C#开发笔记之10-如何用C#根据发票代码判断发票种类?
  8. 单应性矩阵的理解及求解
  9. 路由器刷openwrt固件准备工作
  10. Spire.Office for Java 7.5.4
  11. php soh stx,symbol NULL SOH STX ETX EOT ENQ ACK ASCII(符号零SOH STX ETX传输结束询问ACK ASCII).pdf...
  12. 等保-机房项目验收方法
  13. EMNIST: an extension of MNIST to handwritten letters(数据集简介)
  14. 能让3D打印自动支撑和减少压力积累的云软件
  15. 用css3属性如何来做一个动态螺旋丸
  16. 假如时光可以倒流我要如何选择
  17. Idea自带http测试功能真香
  18. gcc : 无法将“gcc”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。
  19. MySQL8从入门到精通学习笔记
  20. 基础实验6-2.5 城市间紧急救援

热门文章

  1. DBeaver执行.sql脚本报错:ERROR 1064 (42000) at line 1
  2. 【详解】二维数组的长度问题。int[][] arr = new arr[3][4];arr.length;arr[0].length;
  3. C#中二维数组的二维长度
  4. MySQL的while循环
  5. Linux shell:脚本判断进程是否正在运行
  6. 如何快速制作微信朋友圈方图?
  7. url中的20%、22%、26%、7B%、%7D、28%、29%怎么解析还原成真实的字符
  8. twitter如何以图搜图_没有完整图时,如何使用图深度学习?你需要了解流形学习2.0版本...
  9. 浅谈cookie跨域的解决方案——document.domain
  10. 《Filter Pruning using Hierarchical Group Sparse》ICPR2020论文详解