# 不定长度输入
def getNum():nums = []iNumStr = input('输入数字:')while iNumStr != '':  # 空字符结束nums.append(eval(iNumStr))iNumStr = input('输入数字:')return nums# 平均值
def mean(n):smean = 0.0for i in n:smean += ireturn smean / len(n)# 计算样本标准差
def dev(n, mean_n):sdev = 0.0for i in n:sdev += pow(i - mean_n, 2)return pow(sdev / (len(n) - 1), 0.5)# 计算中位数
def median(n):n=sorted(n)size = len(n)if size % 2 == 0:return (n[size // 2] + n[size // 2 - 1]) / 2else:return n[size // 2]def main():n = getNum()m = mean(n)print("平均数:{:.2f}\t标准差:{:.2f}\t中位数:{:.2f}".format(m, dev(n, m), median(n)))try:main()
except:print("输入错误")
# 文本词频统计# 英文
# def getText():
#     txt = open('hamlet.txt', 'r').read()
#     txt = txt.lower()
#     for char in '!@#$%^&*()_+-={}[]|\\;:"\'<,>.?/`~':
#         txt = txt.replace(char, ' ')
#     return txt
#
#
# hamlettxt = getText()
# words = hamlettxt.split()
# counts = {}
# for word in words:
#     counts[word] = counts.get(word, 0) + 1
# items = list(counts.items())
# items.sort(key=lambda x: x[1], reverse=True)
# for i in range(10):
#     word, count = items[i]
#     # print(type(items[i]))
#     print('{:<10}{:>5}'.format(word, count))# 中文
import jiebadef getText():txt = open('threekingdoms.txt', 'r', encoding='utf-8').read()return txtexcludes = {'将军', '却说', '荆州', '二人', '不可', '不能', '如此', '商议','如何', '主公', '军士', '左右', '军马', '引兵', '次日', '大喜','天下', '东吴', '于是', '今日', '不敢', '魏兵', '陛下', '一人','都督', '人马', '不知', '汉中', '只见', '众将', '蜀兵', '上马','大叫', '太守', '此人', '夫人', '先生', '后人', '背后', '城中','一面', '何不', '大军', '忽报', '百姓', '何故', '然后', '先锋','天子', '不如', '赶来', '原来', '令人', '江东', '下马', '喊声','正是', '徐州', '忽然', '因此', '成都', '不见', '未知', '大败','大事', '之后', '一军', '引军', '起兵', '军中', '接应', '进兵','大惊', '可以', '以为', '大怒', '不得', '心中'}
words = jieba.lcut(getText())
counts = {}
for word in words:if len(word) == 1:continueelif word == '孔明' or word == '孔明曰':rword = '诸葛亮'elif word == '关公' or word == '云长':rword = '关羽'elif word == '丞相' or word == '孟德':rword = '曹操'elif word == '玄德' or word == '玄德曰' or word == '先主':rword = '刘备'elif word == '后主':rword = '刘禅'elif word == '吕奉先' or word == '奉先':rword = '吕布'elif word == '张翼德' or word == '翼德':rword = '张飞'else:rword = wordcounts[rword] = counts.get(rword, 0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x: x[1], reverse=True)
for i in range(20):word, count = items[i]print('{:<8}{:>5}'.format(word, count))

python基础 class6(基本统计值计算、文本词频统计)相关推荐

  1. Python—— 组合数据类型(模块5: jieba库的使用)(实例:基本统计值计算文本词频统计)

    前言 本篇主要介绍组合数据类型,以基本统计值计算为例,介绍函数使用和各种类型定义.以文本词频统计为例,介绍Jieba库的使用. (从本篇开始,出现的一些库中函数介绍以及部分简单代码都将以图片形式呈现) ...

  2. java 文本词频统计_java实现文本词频统计

    File f=new File(path); Mapmap=new HashMap<>(); Version matchVersion = Version.LUCENE_31; Analy ...

  3. python计算特征的统计值并文本输出

    python计算特征的统计值并文本输出 # 输出统计分位数 df.describe(percentiles=[0.05, 0.25, 0.5, 0.75, 0.95]) featname:A => ...

  4. python进行词频统计_如何利用Python进行文本词频统计

    欢迎点击「算法与编程之美」↑关注我们! 本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 问题描述 Python在自然语言处理这个方面,有其天然的优势: ...

  5. python统计词频 创建字典_如何利用Python进行文本词频统计

    问题描述 Python在自然语言处理这个方面,有其天然的优势:简单,快捷.所以我们经常会遇到利用Python从一篇文档中,统计文本词频的问题.以<三国演义>这部名著为例,文中哪些人物的出场 ...

  6. Python实例--文本词频统计

    最近在MOOC跟着北京理工大学的嵩天老师学习Python(https://www.icourse163.org/learn/BIT-268001?tid=1003243006#/learn/annou ...

  7. python哈姆雷特词频统计_python—文本词频统计 哈姆雷特 txt 下载

    原博文 2020-05-13 15:49 − 文本词频统计 -- Hamlet Hamlet下载 链接:https://pan.baidu.com/s/1Is2mBAED57i6nI38lcnXAA ...

  8. Python实例10:文本词频统计

    Python实例10:文本词频统计 6.6.1 问题分析 在英文中文中,出现哪些词,出现多少次? 6.6.2 hamlet英文词频统计 CalHamletV1.py 6.6.3 三国演义人物出场统计 ...

  9. python 实现大文件md5值计算

    参考:python 实现大文件md5值计算_ddw6022的博客-CSDN博客 python比较两个文本文件是否相同 - douzujun - 博客园 用python 正确计算大文件md5 值 - P ...

  10. Python文本词频统计

    背景信息 本文实现英文文本词频统计,功能与Mapreduce中的wordcount是类似的.本文主要是为之后词向量训练做准备工作. 本地实现词频统计函数,输入一个文本文件,最终以dict的形式返回词频 ...

最新文章

  1. dist包编译html_gulp4 多页面项目管理打包(html, es6,less编译压缩版本控制)
  2. TerryLee技术专栏WCF后传正文 WCF后传系列(3):深入WCF寻址Part 3—消息过滤引擎...
  3. project 模板_施工进度计划表不会做?18个横道图自动生成模板,直接在线编辑...
  4. 网页按钮跳转位置_阻止safari从网页跳转至app
  5. Eyjafjalla
  6. 浅析OpenLayer3加载WMS一些问题
  7. centos8 安装nvidia 显卡驱动(一路踩坑一路填)
  8. 【Java】java中this$0 this$1 this$2
  9. Windows核心编程_获取鼠标指定位置的RGB颜色值
  10. oracle精度说明符1~38_数据库显示精度说明符过多
  11. 图解Python List数据结构
  12. win10虚拟机下载安装流程
  13. 在Mac和PC之间共享鼠标键盘(拥有多台电脑者必看)
  14. 解决allegro 中OUT OF DATE SHAPES问题
  15. AppIcon 生成工具
  16. treeset可以重复吗_买了好几份意外险,可以重复理赔吗?
  17. flyingsaucer转换多个html,Flying Saucer实现html转pdf(一些有关问题,持续更新)
  18. 夜夜听雨(三)(中国社会科学院 郑哲)
  19. k8s dashboard安装
  20. Java实现邮箱验证

热门文章

  1. java判断是否是自然数_java判断输入的是否是自然数
  2. 百度ai 性别_是的,ai可能是种族主义者和性别歧视者,所以我们该怎么办
  3. 3-5 单链表分段逆转
  4. 图像去模糊系列二 高斯白噪声
  5. android11下文件管理,华为文件管理器下载-华为文件管理器 安卓版v10.11.11.301-PC6安卓网...
  6. android 6.0自启动管理器,安卓6.0技巧:系统自带文件管理器
  7. Python库——Faker
  8. windows系统镜像修复计算机,Win7操作系统下系统还原和映像修复方法
  9. 赠书!Python 安全攻防,终于来了!
  10. jqwidgets技术分享