python基础 class6(基本统计值计算、文本词频统计)
# 不定长度输入
def getNum():nums = []iNumStr = input('输入数字:')while iNumStr != '': # 空字符结束nums.append(eval(iNumStr))iNumStr = input('输入数字:')return nums# 平均值
def mean(n):smean = 0.0for i in n:smean += ireturn smean / len(n)# 计算样本标准差
def dev(n, mean_n):sdev = 0.0for i in n:sdev += pow(i - mean_n, 2)return pow(sdev / (len(n) - 1), 0.5)# 计算中位数
def median(n):n=sorted(n)size = len(n)if size % 2 == 0:return (n[size // 2] + n[size // 2 - 1]) / 2else:return n[size // 2]def main():n = getNum()m = mean(n)print("平均数:{:.2f}\t标准差:{:.2f}\t中位数:{:.2f}".format(m, dev(n, m), median(n)))try:main()
except:print("输入错误")
# 文本词频统计# 英文
# def getText():
# txt = open('hamlet.txt', 'r').read()
# txt = txt.lower()
# for char in '!@#$%^&*()_+-={}[]|\\;:"\'<,>.?/`~':
# txt = txt.replace(char, ' ')
# return txt
#
#
# hamlettxt = getText()
# words = hamlettxt.split()
# counts = {}
# for word in words:
# counts[word] = counts.get(word, 0) + 1
# items = list(counts.items())
# items.sort(key=lambda x: x[1], reverse=True)
# for i in range(10):
# word, count = items[i]
# # print(type(items[i]))
# print('{:<10}{:>5}'.format(word, count))# 中文
import jiebadef getText():txt = open('threekingdoms.txt', 'r', encoding='utf-8').read()return txtexcludes = {'将军', '却说', '荆州', '二人', '不可', '不能', '如此', '商议','如何', '主公', '军士', '左右', '军马', '引兵', '次日', '大喜','天下', '东吴', '于是', '今日', '不敢', '魏兵', '陛下', '一人','都督', '人马', '不知', '汉中', '只见', '众将', '蜀兵', '上马','大叫', '太守', '此人', '夫人', '先生', '后人', '背后', '城中','一面', '何不', '大军', '忽报', '百姓', '何故', '然后', '先锋','天子', '不如', '赶来', '原来', '令人', '江东', '下马', '喊声','正是', '徐州', '忽然', '因此', '成都', '不见', '未知', '大败','大事', '之后', '一军', '引军', '起兵', '军中', '接应', '进兵','大惊', '可以', '以为', '大怒', '不得', '心中'}
words = jieba.lcut(getText())
counts = {}
for word in words:if len(word) == 1:continueelif word == '孔明' or word == '孔明曰':rword = '诸葛亮'elif word == '关公' or word == '云长':rword = '关羽'elif word == '丞相' or word == '孟德':rword = '曹操'elif word == '玄德' or word == '玄德曰' or word == '先主':rword = '刘备'elif word == '后主':rword = '刘禅'elif word == '吕奉先' or word == '奉先':rword = '吕布'elif word == '张翼德' or word == '翼德':rword = '张飞'else:rword = wordcounts[rword] = counts.get(rword, 0) + 1
for word in excludes:del counts[word]
items = list(counts.items())
items.sort(key=lambda x: x[1], reverse=True)
for i in range(20):word, count = items[i]print('{:<8}{:>5}'.format(word, count))
python基础 class6(基本统计值计算、文本词频统计)相关推荐
- Python—— 组合数据类型(模块5: jieba库的使用)(实例:基本统计值计算文本词频统计)
前言 本篇主要介绍组合数据类型,以基本统计值计算为例,介绍函数使用和各种类型定义.以文本词频统计为例,介绍Jieba库的使用. (从本篇开始,出现的一些库中函数介绍以及部分简单代码都将以图片形式呈现) ...
- java 文本词频统计_java实现文本词频统计
File f=new File(path); Mapmap=new HashMap<>(); Version matchVersion = Version.LUCENE_31; Analy ...
- python计算特征的统计值并文本输出
python计算特征的统计值并文本输出 # 输出统计分位数 df.describe(percentiles=[0.05, 0.25, 0.5, 0.75, 0.95]) featname:A => ...
- python进行词频统计_如何利用Python进行文本词频统计
欢迎点击「算法与编程之美」↑关注我们! 本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章. 问题描述 Python在自然语言处理这个方面,有其天然的优势: ...
- python统计词频 创建字典_如何利用Python进行文本词频统计
问题描述 Python在自然语言处理这个方面,有其天然的优势:简单,快捷.所以我们经常会遇到利用Python从一篇文档中,统计文本词频的问题.以<三国演义>这部名著为例,文中哪些人物的出场 ...
- Python实例--文本词频统计
最近在MOOC跟着北京理工大学的嵩天老师学习Python(https://www.icourse163.org/learn/BIT-268001?tid=1003243006#/learn/annou ...
- python哈姆雷特词频统计_python—文本词频统计 哈姆雷特 txt 下载
原博文 2020-05-13 15:49 − 文本词频统计 -- Hamlet Hamlet下载 链接:https://pan.baidu.com/s/1Is2mBAED57i6nI38lcnXAA ...
- Python实例10:文本词频统计
Python实例10:文本词频统计 6.6.1 问题分析 在英文中文中,出现哪些词,出现多少次? 6.6.2 hamlet英文词频统计 CalHamletV1.py 6.6.3 三国演义人物出场统计 ...
- python 实现大文件md5值计算
参考:python 实现大文件md5值计算_ddw6022的博客-CSDN博客 python比较两个文本文件是否相同 - douzujun - 博客园 用python 正确计算大文件md5 值 - P ...
- Python文本词频统计
背景信息 本文实现英文文本词频统计,功能与Mapreduce中的wordcount是类似的.本文主要是为之后词向量训练做准备工作. 本地实现词频统计函数,输入一个文本文件,最终以dict的形式返回词频 ...
最新文章
- dist包编译html_gulp4 多页面项目管理打包(html, es6,less编译压缩版本控制)
- TerryLee技术专栏WCF后传正文 WCF后传系列(3):深入WCF寻址Part 3—消息过滤引擎...
- project 模板_施工进度计划表不会做?18个横道图自动生成模板,直接在线编辑...
- 网页按钮跳转位置_阻止safari从网页跳转至app
- Eyjafjalla
- 浅析OpenLayer3加载WMS一些问题
- centos8 安装nvidia 显卡驱动(一路踩坑一路填)
- 【Java】java中this$0 this$1 this$2
- Windows核心编程_获取鼠标指定位置的RGB颜色值
- oracle精度说明符1~38_数据库显示精度说明符过多
- 图解Python List数据结构
- win10虚拟机下载安装流程
- 在Mac和PC之间共享鼠标键盘(拥有多台电脑者必看)
- 解决allegro 中OUT OF DATE SHAPES问题
- AppIcon 生成工具
- treeset可以重复吗_买了好几份意外险,可以重复理赔吗?
- flyingsaucer转换多个html,Flying Saucer实现html转pdf(一些有关问题,持续更新)
- 夜夜听雨(三)(中国社会科学院 郑哲)
- k8s dashboard安装
- Java实现邮箱验证
热门文章
- java判断是否是自然数_java判断输入的是否是自然数
- 百度ai 性别_是的,ai可能是种族主义者和性别歧视者,所以我们该怎么办
- 3-5 单链表分段逆转
- 图像去模糊系列二 高斯白噪声
- android11下文件管理,华为文件管理器下载-华为文件管理器 安卓版v10.11.11.301-PC6安卓网...
- android 6.0自启动管理器,安卓6.0技巧:系统自带文件管理器
- Python库——Faker
- windows系统镜像修复计算机,Win7操作系统下系统还原和映像修复方法
- 赠书!Python 安全攻防,终于来了!
- jqwidgets技术分享