文章目录

  • 练习六:组合数据类型
    • 一:基本统计值计算
    • 二:文本词频统计--Hamlet
    • 三:人民独特性统计
    • 四:字典翻转输出
    • 五:《沉默的羔羊》之最多单词
  • 练习七:文件和数据格式化
    • 一:文件行数
    • 二:文件字符分布
    • 三:文件独特行数
    • 四:CSV格式列变换
    • 五:CSV格式数据清洗

练习六:组合数据类型

一:基本统计值计算

#请在...补充一行或多行代码
#CalStatisticsV1.py
def getNum():       #获取用户不定长度的输入Num_ = input()Num = list(eval(Num_))return Num
def mean(numbers):  #计算平均值s = 0.0for i in numbers:s = s + ireturn s/len(numbers)
def dev(numbers, mean): #计算标准差sdev = 0.0for num in numbers:sdev = sdev + (num - mean)**2return pow(sdev / (len(numbers)-1), 0.5)
def median(numbers):    #计算中位数numbers.sort()size = len(numbers)if size % 2 == 0:med = (numbers[size//2-1] + numbers[size//2])/2else:med = numbers[size//2]return med
n =  getNum() #主体函数
m =  mean(n)
print("平均值:{:.2f},标准差:{:.2f},中位数:{}".format(m,dev(n,m),median(n)))

二:文本词频统计–Hamlet

#请在...处补充代码
def getText():txt = open("hamlet.txt", "r").read()txt = txt.lower()for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':txt = txt.replace(ch, " ")   #将文本中特殊字符替换为空格return txthamletTxt = getText()
words  = hamletTxt.split()
counts = {}
for word in words:          counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True)
for i in range(10):word, count = items[i]# print ("{0:<10}{1:>5}".format(word, count))  输出出现最多的10个单词和其出现次数print(word)  

三:人民独特性统计

s = '''双儿 洪七公 赵敏 赵敏 逍遥子 鳌拜 殷天正 金轮法王 乔峰 杨过 洪七公 郭靖 杨逍 鳌拜 殷天正 段誉 杨逍 慕容复 阿紫 慕容复 郭芙 乔峰 令狐冲 郭芙 金轮法王 小龙女 杨过 慕容复 梅超风 李莫愁 洪七公 张无忌 梅超风 杨逍 鳌拜 岳不群 黄药师 黄蓉 段誉 金轮法王 忽必烈 忽必烈 张三丰 乔峰 乔峰 阿紫 乔峰 金轮法王 袁冠南 张无忌 郭襄 黄蓉 李莫愁 赵敏 赵敏 郭芙 张三丰 乔峰 赵敏 梅超风 双儿 鳌拜 陈家洛 袁冠南 郭芙 郭芙 杨逍 赵敏 金轮法王 忽必烈 慕容复 张三丰 杨逍 令狐冲 黄药师 袁冠南 杨逍 完颜洪烈 殷天正 李莫愁 阿紫 逍遥子 乔峰 逍遥子 完颜洪烈 郭芙 杨逍 张无忌 杨过 慕容复 逍遥子 虚竹 双儿 乔峰 郭芙 黄蓉 李莫愁 陈家洛 杨过 忽必烈 鳌拜 王语嫣 洪七公 韦小宝 阿朱 梅超风 段誉 岳灵珊 完颜洪烈 乔峰 段誉 杨过 杨过 慕容复 黄蓉 杨过 阿紫 杨逍 张三丰 张三丰 赵敏 张三丰 杨逍 黄蓉 金轮法王 郭襄 张三丰 令狐冲 郭芙 韦小宝 黄药师 阿紫 韦小宝 金轮法王 杨逍 令狐冲 阿紫 洪七公 袁冠南 双儿 郭靖 鳌拜 谢逊 阿紫 郭襄 梅超风 张无忌 段誉 忽必烈 完颜洪烈 双儿 逍遥子 谢逊 完颜洪烈 殷天正 金轮法王 张三丰 双儿 郭襄 阿朱 郭襄 双儿 李莫愁 郭襄 忽必烈 金轮法王 张无忌 鳌拜 忽必烈 郭襄 令狐冲 谢逊 梅超风 殷天正 段誉 袁冠南 张三丰 王语嫣 阿紫 谢逊 杨过 郭靖 黄蓉 双儿 灭绝师太 段誉 张无忌 陈家洛 黄蓉 鳌拜 黄药师 逍遥子 忽必烈 赵敏 逍遥子 完颜洪烈 金轮法王 双儿 鳌拜 洪七公 郭芙 郭襄'''
ls = s.split()
ss = set(ls)
print(len(ss))

四:字典翻转输出

s = input()
try:d = eval(s)e = {}for k in d:e[d[k]] = kprint(e)
except:print("输入错误")

五:《沉默的羔羊》之最多单词

import jieba
txt = open("沉默的羔羊.txt", encoding='utf-8').read()
words = jieba.lcut(txt) #精确模式分词,返回一个列表类型
d = {} #建立一个空字典,用来存放键值对数据
for word in words:d[word] = d.get(word, 0) + 1 #如果这个词语(键)在字典中,其值+1,不在则赋以0
maxc = 0
maxw = ""
for key in d:if d[key] > maxc and len(key) > 2:maxc = d[key] #次数maxw = key    #单词if d[key] == maxc and len(key) > 2 and key > maxw: #出现频率一致,按照Unicode排序maxw = key
print(maxw)

练习七:文件和数据格式化

一:文件行数

f = open("latex.log")
s = 0
for line in f:line = line.strip('\n')if len(line) == 0:continues += 1
print("共{}行".format(s))

二:文件字符分布

f = open("latex.log")
cc = 0
d = {}
for i in range(26):d[chr(ord('a')+i)] = 0
for line in f:for c in line:d[c] = d.get(c, 0) + 1cc += 1
print("共{}字符".format(cc), end="")
for i in range(26):if d[chr(ord('a')+i)] != 0:print(",{}:{}".format(chr(ord('a')+i), d[chr(ord('a')+i)]), end="")

三:文件独特行数

f = open("latex.log")
ls = f.readlines()
s = set(ls)
for i in s:ls.remove(i)
t = set(ls)
print("共{}独特行".format(len(s)-len(t)))

四:CSV格式列变换

f = open("data.csv")
line = f.readlines()
for i in line:i = i.replace('\n',"")a = i.split(",")a.reverse()print(",".join(a))

五:CSV格式数据清洗

# f = open("data.csv")
# s = f.read()
# s = s.replace(" ","")
# print(s)
# f.close()
f = open("data.csv")
s = f.read()
s = s.replace(" ","")
print(s)
f.close()

python123练习六+练习七相关推荐

  1. 阅读《大型网站技术架构:核心原理与案例分析》第五、六、七章

    阅读<大型网站技术架构:核心原理与案例分析>第五.六.七章,结合我们的系统,分析如何增加相应的功能,提高系统的可用性和易用性. 这三章主要讲述的是网站的可用性.伸缩性和可扩展性. 高可用架 ...

  2. 四舍五入算法、五舍六入、六舍七入、七舍八入。。。。。。。

    四舍五入:int=(int)(double +0.5); 五舍六入:int=(int)(double +0.4); 六舍七入:int=(int)(double +0.3); 七舍八入:int=(int ...

  3. Python123第六章答案

    Python123第六章答案(自写,仅供参考) By:肇院伟烨 前言 1.代码自己写的,不是标准答案,仅供参考. 2.建议看懂后自己另外写而不是复制粘贴. 3.点击目录可以转跳 文章目录 前言 1.代 ...

  4. 计算机专业全真模拟试卷答案,最新高职考试全真模拟试卷计算机类试题(二、六、七、八、九、十,山东省,有答案)...

    内容简介: 最新高职考试全真模拟试卷计算机类试题(二.六.七.八.九.十,山东省,有答案) 最新高职考试全真模拟试卷(二)计算机类试题 第一部分 考生共答题(满分100分) 一.填空题(每空1分,共3 ...

  5. 第六、七章 嵌入式Linux开发

    第六.七章 嵌入式Linux开发 BIOS读取硬盘最前面512字节(MBR),MBR中只能存储一个OS的引导记录,如多系统则会出现问题 MBR包含部分或全部Bootloader及分区表 Bootloa ...

  6. c语言实验7字符串,C语言实验六(第七章二维数组字符串数组)

    C语言实验六(第七章二维数组字符串数组) 第 1 页 共 7 页第七章二维数组.字符串数组题[书面作业] 以书面作业形式上交,2010 年 11 月 1 日课堂交三道题的源程序1. 编写一个主函数:用 ...

  7. 【影响人一生发展的关键因素】一命二运三风水,四积阴德五读书,六名七相八敬神,九交贵人十修身

    [背景] 最近和一位阅历丰富的前辈聊天,聊到了人生,为什么看似条件差不多的两个人,其发展结果却是千差万别的,然后聊到了理学的一句话"一命二运三风水,四积阴德五读书,六名七相八敬神,九交贵人十 ...

  8. 网络最流行的伤感时代空间日志发布:那一年,我们十六、七岁

    网络最流行的伤感时代空间日志发布:那一年,我们十六.七岁 - 网络最流行的伤感时代空间日志发布:那一年,我们十六.七岁 那一年,我们十六.七岁 每天没心没肺的笑着 但笑容里带着淡淡的忧伤 忧伤却没有人 ...

  9. 指数历年各月涨幅分析-验证五穷六绝七翻身是否可信

    指数通常反映了一个行业或者一类股票的行情数据.本文将对697支指数的历史各月涨幅进行分析,为量化投资作一个参考.从分析中,我们可以验证五穷六绝七翻身是否可信,并找出上涨概率最大的一些指数和月份. 1. ...

  10. 书城项目第六、七阶段

    书城项目第六.七阶段 1. 项目第六阶段:购物车 页面样式 购物车 我的订单 结算 1.1 购物车模块分析 1.2.购物车实现 1.2.1 购物车模型 1.2.2 购物车的测试 创建 pojo/Car ...

最新文章

  1. php时区问题导致php页面显示不正常
  2. 2019年中国科创板全面解读报告
  3. Knative 实战:一个微服务应用的部署
  4. 一个使用 SAP Spartacus 开发的电商网站 - Lego 乐高
  5. sdr 软件_无线电爱好者系列-1.通过SDR获取周围无线电信号及应用
  6. CAS 5.1.x 的搭建和使用(四)—— 配置使用HTTP协议访问的服务端
  7. url没有参数名怎么直接带参数_用30行Python爬虫带你看PLMM(划掉,喵星人)
  8. FPGA————构建3*3矩阵实现每一列求和
  9. python能做底层开发吗_python底层是什么语言
  10. 一次线上OOM过程的排查
  11. 【Unity】常用API和功能
  12. Little happiness matters?蒙牛新广告语英文翻译引争议
  13. 苹果Mac删除windows后无法合并分区的简单解决方法
  14. Lisp编制的坡度标注_形位公差自动标注的ATUOLISP程序设计(Ⅰ)
  15. tomcat访问html文件
  16. Egret引擎基础教程II(EUI基础使用教程)
  17. 135、137、138、139和445端口
  18. 【全网唯一】TC8一致性测试文章合集来袭(持续更新中)
  19. 新浪微博PC客户端(DotNet WinForm C# 版,C#调用新浪微博API代码,源码下载)—— 初探 (第二部分内置链接)
  20. JavaWeb程序设计课后答案

热门文章

  1. HTTP接口设计规范
  2. 使用EXCEL进行数据分组分析法
  3. 对比阿里云服务器和腾讯云服务器两者的不同之处
  4. Rust vs. Go:为什么他们在一起更好
  5. 经验总结 | PBS系统的使用
  6. 互联网裁员形势严峻,2019年程序员的发展空间还有多大?
  7. 自定义Google搜索引擎
  8. 研究生学习生活日记——第二次组会
  9. Python基础 4 字符串的变形 判断
  10. 中国互联网Web2.0 100名单