第一题

(10分)

某班级部分学生的预处理成绩如下:

杭念云,腾望舒,邢苍,祈思慧,端木尧,贸柳,越朝,空晴虹,王白筠,蒙思雅

88,67,56,90,75,76,74,79,-20,69

1、使用以上数据创建一个Series(姓名为标签,成绩为值)

2、将小于0的成绩改为0

3、假设他们的平时分都是80分,最终成绩 = 平时分 * 30% + 成绩 * 70%,将Series中的成绩都转换为最终成绩

4、按最终成绩按从低到高排序

5、求平均成绩

最终打印:最后的series内容和平均成绩

df = pd.Series([88,67,56,90,75,76,74,79,-20,69],index=['杭念云','腾望舒','邢苍','祈思慧','端木尧','贸柳','越朝','空晴虹','王白筠','蒙思雅'])
def func(x):if x<=0:x =0return x
df = df.apply(func)
def her(x):x = 85*0.3+x*0.7return x
df = df.apply(her)
df = df.sort_values(axis=0)
print(df)
df = df.sort_values(axis=0)
print(df)

王白筠 25.5
邢苍 64.7
腾望舒 72.4
蒙思雅 73.8
越朝 77.3
端木尧 78.0
贸柳 78.7
空晴虹 80.8
杭念云 87.1
祈思慧 88.5
dtype: float64
df2 = df.mean()
print(df2)
72.67999999999999

第二题

(10分)

一位市民一个月的部分花销清单如下。

1、使用以下字典创建一个DataFrame

2、求3日的总支出

3、求微信的总使用金额

4、去掉所有现金支付的账单

5、去掉日期和账户列

6、先按类别排序,再按金额从小到大排序

最终打印:2、3的结果和4、5、6处理后的DataFrame内容

d1 = {'日期':[1,1,1,1,1,2,2,2,2,3,3,3,3,3,4,4,4,5,5,5,5,6,6,6,6,6],
'类别':['服装','食品','日用','日用','交通','日用','娱乐','食品','食品','食品','娱乐','日用','服装','交通','医疗','食品','人情','娱乐','交通','食品','娱乐','服装','日用','食品','医疗','食品'],
'金额':[120,14,52,3,8,12,60,18,5,12,42,6,99,5,55,13,100,65,5,16,30,199,31,20,28,14],
'账户':['信用卡','微信','微信','微信','支付宝','微信','支付宝','微信','微信','微信','信用卡','支付宝','支付宝','支付宝','微信','现金','现金','信用卡','现金','微信','信用卡','信用卡','微信','现金','现金','微信']}
​
a = pd.DataFrame(d1)
b =(a.loc[a['日期']<=3])
c = pd.DataFrame(b)
print(c['金额'].sum())
456
b =(a.loc[a['账户']=='微信'])
c = pd.DataFrame(b)
print(c['金额'].sum())
232
d1 =(a.loc[a['账户']!='现金'])
d1 = pd.DataFrame(d1)
d1 = d1.drop(['日期','账户'],axis=1)
d1 = d1.sort_values(['类别','金额'])
print(d1)
类别   金额

13 交通 5
4 交通 8
14 医疗 55
20 娱乐 30
10 娱乐 42
6 娱乐 60
17 娱乐 65
3 日用 3
11 日用 6
5 日用 12
22 日用 31
2 日用 52
12 服装 99
0 服装 120
21 服装 199
8 食品 5
9 食品 12
1 食品 14
25 食品 14
19 食品 16
7 食品 18
第三题(10分)

某管理系统的人员信息如下。

1、使用以下字典创建一个DataFrame

2、用‘不明’来填充姓名中的空值

3、计算平均年龄(需排除异常年龄),并用平均年龄替换掉超过120的年龄值

4、将性别中的m、f替换为男、女

5、密码必须由纯数字组成,如果不是,替换为’密码不合法’

最终打印:处理完毕后的DataFrame内容

d2 = {'ID':[1,2,3,4,5,6,7,8],
'姓名':['夏以蕊','翟天曼','苏安萱','覃英耀','黎梅风',None,'覃英耀','伏灵雨'],
'年龄':[20,182,19,21,20,19,21,20],
'性别':['女','女','f','男','m','男','男','女'],
'密码':['123456','123abc','1234','xyz123','88888888','6666','qweasd123','666666']
}
d2 = pd.DataFrame(d2)
d2 = d2[:]
d2['姓名'] = d2['姓名'].fillna('未知')#位置替代None
def func(x):if x['年龄']>=120:x['年龄'] = None
​return x
d2 = d2.apply(func,axis=1)
d2['年龄'] = d2['年龄'].fillna(d2['年龄'].mean())
def func1(x):if x['性别']=='f':x['性别'] = '女'
​return x
d2 = d2.apply(func1,axis=1)
def func2(x):if x['性别']=='m':x['性别'] = '男'
​return x
d2 = d2.apply(func2,axis=1)
#密码这里我不会了!!!!!!
def isDigit(x):for j in x['密码']:if isinstance(j,str)==True:x['密码']='密码不合法'return xd2 = d2.apply(isDigit,axis=1)
print(d2)

ID 姓名 年龄 性别 密码
0 1 夏以蕊 20.0 女 123456
1 2 翟天曼 20.0 女 123abc
2 3 苏安萱 19.0 女 1234
3 4 覃英耀 21.0 男 xyz123
4 5 黎梅风 20.0 男 88888888
5 6 未知 19.0 男 6666
6 7 覃英耀 21.0 男 qweasd123
7 8 伏灵雨 20.0 女 666666

第四题

(10分)

目前国内新冠疫情的部分数据如下。

1、使用以下字典分别创建两个DataFrame

2、陕西省12月29日~31日分别新增本土155例、165例、174例,创建一个DateFrame表示这三条数据,并纵向串接到第二个DataFrame中

3、将两个DataFram按照省份进行合并(内连接)

4、将表按日期排序(从前到后)

5、去掉累计确诊一列

6、重塑出一个DataFrame,行标签是日期,列标签是省份,现有确诊和新增本土是填充值

7、用0替代所有的空值

最终打印:处理完毕后的DateFrame内容

d3 = {'省份':['北京','浙江','山东','陕西','四川','云南','广东','广西'],'现有确诊':[12,509,24,1765,36,79,124,247],'累计确诊':[1215,2046,1047,2530,1329,1823,3486,641]
}
d4 = {'日期':['12-20','12-21','12-22','12-23','12-24','12-25','12-26','12-27','12-28'],'省份':['广东','广东','广西','陕西','云南','陕西','广西','浙江','陕西',],'新增本土':[6,2,4,52,4,157,7,1,151]}
#1、使用以下字典分别创建两个DataFrame
demo01 = pd.DataFrame(d3)
demo02 = pd.DataFrame(d4)
# 2、陕西省12月29日~31日分别新增本土155例、165例、174例,创建一个DateFrame表示这三条数据,并纵向串接到第二个DataFrame中
d5 = {'日期':['12-29','12-30','12-31'],'省份':['陕西','陕西','陕西'],'新增本土':[155,165,174]}
demo03 = pd.DataFrame(d5)
demo02 = pd.concat([demo02,demo03])
#3、将两个DataFram按照省份进行合并(内连接)
demo = pd.merge(demo01,demo02,on='省份')
​
# 4、将表按日期排序(从前到后)
demo = demo.sort_values(['日期'])
# 5、去掉累计确诊一列
demo = demo.drop(['累计确诊'],axis=1)
# 6、重塑出一个DataFrame,行标签是日期,列标签是省份,现有确诊和新增本土是填充值
demo = demo.pivot(index='日期',columns='省份',values=['现有确诊','新增本土'])
# 7、用0替代所有的空值
demo = demo.fillna(0)
print(demo)
   现有确诊                              新增本土

省份 云南 广东 广西 浙江 陕西 云南 广东 广西 浙江 陕西
日期
12-20 0.0 124.0 0.0 0.0 0.0 0.0 6.0 0.0 0.0 0.0
12-21 0.0 124.0 0.0 0.0 0.0 0.0 2.0 0.0 0.0 0.0
12-22 0.0 0.0 247.0 0.0 0.0 0.0 0.0 4.0 0.0 0.0
12-23 0.0 0.0 0.0 0.0 1765.0 0.0 0.0 0.0 0.0 52.0
12-24 79.0 0.0 0.0 0.0 0.0 4.0 0.0 0.0 0.0 0.0
12-25 0.0 0.0 0.0 0.0 1765.0 0.0 0.0 0.0 0.0 157.0
12-26 0.0 0.0 247.0 0.0 0.0 0.0 0.0 7.0 0.0 0.0
12-27 0.0 0.0 0.0 509.0 0.0 0.0 0.0 0.0 1.0 0.0
12-28 0.0 0.0 0.0 0.0 1765.0 0.0 0.0 0.0 0.0 151.0
12-29 0.0 0.0 0.0 0.0 1765.0 0.0 0.0 0.0 0.0 155.0
12-30 0.0 0.0 0.0 0.0 1765.0 0.0 0.0 0.0 0.0 165.0
12-31 0.0 0.0 0.0 0.0 1765.0 0.0 0.0 0.0 0.0 174.0

panda经典四道题期末考核分享相关推荐

  1. 2021年春季学期-信号与系统-第三次作业参考答案-第四道题

    本文是 2021年春季学期-信号与系统-第三次作业参考答案 中的参考答案. ▌第四道题 4. 求下列系统的单位冲激响应: 1)第一小题 2)第二小题 注:按照经典求解微分方程的方法进行求解,只是在确定 ...

  2. 以下用于数据存储领域的python第三方库是-南开《网络爬虫与信息提取》19秋期末考核题目【标准答案】...

    <网络爬虫与信息提取>19秋期末考核-0001 试卷总分:100 得分:70 一.单选题 (共 20 道试题,共 40 分) 1.如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行 ...

  3. 奥鹏网考大学计算机基础,[南开大学(本部)]《大学计算机基础》19秋期末考核(答案参考)...

    [奥鹏]-[南开大学(本部)]<大学计算机基础>19秋期末考核 试卷总分:100    得分:100 第1题,流程图中平行四边形表示(    ). A.开始/结束 B.输入/输出 C.条件 ...

  4. 四年级计算机期末质量分析,四年级期末质量分析

    <四年级期末质量分析>由会员分享,可在线阅读,更多相关<四年级期末质量分析(2页珍藏版)>请在人人文库网上搜索. 1.四年级上学期英语期末测试质量分析一.试卷基本情况分析试题依 ...

  5. 四年级计算机期末质量分析,四年级期末考试质量分析

    考试作为一种实现教育目的的手段,它有存在的合理性.下面是小编整理的四年级期末考试质量分析,欢迎参考! [1]四年级期末考试质量分析 一 .试题分析 1.总体认识 我认为本次考试试题以<21011 ...

  6. HTML5期末考核大作业: 网站——美丽家乡 云南民族文化(8页面) ~ 学生DW网页设计作业源码...

    HTML5期末考核大作业: 网站--美丽家乡 云南民族文化(8页面) ~ 学生DW网页设计作业源码 临近期末, 你还在为HTML网页设计结课作业,老师的作业要求感到头大?HTML网页作业无从下手?网页 ...

  7. 《应用统计学及R语言应用》期末考核

    2019-2020学年第2学期 <应用统计学及R语言应用>课程考核材料 标题: 饭店销量预测统计建模与优化 姓名: susu 学号: 专业: big data 班级: 得分: 信息工程学院 ...

  8. 计算机原理19秋期末考核,南开大学作业《计算机原理》19秋期末考核解析100

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 南开大学作业<计算机原理>19秋期末考核解析100 <计算机原理>19秋期末考核-0001 一.单选题 (共 15 道试题,共 3 ...

  9. HTML5期末考核大作业: 网站——美丽家乡 云南民族文化(8页面) ~ 学生DW网页设计作业源码

    HTML5期末考核大作业: 网站--美丽家乡 云南民族文化(8页面) ~ 学生DW网页设计作业源码 临近期末, 你还在为HTML网页设计结课作业,老师的作业要求感到头大?HTML网页作业无从下手?网页 ...

最新文章

  1. linux中pipe
  2. 认清差距,抓住人工智能历史机遇
  3. hdu 4417(树状数组+离线算法)
  4. (转载)C++ ofstream和ifstream详细用法
  5. HEVC概念缩写对照表
  6. python 写txt 换行_python中写入txt文件需要换行,以及\r 和\n
  7. 递归和非递归实现规律函数
  8. CSS字体设置的一些技巧(行高,加粗,强制换行等)
  9. linux java uml_简单实用UML关系图解
  10. 爱奇艺如何设置最小化显示在托盘
  11. LeetCode-116. 填充每个节点的下一个右侧节点指针
  12. 线性表的链式存储-单链表
  13. 技术人观点:开发人员在处理云应用时该注意什么?
  14. atitit.atiHtmlUi web组件化方案与规范v1
  15. Ubuntu18.04安装TIM、微信
  16. cad连筋字体怎么安装_你还在为CAD带“?”号头疼吗?丨CAD2500份字体大全及安装方法丨...
  17. Unity实现遮挡人物的障碍物体设为透明,并在不遮挡时恢复的个人解决方法
  18. 数据安全简单分析总结
  19. m3u8转换到mp4 python_Python 实现MP4视频转M3u8视频
  20. Visual C++ 2008入门经典 Ivor Horton

热门文章

  1. 几个学习Python的网站推荐
  2. 2019你好想跳槽了?程序员们谨记:哪里都不好混!
  3. 记录用retinaNet执行DDSM代码中的问题(求精度的过程中出现的错误)
  4. 计算几何入门 1.3:凸包的构造——增量构造法
  5. ​ ViewBag​
  6. 最全的固态硬盘ssd安装win10专业版指南
  7. Java解析Excel 获取文本和图片信息
  8. win10-未知的USB设备-解决自己问题的记录
  9. 健康管理项目第九天(套餐预约之占比饼形图、运营数据统计、报表导出 )
  10. 重看joel on software