python数据分析-学生成绩分析
目标:分析学生成绩的影响因素
1.导入原始数据,以及需要用到的库
import pandas as pd
import numpy as np
df = pd.read_csv('StudentsPerformance.csv')
(数据来源于kaggle)
2.查看文件
从上面的信息可以看出这一千个学生的数据中是没有空值,而且可以看出各列数据的类型。
还可以通过unique来查看某列数据都有哪些值,是否有无效数据。
df['parental level of education'].unique()
df['test preparation course'].unique()
再来查看成绩是否为有效值(使用loc)
df.loc[(df['math score']<0) | (df['math score']>100) | (df['reading score']<0) | (df['reading score']>100) | (df['writing score']<0) | (df['writing score']>100)]
可以看出成绩中没有无效值
3.数据处理
根据目标,删除一些不需要的列(使用drop)
df.drop(['gender','race/ethnicity'],axis=1)
#参数axis默认值为0,指行,要删除列的话将axis设为1
df_1 = df.drop(['gender','race/ethnicity'],axis=1)
求学生成绩平均值
df_1['average']= round((df_1['math score']+df_1['reading score']+df_1['writing score'])/3)
#round()用来对数据四舍五入
4.分析学生成绩影响因素
df_1.groupby('parental level of education')['average'].agg([np.mean]).plot.bar()
df_1.groupby('lunch')['average'].agg([np.mean]).plot.bar()
df_1.groupby('test preparation course')['average'].agg([np.mean]).plot.bar()
从上面三张图可以初步得出结论:
1.父母学历越高,学生成绩越好
2.午餐吃的好的同学成绩较高
3.考试准备充分的同学成绩较高
以下,用相关系数分析父母学历对哪科成绩影响最大
先按照父母学历高低将表中数据替换为数值
df_1.replace({'some high school':1, 'high school':2,'some college':3,"associate's degree":4,"bachelor's degree":5,"master's degree":6},inplace = True)
#inplace = True是为了改变文档的源数据
用corr求出相关系数(相关系数接近0,说明相关性小,越接近1,正相关性越强,越接近-1,负相关性越强)
根据父母学历与学生数学、阅读、写作成绩的相关系数,可以看出,父母学历与三者都成正相关,其中与写作成绩相关性最强,而且各科之间相关性都很强,说明某一科成绩好的同学其他科成绩很可能也好。
5.结论
通过以上分析,可以初步得出以下的结论:
1.父母学历越高,学生成绩越好(对写作成绩的影响最大)
2.午餐吃的好的同学成绩较高
3.考试准备充分的同学成绩较高
4.某科成绩好的学生其他科成绩也较好(其中写作与阅读成绩相关性最强)
python数据分析-学生成绩分析相关推荐
- python数据分析学生成绩查询系统_python数据分析-学生成绩分析
python数据分析-学生成绩分析 python数据分析-学生成绩分析 目标:分析学生成绩的影响因素 1.导入原始数据,以及需要用到的库 import pandas as pd import nump ...
- 用access做考场桌贴_利用Word、Excel、Access进行考务安排及学生成绩分析的有效途径-教育文档...
利用 Word . Excel . Access 进行考务安排及学生成绩 分析的有效途径 一 问题的提出 在新课改教学评价过程中,学生考试评价扮演着重要的角 色. 考试安排的科学性和有效性是评价的基础 ...
- 学生成绩分析管理系统
一.开发目的 随着现代化社会的发展,每年都会有大量苦读寒窗的考生参加高考,但是由于竞争压力大,很多考生由于成绩不理想不能报考自己心仪的高等院校,一方面是由于自身能力不足,另一方面,在平常学习过程种,教 ...
- python学生管理系统-python实现学生成绩管理系统
本文实例为大家分享了Python实现学生成绩管理系统的具体代码,供大家参考,具体内容如下 基本功能: 输入并存储学生的信息:通过输入学生的学号.姓名.和分数,然后就可以把数据保存在建立的student ...
- 学生成绩管理系统实验报告_学习60天python成果,Python变成学生成绩管理系统
学习60天python成果,Python变成学生成绩管理系统 大家好,我是一名刚进入大学的python新秀,初次来到博客,希望通过博客想大家分享一下自己的学习成果,并记录自己的在大数据方向的经历,希望 ...
- python gui学生成绩管理系统
前几天做了一个代码框的管理系统,我这几天抽空把他做成了图形化界面的样子,利用的是Tkinter.准备工作就是建立数据库可以参考之前的博客:python mysql学生成绩管理系统 1 首先我写了一个登 ...
- 查找和排序算法的学生成绩分析实验
基于查找和排序算法的学生成绩分析实验 一.实验内容 二.实验原理 三.实验代码记录 四.实验结果 一.实验内容 编写程序将自己学号后面的8位同学的学号.姓名以及数学.英语和数据结构的成绩信息保存到学生 ...
- Python数据分析初学之分析表格
文章目录 Python数据分析初学之分析表格 任务要求 代码实现 Python数据分析初学之分析表格 任务要求 1)使用 pandas 读取文件 data.csv 中的数据 ,创建 DataFrame ...
- 用Python制作一个成绩分析程序
用Python做一个成绩分析程序 第一步:导库 第二步:导入数据 第三步:输出数据并建立分隔栏 第四步:完成分数统计并画出饼图 本程序可以实现画班级成绩饼图的效果. 第一步:导库 from pyech ...
- 3+1+2模式excel学生成绩分析模板探讨
一.引言 设计的学生成绩分析模板的初衷是不动用VBA编写excel文件,增加文件可读性,迁移性,执行性.同时,设计全科分析模式,使其有成绩者均可以依据不同的模式从而能进行成绩分析 二.设计的小样 基本 ...
最新文章
- MyBatis中的selectKey
- pom.xml详细说明
- ASM 判定一个类,实现了指定接口
- python练手经典100例-【Python精华】100个Python练手小程序
- 设计模式 - 状态模式、职责连模式
- ideal 如何创建jsp页面_HQChart使用教程1- 如何快速创建一个K线图页面
- 2020届MEM/MBA考研提面准备以及常见问题分享
- 国外服务器直播网站,海外直播服务器搭建
- Pytorch如何约束神经网络中权重/偏执的范围
- 清华大学计算机吴教授开讲啦,吴及(清华大学教授)_百度百科
- lepus(天兔数据库监控系统)部署和使用
- On-Demand Resources Guide中文版(按需加载资源--下)
- 网络安全笔记第四天day4(kali基本操作)
- 无线个人通信(WPAN)-蓝牙
- visual怎么运行python_Visual Studio运行Python程序(超级详细)
- 尊享手机APP,款款不能少!
- 记一次关键字引起的数据库错误
- 华为iMaster NCE-Campus部署步骤简略指南
- 2月24作业波斯顿房价预测线性回归
- 王洪伟:流体力学与微积分方法求解水池进排水问题