目标:分析学生成绩的影响因素

1.导入原始数据,以及需要用到的库

import pandas as pd
import numpy as np
df = pd.read_csv('StudentsPerformance.csv')

(数据来源于kaggle)

2.查看文件


从上面的信息可以看出这一千个学生的数据中是没有空值,而且可以看出各列数据的类型。
还可以通过unique来查看某列数据都有哪些值,是否有无效数据。

df['parental level of education'].unique()
df['test preparation course'].unique()


再来查看成绩是否为有效值(使用loc)

df.loc[(df['math score']<0) | (df['math score']>100) | (df['reading score']<0) | (df['reading score']>100) | (df['writing score']<0) | (df['writing score']>100)]


可以看出成绩中没有无效值

3.数据处理
根据目标,删除一些不需要的列(使用drop)

df.drop(['gender','race/ethnicity'],axis=1)
#参数axis默认值为0,指行,要删除列的话将axis设为1
df_1 = df.drop(['gender','race/ethnicity'],axis=1)


求学生成绩平均值

df_1['average']= round((df_1['math score']+df_1['reading score']+df_1['writing score'])/3)
#round()用来对数据四舍五入


4.分析学生成绩影响因素

df_1.groupby('parental level of education')['average'].agg([np.mean]).plot.bar()
df_1.groupby('lunch')['average'].agg([np.mean]).plot.bar()
df_1.groupby('test preparation course')['average'].agg([np.mean]).plot.bar()




从上面三张图可以初步得出结论:
1.父母学历越高,学生成绩越好
2.午餐吃的好的同学成绩较高
3.考试准备充分的同学成绩较高

以下,用相关系数分析父母学历对哪科成绩影响最大

先按照父母学历高低将表中数据替换为数值

df_1.replace({'some high school':1, 'high school':2,'some college':3,"associate's degree":4,"bachelor's degree":5,"master's degree":6},inplace = True)
#inplace = True是为了改变文档的源数据


用corr求出相关系数(相关系数接近0,说明相关性小,越接近1,正相关性越强,越接近-1,负相关性越强)

根据父母学历与学生数学、阅读、写作成绩的相关系数,可以看出,父母学历与三者都成正相关,其中与写作成绩相关性最强,而且各科之间相关性都很强,说明某一科成绩好的同学其他科成绩很可能也好。

5.结论
通过以上分析,可以初步得出以下的结论:
1.父母学历越高,学生成绩越好(对写作成绩的影响最大)
2.午餐吃的好的同学成绩较高
3.考试准备充分的同学成绩较高
4.某科成绩好的学生其他科成绩也较好(其中写作与阅读成绩相关性最强)

python数据分析-学生成绩分析相关推荐

  1. python数据分析学生成绩查询系统_python数据分析-学生成绩分析

    python数据分析-学生成绩分析 python数据分析-学生成绩分析 目标:分析学生成绩的影响因素 1.导入原始数据,以及需要用到的库 import pandas as pd import nump ...

  2. 用access做考场桌贴_利用Word、Excel、Access进行考务安排及学生成绩分析的有效途径-教育文档...

    利用 Word . Excel . Access 进行考务安排及学生成绩 分析的有效途径 一 问题的提出 在新课改教学评价过程中,学生考试评价扮演着重要的角 色. 考试安排的科学性和有效性是评价的基础 ...

  3. 学生成绩分析管理系统

    一.开发目的 随着现代化社会的发展,每年都会有大量苦读寒窗的考生参加高考,但是由于竞争压力大,很多考生由于成绩不理想不能报考自己心仪的高等院校,一方面是由于自身能力不足,另一方面,在平常学习过程种,教 ...

  4. python学生管理系统-python实现学生成绩管理系统

    本文实例为大家分享了Python实现学生成绩管理系统的具体代码,供大家参考,具体内容如下 基本功能: 输入并存储学生的信息:通过输入学生的学号.姓名.和分数,然后就可以把数据保存在建立的student ...

  5. 学生成绩管理系统实验报告_学习60天python成果,Python变成学生成绩管理系统

    学习60天python成果,Python变成学生成绩管理系统 大家好,我是一名刚进入大学的python新秀,初次来到博客,希望通过博客想大家分享一下自己的学习成果,并记录自己的在大数据方向的经历,希望 ...

  6. python gui学生成绩管理系统

    前几天做了一个代码框的管理系统,我这几天抽空把他做成了图形化界面的样子,利用的是Tkinter.准备工作就是建立数据库可以参考之前的博客:python mysql学生成绩管理系统 1 首先我写了一个登 ...

  7. 查找和排序算法的学生成绩分析实验

    基于查找和排序算法的学生成绩分析实验 一.实验内容 二.实验原理 三.实验代码记录 四.实验结果 一.实验内容 编写程序将自己学号后面的8位同学的学号.姓名以及数学.英语和数据结构的成绩信息保存到学生 ...

  8. Python数据分析初学之分析表格

    文章目录 Python数据分析初学之分析表格 任务要求 代码实现 Python数据分析初学之分析表格 任务要求 1)使用 pandas 读取文件 data.csv 中的数据 ,创建 DataFrame ...

  9. 用Python制作一个成绩分析程序

    用Python做一个成绩分析程序 第一步:导库 第二步:导入数据 第三步:输出数据并建立分隔栏 第四步:完成分数统计并画出饼图 本程序可以实现画班级成绩饼图的效果. 第一步:导库 from pyech ...

  10. 3+1+2模式excel学生成绩分析模板探讨

    一.引言 设计的学生成绩分析模板的初衷是不动用VBA编写excel文件,增加文件可读性,迁移性,执行性.同时,设计全科分析模式,使其有成绩者均可以依据不同的模式从而能进行成绩分析 二.设计的小样 基本 ...

最新文章

  1. MyBatis中的selectKey
  2. pom.xml详细说明
  3. ASM 判定一个类,实现了指定接口
  4. python练手经典100例-【Python精华】100个Python练手小程序
  5. 设计模式 - 状态模式、职责连模式
  6. ideal 如何创建jsp页面_HQChart使用教程1- 如何快速创建一个K线图页面
  7. 2020届MEM/MBA考研提面准备以及常见问题分享
  8. 国外服务器直播网站,海外直播服务器搭建
  9. Pytorch如何约束神经网络中权重/偏执的范围
  10. 清华大学计算机吴教授开讲啦,吴及(清华大学教授)_百度百科
  11. lepus(天兔数据库监控系统)部署和使用
  12. On-Demand Resources Guide中文版(按需加载资源--下)
  13. 网络安全笔记第四天day4(kali基本操作)
  14. 无线个人通信(WPAN)-蓝牙
  15. visual怎么运行python_Visual Studio运行Python程序(超级详细)
  16. 尊享手机APP,款款不能少!
  17. 记一次关键字引起的数据库错误
  18. 华为iMaster NCE-Campus部署步骤简略指南
  19. 2月24作业波斯顿房价预测线性回归
  20. 王洪伟:流体力学与微积分方法求解水池进排水问题

热门文章

  1. ra8873 ST7789区别
  2. react+ts+gulpjs将插件转成umd.js文件
  3. 百度网盘python客户端——筑梦之路
  4. chrome保存网页为图片
  5. 下拉框优化威zx78_搜索框下拉优化即zx78
  6. java制作摇奖系统_基于Java实现抽奖系统
  7. 大学四年Java学习路线规划,所有私藏资料我都贡献出来了,我要是早知道就好了
  8. 让iPhone不能自动下载系统更新的一个办法
  9. 工具说明书 - 滚动截屏和录屏软件ShareX
  10. Theano介绍及简单应用