学生成绩预测模型_学生成绩分析预测
本文以学生的数据集为基础,利用python通过对学生的性别国籍以及课堂表现等数据进行分析,了解学生情况以及对学生的成绩进行预测。
数据来源
本文数据集来自阿里天池:学生成绩预测-数据集-阿里云天池
gender:性别;NationalITy:国籍;PlaceofBirth:出生地;StageID:级别;GradeID:年级;SectionID:班级;Topic:学科;Semester:学期;Relation:家庭关系;raisedhands:课堂举手次数;VisITedResources:浏览在线课件次数;AnnouncementsView:浏览学校公告次数;Discussion:课堂讨论次数;ParentAnsweringSurvey:家长是否填写问卷;ParentschoolSatisfaction:家长对学校满意度;StudentAbsenceDays:学生缺勤次数;Class:等级(成绩),分为L(low)、M(middle)、H(high)。
定义问题
本次分析,研究学生成绩与什么因素有关,并进行预测。
数据清洗
查看空值
数据比较没有空值异常值,数据干净不需要清洗。
数据探索EDA
数据集等级(分数)分布状况
数据集结果没有不平衡.
分析影响因素
1.性别gender
2.国籍NationalITy
3.出生地PlaceofBirth
4.级别StageID
5.年级GradeID
6.班级SectionID
7.学科Topic
8.学期Semester
9.家庭负责人Relation
10.家长是否填写问卷ParentAnsweringSurvey
11.家长满意度ParentschoolSatisfaction
12.学生缺勤次数StudentAbsenceDays
可见,Class跟gender、NationalITy、PlaceofBirth、StageID、GradeID、SectionID、Topic、Semester无关;跟Relation、ParentAnsweringSurvey、ParentschoolSatisfaction、StudentAbsenceDays有关(如性别因素,因为class分布中M是最多的L跟H差不多,而这个趋势不会因为性别不同而不同,依然是M最多,其余差不多。其余因素同理)。
13.raisedhands,VisITedResources,AnnouncementsView,Discussion
转换数据
相关矩阵
可见,discussion跟其他因素相关性相对比较低。
特征选取
选取Relation、ParentAnsweringSurvey、ParentschoolSatisfaction、StudentAbsenceDays并将其one-hot编码。而raisedhands,VisITedResources,AnnouncementsView,Discussion中选取相关性较低的raisedhands,Discussion。
建立模型(决策树)
预测结果,评价模型
预测结果分数达0.78125,结果差强人意,后续可用别的模型,和对特征数据进一步提取以提高预测的准确性。
学生成绩预测模型_学生成绩分析预测相关推荐
- 帮助学生改善学习方法_学生应该如何花费时间改善自己的幸福
帮助学生改善学习方法 There have been numerous studies looking into the relationship between sleep, exercise, l ...
- 机器学习 预测模型_使用机器学习模型预测心力衰竭的生存时间-第一部分
机器学习 预测模型 数据科学 , 机器学习 (Data Science, Machine Learning) 前言 (Preface) Cardiovascular diseases are dise ...
- mysql学生管理系统毕业设计_学生信息管理系统的设计与实现(MyEclipse,MySQL)
学生信息管理系统的设计与实现(MyEclipse,MySQL)(任务书,开题报告,中期检查表,文献综述,毕业论文15000字,程序代码,MySQL数据库) 学生信息管理系统的开发工具是MyEclips ...
- 上海交通大学出版社python教材答案学生信息管理系统_学生信息管理系统(最终版)...
<学生信息管理系统.doc>由会员分享,可免费在线阅读全文,更多与<学生信息管理系统(最终版)>相关文档资源请在帮帮文库(www.woc88.com)数亿文档库存里搜索. 1. ...
- 学生成绩预测模型_逻辑回归实战练习——根据学生成绩预测是否被录取
前言: 在学习了梯度下降和逻辑回归的基本算法后,选取此案例来进行实践练习,本次练习主要通过python中的三大块pandas.numpy和matplotlib来实现,基本不涉及到sklearn库的调用 ...
- 学生成绩预测模型_华中农大学子在美国大学生数学建模竞赛中获佳绩
2020年美国大学生数学建模竞赛(MCM/ICM)成绩日前揭晓,在来自30多个国家和地区的20948支参赛队伍中,华中农业大学学子斩获佳绩,共获M奖(一等)4项.H奖(二等)17项. 来自工学院的李自 ...
- 学生成绩预测模型_每日排行榜|四川省大学生金融科技建模大赛 10.9
四川省大学生金融科技建模大赛 每日排行榜 十月九日榜 四川省大学生金融科技建模大赛 正如火如荼进行中 各路建模高手激烈角逐 同台竞技,竞争最强建模手 十月九日排行榜已发榜 谁将傲视群雄,最终夺魁 让 ...
- python学生成绩排序_学生成绩排序基础算法笔记
刚接触程序语言的时候,经常会用到一些排序的问题,按照算法运行效率和理解上面来看的话,有的时候我们可以记录一些比较便于理解的: 1:如果一个班有5个同学考试成绩如下,需要我们通过程序的方式来对成绩从高到 ...
- c语言mysql 学生信息管理系统_学生信息管理系统学生时代小作品源码(C语言版)...
/*****************************************************************************/ /* 制作一个学籍管理系统:要求包含以下 ...
- 学生信息系统求助_学生管理信息系统_示例
第 1 页 共 3 页 学生信息管理数据库系统设计与开发 一 . 项目说明 一.概述 1 .项目背景:数据库程序设计 2 .编写目的:掌握数据库设计原理及相关软件的使用 3 .软件定义:学生信息管理系 ...
最新文章
- jQuery中的页面载入($()、ready(fn)、onload)
- OpenStack Nova Placement API 统一资源管理接口的未来
- excel批量转换日期格式,将yyyymmdd类型日期转换成yyyy-mm-dd等日期类型方法
- PHPRPC for PHP
- nodejs python jedi_Jenkins管道:选择nodejs版本(+ python版本)
- 空值用前值填充_Excel数据填充,原来这么简单
- 网站策划:如何书写网站的商业计划书
- 【马来西亚】娘惹的含义
- C++Primer读书笔记----第二章变量和基本类型
- BZOJ4033 [HAOI2015]树上染色 【树形dp】
- Houdini vex用勾股定理推算椭圆运动轨迹
- enovia使用富文本小结
- 中国独立开发者生存到底有多艰难?
- 慈航公益仲恺义工大区和爱心企业助力探亲日慈善活动
- 详细说明如何实现简易轮播效果
- KCL:蚂蚁自研的配置策略语言
- Java定时任务的实现
- 【算法总结】根号算法相关
- 阿里云mysql主从有延迟怎么办_MySQL主从数据库同步延迟问题解决
- 移动支付出海持续发力 爱贝带你读报告
热门文章
- ET Reporter
- Android基于ViewPager2实现循环轮播图、3D画廊效果
- 计算机英语ppt答辩,计算机专业毕业论文答辩(英文)详解.ppt
- 如何卸载快压病毒流氓软件--不停自动下载安装App
- mysql-front源码_MySQL-Front(5.3版本)
- 为心爱的人做一个超具创意的表白网页吧❤(告白气球)HTML+CSS+JavaScript
- Python做出来的数据可视化真香!!
- goahead源码分析webs.c
- 2020朝花夕拾-不务正业的大学生做了什么比赛?
- 华云数据入围2021新经济年度巅峰榜