本文以学生的数据集为基础,利用python通过对学生的性别国籍以及课堂表现等数据进行分析,了解学生情况以及对学生的成绩进行预测。

数据来源

本文数据集来自阿里天池:学生成绩预测-数据集-阿里云天池

gender:性别;NationalITy:国籍;PlaceofBirth:出生地;StageID:级别;GradeID:年级;SectionID:班级;Topic:学科;Semester:学期;Relation:家庭关系;raisedhands:课堂举手次数;VisITedResources:浏览在线课件次数;AnnouncementsView:浏览学校公告次数;Discussion:课堂讨论次数;ParentAnsweringSurvey:家长是否填写问卷;ParentschoolSatisfaction:家长对学校满意度;StudentAbsenceDays:学生缺勤次数;Class:等级(成绩),分为L(low)、M(middle)、H(high)。

定义问题

本次分析,研究学生成绩与什么因素有关,并进行预测。

数据清洗

查看空值

数据比较没有空值异常值,数据干净不需要清洗。

数据探索EDA

数据集等级(分数)分布状况

数据集结果没有不平衡.

分析影响因素

1.性别gender

2.国籍NationalITy

3.出生地PlaceofBirth

4.级别StageID

5.年级GradeID

6.班级SectionID

7.学科Topic

8.学期Semester

9.家庭负责人Relation

10.家长是否填写问卷ParentAnsweringSurvey

11.家长满意度ParentschoolSatisfaction

12.学生缺勤次数StudentAbsenceDays

可见,Class跟gender、NationalITy、PlaceofBirth、StageID、GradeID、SectionID、Topic、Semester无关;跟Relation、ParentAnsweringSurvey、ParentschoolSatisfaction、StudentAbsenceDays有关(如性别因素,因为class分布中M是最多的L跟H差不多,而这个趋势不会因为性别不同而不同,依然是M最多,其余差不多。其余因素同理)。

13.raisedhands,VisITedResources,AnnouncementsView,Discussion

转换数据

相关矩阵

可见,discussion跟其他因素相关性相对比较低。

特征选取

选取Relation、ParentAnsweringSurvey、ParentschoolSatisfaction、StudentAbsenceDays并将其one-hot编码。而raisedhands,VisITedResources,AnnouncementsView,Discussion中选取相关性较低的raisedhands,Discussion。

建立模型(决策树)

预测结果,评价模型

预测结果分数达0.78125,结果差强人意,后续可用别的模型,和对特征数据进一步提取以提高预测的准确性。

学生成绩预测模型_学生成绩分析预测相关推荐

  1. 帮助学生改善学习方法_学生应该如何花费时间改善自己的幸福

    帮助学生改善学习方法 There have been numerous studies looking into the relationship between sleep, exercise, l ...

  2. 机器学习 预测模型_使用机器学习模型预测心力衰竭的生存时间-第一部分

    机器学习 预测模型 数据科学 , 机器学习 (Data Science, Machine Learning) 前言 (Preface) Cardiovascular diseases are dise ...

  3. mysql学生管理系统毕业设计_学生信息管理系统的设计与实现(MyEclipse,MySQL)

    学生信息管理系统的设计与实现(MyEclipse,MySQL)(任务书,开题报告,中期检查表,文献综述,毕业论文15000字,程序代码,MySQL数据库) 学生信息管理系统的开发工具是MyEclips ...

  4. 上海交通大学出版社python教材答案学生信息管理系统_学生信息管理系统(最终版)...

    <学生信息管理系统.doc>由会员分享,可免费在线阅读全文,更多与<学生信息管理系统(最终版)>相关文档资源请在帮帮文库(www.woc88.com)数亿文档库存里搜索. 1. ...

  5. 学生成绩预测模型_逻辑回归实战练习——根据学生成绩预测是否被录取

    前言: 在学习了梯度下降和逻辑回归的基本算法后,选取此案例来进行实践练习,本次练习主要通过python中的三大块pandas.numpy和matplotlib来实现,基本不涉及到sklearn库的调用 ...

  6. 学生成绩预测模型_华中农大学子在美国大学生数学建模竞赛中获佳绩

    2020年美国大学生数学建模竞赛(MCM/ICM)成绩日前揭晓,在来自30多个国家和地区的20948支参赛队伍中,华中农业大学学子斩获佳绩,共获M奖(一等)4项.H奖(二等)17项. 来自工学院的李自 ...

  7. 学生成绩预测模型_每日排行榜|四川省大学生金融科技建模大赛 10.9

    四川省大学生金融科技建模大赛  每日排行榜 十月九日榜 四川省大学生金融科技建模大赛 正如火如荼进行中 各路建模高手激烈角逐 同台竞技,竞争最强建模手 十月九日排行榜已发榜 谁将傲视群雄,最终夺魁 让 ...

  8. python学生成绩排序_学生成绩排序基础算法笔记

    刚接触程序语言的时候,经常会用到一些排序的问题,按照算法运行效率和理解上面来看的话,有的时候我们可以记录一些比较便于理解的: 1:如果一个班有5个同学考试成绩如下,需要我们通过程序的方式来对成绩从高到 ...

  9. c语言mysql 学生信息管理系统_学生信息管理系统学生时代小作品源码(C语言版)...

    /*****************************************************************************/ /* 制作一个学籍管理系统:要求包含以下 ...

  10. 学生信息系统求助_学生管理信息系统_示例

    第 1 页 共 3 页 学生信息管理数据库系统设计与开发 一 . 项目说明 一.概述 1 .项目背景:数据库程序设计 2 .编写目的:掌握数据库设计原理及相关软件的使用 3 .软件定义:学生信息管理系 ...

最新文章

  1. jQuery中的页面载入($()、ready(fn)、onload)
  2. OpenStack Nova Placement API 统一资源管理接口的未来
  3. excel批量转换日期格式,将yyyymmdd类型日期转换成yyyy-mm-dd等日期类型方法
  4. PHPRPC for PHP
  5. nodejs python jedi_Jenkins管道:选择nodejs版本(+ python版本)
  6. 空值用前值填充_Excel数据填充,原来这么简单
  7. 网站策划:如何书写网站的商业计划书
  8. 【马来西亚】娘惹的含义
  9. C++Primer读书笔记----第二章变量和基本类型
  10. BZOJ4033 [HAOI2015]树上染色 【树形dp】
  11. Houdini vex用勾股定理推算椭圆运动轨迹
  12. enovia使用富文本小结
  13. 中国独立开发者生存到底有多艰难?
  14. 慈航公益仲恺义工大区和爱心企业助力探亲日慈善活动
  15. 详细说明如何实现简易轮播效果
  16. KCL:蚂蚁自研的配置策略语言
  17. Java定时任务的实现
  18. 【算法总结】根号算法相关
  19. 阿里云mysql主从有延迟怎么办_MySQL主从数据库同步延迟问题解决
  20. 移动支付出海持续发力 爱贝带你读报告

热门文章

  1. ET Reporter
  2. Android基于ViewPager2实现循环轮播图、3D画廊效果
  3. 计算机英语ppt答辩,计算机专业毕业论文答辩(英文)详解.ppt
  4. 如何卸载快压病毒流氓软件--不停自动下载安装App
  5. mysql-front源码_MySQL-Front(5.3版本)
  6. 为心爱的人做一个超具创意的表白网页吧❤(告白气球)HTML+CSS+JavaScript
  7. Python做出来的数据可视化真香!!
  8. goahead源码分析webs.c
  9. 2020朝花夕拾-不务正业的大学生做了什么比赛?
  10. 华云数据入围2021新经济年度巅峰榜