预测学生录取几率

数据集来源:

Admission_Predict美国本科生申请美国研究生院的录取几率数据集。

特征(Features)介绍:
GRE: GRE考试分数
TOEFL: TOEFL考试分数
University Rating:大学相对排名
SOP: 申请文书(Stetement of Purpose)质量评分
LOR:推荐信(Letter of Recommendation)分量评分
CGPA:核心课程GPA (Core GPA)
Research: 是否有实验室研究经历

结果(Response Variable)介绍: Admit:该学生录取该院校的几率

Low:录取几率小于等于0.64
Average: 录取几率在0.64到0.83之间
High: 录取几率大于等于0.83

模型实现与构建

主要实现了三个模型,其分别为:线性模型,决策树模型,随机森林模型;实现方法通过sklearn库进行。

from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor

将训练好的模型保存为.pkl文件。

inear_model模型实现代码展示:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import sys
import os
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
import pickle
from sklearn.linear_model import LinearRegression
from sklearn import preprocessing
from sklearn.tree import DecisionTreeRegressor
#from sklearn.cross_validation import cross_val_score, cross_val_predictdf = pd.read_csv('Admission_Predict_Ver1.1.csv')
df.rename(columns = {'Chance of Admit ':'Chance of Admit', 'LOR ':'LOR'}, inplace=True)
df.drop(labels='Serial No.', axis=1, inplace=True)from sklearn import preprocessing
minmax_scaler = preprocessing.MinMaxScaler()
minmax_scaler_fit=minmax_scaler.fit(df[['GRE Score', 'TOEFL Score']])
NormalizedGREScoreAndTOEFLScore = minmax_scaler_fit.transform(df[['GRE Score', 'TOEFL Score']])NormalizedGREScoreAndTOEFLScoreData=pd.DataFrame(NormalizedGREScoreAndTOEFLScore,columns=['GRE Score', 'TOEFL Score'])
NormalizedGREScoreAndTOEFLScoreData.head()df['GRE Score']=NormalizedGREScoreAndTOEFLScoreData['GRE Score']
df['TOEFL Score']=NormalizedGREScoreAndTOEFLScoreData['TOEFL Score']PredictorColumns=list(df.columns)
PredictorColumns.remove('Chance of Admit')X=df[PredictorColumns].values
y=df['Chance of Admit'].valuesfrom sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=10)lm = LinearRegression()
RF=lm.fit(X_train,y_train)with open('LinearRegression.pkl', 'wb') as file:pickle.dump(lm, file)

系统实现

系统采用flask框架加载机器学习算法模型实现系统界面。其界面如下:

可以在左侧选择输入数据特征,比如你的GRE考试分数、TOEFL考试分数等相关数据特征。并选择使用的机器学习模型。界面如下:

点击预测按钮,可以输出你成功升学的概率值。界面如下:

点击重启或者清除可以在此运行该界面,查看数据集可以查看原始数据集。

结束:

该系统是对机器学习算法研究的一个简单应用。美国研究生院更看重的是本科学生的个人综合素质,不但学习成绩要好,动手能力也不能差,本科是否毕业于名校并不会产生很大的影响。当个人的能力达到要求后,其它外部因素的影响也不大。该系统可以根据历史数据信息对于你的成绩进行一个简单的判断,判断你是否成功入学。

基于机器算法的美国研究生院入学录取率预测系统实现相关推荐

  1. 基于Java实现的GRE(美国研究生入学考试)学习系统

    GRE(美国研究生入学考试)学习系统 一.需求分析 需求描述 经过分析与设计,我们的 GRE 学习系统的功能主要包括用户登陆与注册.用户做历次考试的试卷.自动评判与打分.试题评论浏览与添加.用户错题库 ...

  2. 基于灰狼算法优化的Elman神经网络数据预测

    基于灰狼算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于灰狼算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...

  3. 基于布谷鸟算法优化的Elman神经网络数据预测-附代码

    基于布谷鸟算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于布谷鸟算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电 ...

  4. 基于鲸鱼算法优化的Elman神经网络数据预测-附代码

    基于鲸鱼算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于鲸鱼算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...

  5. 基于海鸥算法优化的Elman神经网络数据预测-附代码

    基于海鸥算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于海鸥算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...

  6. 基于变分自动编码器(Variational Autoencoders)疾病预测系统实战:(Keras实现并可视化训练和验证误差、最后给出topK准确率和召回率)

    基于变分自动编码器(Variational Autoencoders)疾病预测系统实战:(Keras实现并可视化训练和验证误差.最后给出topK准确率和召回率) 本文中使用的VAE算法以病人病史为输入 ...

  7. 基于数据挖掘的疾病数据可视化分析与预测系统

    温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目简介 随着医院信息系统(HIS)在全国各大医院的推广和应用,会有大量和病人相关的临床数据每天在医院中记录, ...

  8. 基于神经网络算法LSTM模型对股票指数进行预测

    资源下载地址:https://download.csdn.net/download/sheziqiong/86813208 资源下载地址:https://download.csdn.net/downl ...

  9. 基于paillier算法的同态加密电子匿名投票系统

    (欢迎密码学的朋友,一起相互交流学习. 对不足之处进行指正!) 最近在学习同态加密算法,正好帮导师给xxxxxx做一个关于同态加密的电子投票系统的demo.  所以就把学到的东西分享出来,欢迎同道中人 ...

最新文章

  1. 【 MATLAB 】xlim 、 ylim 、zlim简介
  2. C# 3.0新特性系列(1):隐含类型局部变量
  3. golang中的指针
  4. static在C和C++语言中的作用
  5. mysql sycho_Java面试题 - osc_p1rj1z8j的个人空间 - OSCHINA - 中文开源技术交流社区
  6. mave工程中的一个类调用另一个聚合工程的一个类_谈谈设计模式:建造者模式在jdk中的体现,它和工厂模式区别?...
  7. 【Spring-AOP-1】AOP相关概念
  8. ci框架 mysql 超时时间_mysql 字符集和校验规则( CHARSET amp; COLLATE)
  9. Nginx的应用之安装配置
  10. win7为什么打开桌面上的计算机很卡很慢,如何解决win7系统电脑反应慢
  11. 怎样在全球的Azure上开Case
  12. 在 Linux 下建立 FTP 搜索引擎
  13. VirtualBox 安装教程
  14. Python爬取熊猫办公音频素材数据
  15. 常用媒体查询以及手机横竖屏监听
  16. Latex排版大括号让其左对齐
  17. mkv视频文件损坏如何修复?很简单方法
  18. QuickCHM V2.6注册码
  19. android intent scheme,android Scheme使用 打开指定的Activity
  20. RabbitMQ Management:Management API returned status code 500

热门文章

  1. kaldi中文语音识别_基于thchs30(3)
  2. 小学六年级计算机考试试卷答案,小学六年级英语毕业考试试卷及答案
  3. 高压BMS的群控能源解读、操作与规模应用
  4. 职称评定不要计算机,中级职称评定可以不要初级职称吗?
  5. Android Mediaplay 详解一
  6. vue结合element-ui美化登录页面
  7. 识别花html5,对着花拍照可以识别花名字的app是什么 发现识花怎么样
  8. html怎么添加导航图片格式,高德车载导航自研图片格式的探索和实践
  9. TensorFlow 2+PyCharm显示“Process finished with exit code -1073740791 (0xC0000409)”
  10. 中国市场“疫“外扛起正增长,星巴克借“第三空间“文化破圈难?