基于机器算法的美国研究生院入学录取率预测系统实现
预测学生录取几率
数据集来源:
Admission_Predict美国本科生申请美国研究生院的录取几率数据集。
特征(Features)介绍:
GRE: GRE考试分数
TOEFL: TOEFL考试分数
University Rating:大学相对排名
SOP: 申请文书(Stetement of Purpose)质量评分
LOR:推荐信(Letter of Recommendation)分量评分
CGPA:核心课程GPA (Core GPA)
Research: 是否有实验室研究经历
结果(Response Variable)介绍: Admit:该学生录取该院校的几率
Low:录取几率小于等于0.64
Average: 录取几率在0.64到0.83之间
High: 录取几率大于等于0.83
模型实现与构建
主要实现了三个模型,其分别为:线性模型,决策树模型,随机森林模型;实现方法通过sklearn库进行。
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
将训练好的模型保存为.pkl文件。
inear_model模型实现代码展示:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import sys
import os
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
import pickle
from sklearn.linear_model import LinearRegression
from sklearn import preprocessing
from sklearn.tree import DecisionTreeRegressor
#from sklearn.cross_validation import cross_val_score, cross_val_predictdf = pd.read_csv('Admission_Predict_Ver1.1.csv')
df.rename(columns = {'Chance of Admit ':'Chance of Admit', 'LOR ':'LOR'}, inplace=True)
df.drop(labels='Serial No.', axis=1, inplace=True)from sklearn import preprocessing
minmax_scaler = preprocessing.MinMaxScaler()
minmax_scaler_fit=minmax_scaler.fit(df[['GRE Score', 'TOEFL Score']])
NormalizedGREScoreAndTOEFLScore = minmax_scaler_fit.transform(df[['GRE Score', 'TOEFL Score']])NormalizedGREScoreAndTOEFLScoreData=pd.DataFrame(NormalizedGREScoreAndTOEFLScore,columns=['GRE Score', 'TOEFL Score'])
NormalizedGREScoreAndTOEFLScoreData.head()df['GRE Score']=NormalizedGREScoreAndTOEFLScoreData['GRE Score']
df['TOEFL Score']=NormalizedGREScoreAndTOEFLScoreData['TOEFL Score']PredictorColumns=list(df.columns)
PredictorColumns.remove('Chance of Admit')X=df[PredictorColumns].values
y=df['Chance of Admit'].valuesfrom sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.3,random_state=10)lm = LinearRegression()
RF=lm.fit(X_train,y_train)with open('LinearRegression.pkl', 'wb') as file:pickle.dump(lm, file)
系统实现
系统采用flask框架加载机器学习算法模型实现系统界面。其界面如下:
可以在左侧选择输入数据特征,比如你的GRE考试分数、TOEFL考试分数等相关数据特征。并选择使用的机器学习模型。界面如下:
点击预测按钮,可以输出你成功升学的概率值。界面如下:
点击重启或者清除可以在此运行该界面,查看数据集可以查看原始数据集。
结束:
该系统是对机器学习算法研究的一个简单应用。美国研究生院更看重的是本科学生的个人综合素质,不但学习成绩要好,动手能力也不能差,本科是否毕业于名校并不会产生很大的影响。当个人的能力达到要求后,其它外部因素的影响也不大。该系统可以根据历史数据信息对于你的成绩进行一个简单的判断,判断你是否成功入学。
基于机器算法的美国研究生院入学录取率预测系统实现相关推荐
- 基于Java实现的GRE(美国研究生入学考试)学习系统
GRE(美国研究生入学考试)学习系统 一.需求分析 需求描述 经过分析与设计,我们的 GRE 学习系统的功能主要包括用户登陆与注册.用户做历次考试的试卷.自动评判与打分.试题评论浏览与添加.用户错题库 ...
- 基于灰狼算法优化的Elman神经网络数据预测
基于灰狼算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于灰狼算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...
- 基于布谷鸟算法优化的Elman神经网络数据预测-附代码
基于布谷鸟算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于布谷鸟算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电 ...
- 基于鲸鱼算法优化的Elman神经网络数据预测-附代码
基于鲸鱼算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于鲸鱼算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...
- 基于海鸥算法优化的Elman神经网络数据预测-附代码
基于海鸥算法优化的Elman神经网络数据预测 - 附代码 文章目录 基于海鸥算法优化的Elman神经网络数据预测 - 附代码 1.Elman 神经网络结构 2.Elman 神经用络学习过程 3.电力负 ...
- 基于变分自动编码器(Variational Autoencoders)疾病预测系统实战:(Keras实现并可视化训练和验证误差、最后给出topK准确率和召回率)
基于变分自动编码器(Variational Autoencoders)疾病预测系统实战:(Keras实现并可视化训练和验证误差.最后给出topK准确率和召回率) 本文中使用的VAE算法以病人病史为输入 ...
- 基于数据挖掘的疾病数据可视化分析与预测系统
温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目简介 随着医院信息系统(HIS)在全国各大医院的推广和应用,会有大量和病人相关的临床数据每天在医院中记录, ...
- 基于神经网络算法LSTM模型对股票指数进行预测
资源下载地址:https://download.csdn.net/download/sheziqiong/86813208 资源下载地址:https://download.csdn.net/downl ...
- 基于paillier算法的同态加密电子匿名投票系统
(欢迎密码学的朋友,一起相互交流学习. 对不足之处进行指正!) 最近在学习同态加密算法,正好帮导师给xxxxxx做一个关于同态加密的电子投票系统的demo. 所以就把学到的东西分享出来,欢迎同道中人 ...
最新文章
- 【 MATLAB 】xlim 、 ylim 、zlim简介
- C# 3.0新特性系列(1):隐含类型局部变量
- golang中的指针
- static在C和C++语言中的作用
- mysql sycho_Java面试题 - osc_p1rj1z8j的个人空间 - OSCHINA - 中文开源技术交流社区
- mave工程中的一个类调用另一个聚合工程的一个类_谈谈设计模式:建造者模式在jdk中的体现,它和工厂模式区别?...
- 【Spring-AOP-1】AOP相关概念
- ci框架 mysql 超时时间_mysql 字符集和校验规则( CHARSET amp; COLLATE)
- Nginx的应用之安装配置
- win7为什么打开桌面上的计算机很卡很慢,如何解决win7系统电脑反应慢
- 怎样在全球的Azure上开Case
- 在 Linux 下建立 FTP 搜索引擎
- VirtualBox 安装教程
- Python爬取熊猫办公音频素材数据
- 常用媒体查询以及手机横竖屏监听
- Latex排版大括号让其左对齐
- mkv视频文件损坏如何修复?很简单方法
- QuickCHM V2.6注册码
- android intent scheme,android Scheme使用 打开指定的Activity
- RabbitMQ Management:Management API returned status code 500
热门文章
- kaldi中文语音识别_基于thchs30(3)
- 小学六年级计算机考试试卷答案,小学六年级英语毕业考试试卷及答案
- 高压BMS的群控能源解读、操作与规模应用
- 职称评定不要计算机,中级职称评定可以不要初级职称吗?
- Android Mediaplay 详解一
- vue结合element-ui美化登录页面
- 识别花html5,对着花拍照可以识别花名字的app是什么 发现识花怎么样
- html怎么添加导航图片格式,高德车载导航自研图片格式的探索和实践
- TensorFlow 2+PyCharm显示“Process finished with exit code -1073740791 (0xC0000409)”
- 中国市场“疫“外扛起正增长,星巴克借“第三空间“文化破圈难?