2021年美赛准备(学习笔记) 2016年C题优质基金挑战

2021年美赛准备

    • 2021年美赛准备(学习笔记) 2016年C题优质基金挑战
  • 题目
  • 怎么解决问题
  • 算法的选择
  • 背景
  • 数据处理
  • 数据填充
  • 最大最小数据归一化
  • 模型选择
  • 优点好处

题目

该Goodgrant(格兰特)基金会就是要帮助提高本科生参加在美国学院和大学教育表现的慈善组织。要做到这一点,该基金会拟共$ 100,000,000(100万美元)捐给每年学校提供适当的小组,已经运行五年(短期)了,从2016年7月开始这样做,他们不希望重复投资和其他重点大型授予组织如盖茨基金会和Lumina的基础。

您的团队已被要求由Goodgrant基金会建立一个模型,以确定最佳的投资策略,确定了学校,每所学校的投资金额,对投资回报率,以及持续时间,(feture)并希望该组织的资金应提供有最高可能产生对学生的表现有很强的正效应。(预测,投资应有价值和帮助)该战略应包括学校,你是根据每个候选学校的证明潜力有效地利用私人资金,建议投资适当的方式定义的1到N优化并优先候选名单,和投资回报(ROI)(核心问题)的预计收益慈善组织如Goodgrant基金会。

为了帮助你的努力,附加的数据文件(ProblemCDATA.zip)包含来自美国国家中心教育统计(www.nces.ed.gov/ipeds),它在几乎所有的后拥有大量的调查信息数据库中提取信息二级学院和大学在美国,与大学记分卡的数据集(https://collegescorecard.ed.gov),其中包括各种机构的性能数据。您的模型和随后的战略必须建立在这两个数据集的一些有意义的,可防御的子集。(给定的数据有残缺

怎么解决问题

怎么解决问题:
这个C题目核心问题是建立一个投资回报率模型,然后我们可以通过赛题提供的数据抽取相关影响的投资回报率模型features(投资金额,投资回报率,持续时间),以及过去5年的投资结果对我们未来的投资项目进行优化和预测。

算法的选择

算法的选择:
看到这个题目属于建立优化和预测的模型,我们就可以想到很多和这个模型相关的算法
比如时间序列算法,灰色预测算法,K-mean聚类,线性预测,主成分分析,拉格朗日插值,AR预测模型等等算法来搭建模型。
然后我们这篇论文根据它的概述外面也很容易了解到它也是选择基础的如时间序列算法,灰色预测算法,K-mean聚类等算法
因为美赛的题目大概都是从以下6个框架来提取的
① 拟合和分析
② 关联和因果
③ 分类和判别
④ 评价与决策
⑤ 预测和预报
⑥ 优化和控制
启示:这给我们的启示是我们要注重6个模型的基本算法,在分析完题目就大概了解到我们需要什么样的算法来建立模型了

背景

正文的话选择大数据为切入点,这也刚好符合我们C题目的类型,并且在最后也简要概述了我们这个模型。

数据处理

数据处理:
因为原始数据量大,首先要根据信息的完整性和有用性进行数据筛选。比赛的数据文档提供了7805所学校
对7805所学校进行数据筛选:
我们只考虑文件问题中的2978所候选学校,并将这些学校与文件问题C- Most Recent cohordata(记分卡元素).xlsx中的95个属性进行匹配。(为了让我们的投资有意义,我们选择的投资学校必须拥有严格的制度体系,注册信息,信息评价良好等正确的因素,不然的我们的投资毫无意义)
操作步骤:
① 删除那些目前不是运营机构、受教育部严格资金监控的学校,这意味着它们面临经济萧条、缺少学生、没有或非常有限的学位授予比例信息。在这些学校上投资毫无意义。
② 删除50%属性为空的学校。如果缺失数据的百分比超过50%,则归算会产生很大的误差,我们将其作为缺失数据的阈值(阈值又叫临界值,是指一个效应能够产生的最低值或最高值)

数据填充

数据填充:
K-means聚类算法(K代表质心)
操作步骤:
① 先把拥有完整信息的学校按照不同属性聚类(“PCIPXXXXX”指不同学科(包括38个学科)所授予学位的百分比,表示各学校的学科构成;“UGDS”指学校的规模,“UGDs xXXXX”指白人、黑人、亚裔等学生的比例(包括9种不同的属性),表示学校的学生构成;而“PCT- FLOAN”指的是所有获得联邦学生贷款的联邦本科生的百分比,表示学生的学校经济状况。)
② 再把具有相同属性的聚类后的数值取平均值填到缺失的数据中。

最大最小数据归一化

最大最小数据归一化:
数据的离散性大大降低,数据之间的内聚性增加,数据更加密集

模型选择

用了什么模型:
ROI评价模型(投资回报率(ROI)=产出/投入紧迫感100%)
产出(毕业后工资、留职率、还款能力、教育提升率)
投入(学费)
紧迫感(助学金、贷款)
通过层次分析法、主成分分析法获得各个属性所占有的权重
通过灰色预测模型、时间序列模型求取最优解,预测未来收益最大化

优点好处

优点好处是什么:
① 把题目归类
② 使用的典型算法(K型聚类算法、层次分析法、主成分分析法、灰色预测模型、时间序列模型)来建立模型
③ 对论文的写作排版内容有了更深的理解

2021年美赛准备(学习笔记) 2016年C题优质基金挑战相关推荐

  1. 最全的2021蓝桥杯算法课《算法很美》的学习笔记总目录+真题详解

    这里写目录标题 第一章 位运算 第二章 递归 第三章查找与排序

  2. 2021年美赛F题总结

    2021年美赛F题总结 肝到了早上六点20分才算是把F题的论文交上去了呜呜,最后把论文发给官方的时候3个人紧张死了,检查了7,8遍就怕出一点错,官方不接收我们的文章,那个点已经神志不清了,又在官网不停 ...

  3. 2021年美赛B题目思路(仅供参考)——AHP

    2021年美赛B题目算法--AHP 2021年美国大学生数学建模竞赛B题目,属于离散型题目. B题目背景: 在2019-2020年澳大利亚的火灾季节,每个州都发生了毁灭性的野火,新南威尔士州和维 多利 ...

  4. 2021年美赛B题目简述(中英文)

    2021年美赛B题目 2021年美国大学生数学竞赛MCMB题目,为离散型题目,针对离散型题目,主要有以下几种思路: 1.离散回归模型 2.二元离散选择模型 3.二元离散选择模型最大似然估计 4.多元离 ...

  5. 2021年美赛解题思路汇总Final!!!

    首先: A题是连续型问题,是"数值分析"领域的内容,需要熟练掌握偏微分方程以及精通将连续性方程离散化求解的编程能力.这时,队伍里最好是有一个纯数学基础好的(偏微分方程.复变函数.信 ...

  6. 美赛 LaTex排版笔记

    美赛 LaTex排版笔记 1.基础操作与总排版 基础操作 中文排版 字体与字号调节 首行缩进 新开一页 加粗 序列 (1)无序序列 (2)有序序列 (3)步骤描述 分行与分段 强制垂直距离 2.数学 ...

  7. 2021年美赛C题思路

    2021年美赛C题思路: 团队为建模国一获得者,有丰富建模经验,因为需保证建模思路的完整性,更新较慢,怕被D.新号 C题翻译: 确认黄蜂的传言 2019 年 9 月,在加拿大不列颠哥伦比亚省的温哥华岛 ...

  8. 韩顺平 2021零基础学Java 学习笔记

    韩顺平 2021零基础学Java 学习笔记(1)(自用)_丨shallow丨的博客-CSDN博客_韩顺平java笔记 韩顺平 2021零基础学Java 学习笔记(2)(自用)_丨shallow丨的博客 ...

  9. 2021年美赛E题目简述(中英文)

    2021年美赛E题目 2021年美国大学生数学建模竞赛ICME题目,为环境科学类题目,主要包含预测模型,统计模型等相关模型. 2021年美赛E题目(中文): 2021年美赛E题目(英文): (转自20 ...

最新文章

  1. Java JDBC篇3——JDBC事务
  2. c语言中各个符号的意义及作用是什么,C语言特殊符号意义
  3. php+mysql+apache的安装方法
  4. 计算机硬盘分区知识简介、Linux企业级分区方案建议
  5. 使用微信机器人实现华为OLT和中兴OLT挂测的简单功能
  6. python实现屏幕截图_Python实现计算机屏幕任意区域截图
  7. 程序设计作业——系统管理
  8. py交易----实验吧
  9. 关于Ubuntu18.04+win10双系统开机引导错误的解决方法
  10. HDU1507 Uncle Tom's Inherited Land*
  11. 流氓迅雷,永别了万恶的迅雷,永别了万恶的迅雷播放组件
  12. 2018年全国计算机一级考试大纲,2018年全国计算机等级考试一级Photoshop考试大纲...
  13. 51LA网站访问统计使用【图文教程】
  14. 使用Formatter格式化数据
  15. 难免犯傻 难免一根筋啊
  16. AXI interleaving。
  17. 黄浩老师cpp平时作业(五)圆周率计算一、二(第二道即pi的近似计算)
  18. html5文本框怎么透明度,话说半透明文本框!(不透明度可以任意调节,可以实现全透明)...
  19. 一次函数+机器学习入门
  20. mbedtls学习(10)数字证书X.509

热门文章

  1. 《中华人民共和国数据安全法》条款解读与分析
  2. 域控的创建与软件分发
  3. Vitamio直播框架的简单使用
  4. rt-thread SAL嵌套字抽象层
  5. LCD液晶显示器 ----------- 原理篇
  6. 细胞免疫疗法领军企业药明巨诺在港交所主板上市
  7. 【BZOJ1067】【SCOI2007】降雨量
  8. 为什么人到了中年会喜欢上养花?养花能给人带来什么?
  9. mysql表的导入和导出
  10. Navicat 连接 MySql 报错2059时的解决方法