第一题.简单来讲,就是给了一些数据,让我们拟合回归方程.

这是附件一的数据(任务相关数据)

这是附件二的数据(会员相关数据,会员即执行任务的人)

用excel地图将两类数据可视化.

  • 任务数据
  • 颜色为是否完成,高低为任务标价

  • 会员数据


先对图分析一下,能注意到这些问题:

  • 任务主要分布在四个城市,东莞深圳广州佛山
  • 东莞完成度很高,深圳完成度很低
  • 会员有挺多离群数据点

我们小组成员总结出的两个附件的一些影响因子:

  • 任务的位置:
    1.任务可能以四个城市为主,离城市越远,价格越贵.
    2.任务可能由于聚集的原因,任务聚集越多,可能就越?其实这个说不定,可能会因为聚集,抢的人多就便宜了,也可能任务太多,人不够,所以价格就贵了.

  • 会员的位置,人越多的地方,可能任务的价格就越低

  • 会员的完成任务能力,将会员里的剩余三组数据定义为会员完成任务的能力.不然影响因素可能就太多了.

然后逐个分析四个影响因素:

  • 任务距离城市中心的距离:还是比较容易想到聚类算法的,得到四类中心,然后由于数据比较集中,可以将这些数据点视作在一个平面上.然后每个点与中心点的欧式聚类一算就搞定了.

  • 任务聚集度:这个问题参考了一些优秀论文.两个方法叭,一个是以1.5km画圆,圈住任务个数就是密集度了.不过想起来容易…实施起来很多细节…比如1.5km怎么算…最后我们使用了另外一个方法,单纯划分成5050的格子.从min经度到max经度划分,纬度同理.格子里面有几个任务就是多少密集度.论文可能还要分析一下这个5050的格子实际为多大,是否合理.

  • 会员密集度,与任务聚集度同理.不过筛掉那些离得太远的离群点.

  • 完成能力里面,又有三个因素.综合成一个因素的话.那就使用熵权法一股脑堆在一起叭.三类数据熵权,堆起来,得到一个数据.这里也不太好数据可视化.

四个因素分析完了,得到值了,那就使用多元回归分析进行拟合.得到数据,这里可以用excel也可以用python sklearn.

这个数据是经过归一化后的系数,也可以不归一化,方便预测.然后R^2为0.28,低的离谱…拟合的真的很差.

可以看到价钱贵的都没拟合到.那怎么办呢?翻了翻优秀论文,再添加一个因素,任务的难易度.这个在附件里面没有体现…但大胆假设,为啥会有这么大误差,因为还有一个影响因子,任务的难易程度.这之间的差值,就是任务的难易程度的划分.那怎么划分难度呢?对残差聚类分析…得到四个中心点,就是四个等级.


(上面的文字和数据不对应,要排序一下)

最后拟合的结果,那肯定是相当好,这么一顿操作下来,我觉得我就是硬拟合…醉了,加上了难度系数的拟合就必不可能拟合的不好了…

(说点题外话,写到这我在翻代码时,发现我用于残差计算的预测值,不是四影响因子的预测值,是原先三个影响因子的预测值.心态有点蹦,好多图要重做了)

最后,对自己的做法评论一下…就离谱,拟合就硬拟,系数啥的离谱的要死.有种过拟合的意思.有个地方可以稍稍改正一下,就是等级里面会有负的,级低等级扣钱的现象出现,其实可以将前面多元回归方程的数字借一下,借给等级,这样子拟合出来的方程好看一些(因为原数据的最低价格就是65,拟合出来的常数偏大,正好借给难度,可以让难度表现为,难度越难就需要加钱,简单的不加钱,或只加一点钱.然后难度可以四舍五入一下…小数点太多有点硬拟合的感觉)

  • 关于第二题的看法.虽然已经用光了所有的数据,但是其实还是又改进的地方,那就是,东莞和深圳的完成情况.深圳完成的比较好,东莞完成的比较差.为什么呢?优秀论文提到的,两地GDP不同,深圳有钱,不差这点钱懒得做.东莞学生和家庭主妇多一些,喜欢赚这种钱,而且gdp相对落后…这样加入gdp,进一步完成模型.不过这样第一问的第二小问解释的空间就比较小了,也可以匀几个因素过去第二题…
  • 感受,优秀论文成为优秀论文,我觉得并不是因为整篇都很优秀,而是在某个点上很有亮点同时,整体比较自洽.但是…看论文的时候不能全信,因为比赛时时间太紧,不可能每个方面都很完美,有的地方实在解释不通,很有可能就是糊弄过去的…所以读优秀论文时多思考一下,不要被优秀论文牵着鼻子走

我也是数模新生小白,以上就是对2017年国赛B题第一问的一些思路…如果有谬误或者更好的思路,欢迎指正,感激不尽!

2017年数模国赛B题第一小题的思路过程(个人思路)相关推荐

  1. CT 系统参数标定及反投影重建成像-2017数模国赛论文A298编程分析

    CT 系统参数标定及反投影重建成像-2017数模国赛论文A298编程分析 之前的同学已经讲解清楚了这篇论文建模的主要思路,我主要讲解代码对建模思路的实现. 本文提到的论文下载地址:http://dxs ...

  2. ​2021年数模国赛A题国二摘要及经验分享(回忆篇,附部分代码)

    以2021年数模国赛A题为例,主要分享内容有:如何写好国赛摘要.部分解题思路和排版技巧.接下来,干货走起. 题目重述:" FAST "主动反射面的形状调节 中国天眼( FAST ) ...

  3. 数模国赛要点与注意事项全分享!

    暑假咻地一下就过去了,转眼数学建模国赛快到了. 为了给大家最最直接的帮助,超模君特邀请到周老师为参加国赛的模友们准备了一场干货满满的赛前冲刺直播课.全天候直播,助大家一臂之力,全力冲刺数模国赛! 周老 ...

  4. 数模国赛历年题目 1992——2021

    数模国赛历年题目 1992--2021 获取方式 关注 公众号 数模零到一 回复关键词[国赛历年题目]即可获取 不仅包含1992-2021年题目文档,也包含题目原始数据.(无水印) 数模零到一数据库 ...

  5. 全网通报:数模国赛作弊的后果

    大家好,我是北海. 数模国赛官网公布了2021年全国大学生数学建模竞赛中部分参赛论文相似度较高的通报,今天和大家聊一聊关于国赛作弊的问题. 1.什么样的队伍会被通报? 官方文件中的原话: 1.抄袭是严 ...

  6. 【数模国赛参赛情况浅析】

    今天给大家带来近几年的国赛参赛以及国奖评阅等情况.由于19年开始国赛才新增C题(据说是鼓励数学学得较浅的文商科等专业学生参加),因此我们从19年开始对19-21年的参赛数据进行浅析. •参赛规模 19 ...

  7. 2022数模国赛河南赛区获奖名单

    2022数模国赛河南赛区获奖名单如下:

  8. 2022数模国赛B题无人机第一题第一小问的简单编程

    前言 2022年国赛B题是关于无人机定位的抽象模型,总体难度不大.接下来简单介绍一下第一题第一小问的程序实现,当时国赛仓促,写的比较简略,仅供参考. 背景介绍 无源定位 第一个关键词是无源定位,无源定 ...

  9. 2022年数模国赛C题(岭回归、区间预测、矩阵热力图、Fisher判别分类模型)——总结心得(附最后一次数模经历,Matlab\SPSS\Lingo的理解综合)

    文章目录 一.国赛 二.国赛代码展示 1.1 问题一 1.2 问题二 1.3 问题三 1.4 问题四 三.对于软件的理解 3.1 Matlab 3.1.1 表格的读取 3.1.2 元胞数组的相关函数的 ...

  10. 数模国赛计算机要学什么,数学建模国赛经验分享

    作为二本A类的院校,参加2014的国赛能够拿到广东省赛区的省一等奖我们队的成员已经很高兴.数学建模比赛个人认为实力是一方面,另外就是团队成员之间能够密切配合.能够了解彼此的想法,最重要的一点就是在大家 ...

最新文章

  1. iOS macOS的后渗透利用工具:EggShell
  2. linux怎么和宿主机同步时间,Linux 中设置和同步时间
  3. 【错误记录】Windows 系统 bat 脚本报错 ( Java 生成 bat 脚本乱码处理 | 输出 GB2312 字符串 | Windows 中的换行时 \r\n )
  4. python对城市规划_Python对城市距离自动化爬取【必学小型项目】
  5. android多媒体编程题库,android 仿猿题库答题UI
  6. 范数在机器学习中的作用_设计在机器学习中的作用
  7. 【渝粤教育】电大中专公共基础课程_1作业 题库
  8. 你可能没有想过自己缺钱花的原因
  9. gpt linux双系统安装win7系统分区格式化,如何在GPT分区格式上安装win7 64位系统
  10. 史上最全使用Nexus搭建Maven服务器详细配置
  11. 使用python批量压缩图片文件
  12. Linux之压缩详解
  13. 几何公差标注示例及解释——直线度
  14. component lists rendered with v-for should have explicit keys.
  15. python 源代码 macd双底 高 低_久其软件怎么样MACD指标的双底形态特征详解
  16. 字典的基础及字典的使用实例
  17. OO系统分析员之路--用例分析系列(2)--用例的类型与粒度
  18. 初中算题可以使用计算机吗,初中生计算机考试试题总汇
  19. Adobe Audition介绍
  20. [张国荣][10CD][1991-1995][APE+CUE][3.60G][115][sqhhj0622#HD2PT]

热门文章

  1. java项目调用webservice_JAVA程序调用Webservice接口
  2. 黑苹果appstore下载软件报错,不能下载解决方法
  3. 惠普台式电脑引导不了系统_惠普电脑装完系统怎么硬盘启动不了怎么办
  4. 软件性能测试操作系统,优秀的系统性能测试软件Sisoft Sandra
  5. 图解设计模式,看完秒懂!!!
  6. 如何写一个简单的爬虫程序
  7. 入选互联网名人堂的三位中国人
  8. 基于 Flink SQL CDC的实时数据同步方案
  9. 经济应用文写作【10】
  10. 94-99.字符串函数使用和实现详解