2022年数维杯国际大学生数学建模挑战赛C题如何利用大脑结构特征和认知行为特征诊断阿尔茨海默病解题过程
2022年数维杯国际大学生数学建模挑战赛
C题 如何利用大脑结构特征和认知行为特征诊断阿尔茨海默病
原题再现:
阿尔茨海默病(AD)是一种起病隐匿的进行性神经退行性疾病。临床特征为全谱痴呆,包括记忆障碍、失语、流利不畅、失认、视觉空间技能障碍、执行功能障碍以及人格和行为改变,其原因尚不清楚。它的特点是进行日常生活活动的能力逐渐下降,伴有各种神经精神症状和行为障碍。该疾病通常在老年人中呈进行性,在疾病发作后 10 至 20 年逐渐丧失独立生活技能并死于并发症。
阿尔茨海默病的临床前阶段,也称为轻度认知障碍(MCI),是正常和重度之间的过渡状态。由于患者及其家属对疾病的认知有限,67%的患者被诊断为中度至重度,错过了最佳干预阶段。因此,早期准确诊断阿尔茨海默病和轻度认知障碍具有重要意义。
所附数据包含在不同时间点(一个时间点为数量)收集的4850例认知正常老年人(CN)、1416例主观记忆主诉(SMC)、2968例早期轻度认知障碍(EMCI)、5236例晚期轻度认知障碍(LMCI)患者和1738例阿尔茨海默病(AD)患者的具体信息特征。请利用附录中提供的不同类别人群的大脑结构特征和认知行为特征,构建阿尔茨海默病识别模型,设计智能诊断方法,准确诊断阿尔茨海默病。
1.对所附数据的特征指标进行预处理,研究数据特征与阿尔茨海默病诊断的相关性。
2.利用附加的大脑结构特征和认知行为特征,设计阿尔茨海默病的智能诊断。
3.首先,将CN,MCI和AD分为三大类。然后,对于 MCI 中包含的三个子类(SMC、EMC 和 LMCI),聚类继续细化为三个子类。
4.附件中的同一样本包含在不同时间点收集的特征,请结合时间点进行分析,以揭示不同类别疾病随时间演变的模式。
5.请查阅相关文献,描述CN、SMC、EMCI、LMCI 和 AD 五类的早期干预和诊断标准。
题拿到手之后中文翻译过程(不论是亚太杯还是美赛皆是如此)
不要使用有道翻译,因为里面存在格式有道翻译之后缺失格式,条理不清晰;我这里推荐使用转成html文件,然后打开html的时候使用笔记本自带的Microsoft Edge浏览器打开即可,如下图所示:
问题分析与模型的建立与求解:
首先题目一开始就让你对所附数据的特征指标进行预处理,研究数据特征与阿尔茨海默病诊断的相关性。显然这又是数据分析题的老套路:
数据加载——数据处理(缺失值、异常值、重复值)——数据变换——特征抽取——数据统计分析
数模出题者的套路详细过程我就不所有的都写出来了,要不碰别人蛋糕了,真的很无聊,来来回回就这个套路,一开始的时候设置小门槛或者根本不设置门槛,后来加一些条件限制和优化,看谁的作品优化的好,谁就获奖。
(1)数据加载:
(2)数据处理:
缺失值怎么处理,重复值怎么处理,异常值怎么处理,这里其实最让评委在意的或者说是第一问数据处理的敲门砖就是缺失值的处理;那怎么处理呢?
我反复的说,但是真正做题的人未能做到灵活运用,就这么点事,缺数据了,缺多少缺的是什么,缺失数据的条目数占比,根据不同列数据的缺失程度不同,缺失值处理方法也不同,在该题中:我们加载完数据之后,发现题中所给数据中含有数值数据以及分类数据以及转义布尔类型数据,通俗一点讲就是原数据中含有数值、多种汉字类别、日期、二分类如男、女数据等。
我们所需做的就是查看缺失值都有哪些列,缺失值的比例以及缺失值的数目,当然也非只以这些为缺失值处理方式选择的标准;还有自变量数据之间的相互独立性检验,这也是处理缺失值处理方式选择评判的标准。
在此题中,如果是特征权重大且独立变量的非分类类型缺失值能填充的尽量填充;如果是特征权重小且非相互独立性变量的缺失值(此处不论数据类型)且缺失值占比不超过10%的变量数据可直接删除,删除它们对整体数据影响不大;如果某一列缺失值比例超过了80%,那还要看该变量特征权重占比是否超过30%,如果超过则单独考虑,否则直接删除;…兄台,我写累了,我就不全写了,需要的见最下方。
我先带你看看该题数据情况
这是数据中含有缺失值数目统计情况(缺失数据太多了不一一展示了)
这是缺失值占比情况统计
数据缺失成这个德行,出题老师不可能说让你每一列数据都填充处理,这你放心;他是要让你先对数据有一个整体把握了解,你可以不了解其他,但是你必须得掌握谁是自变量谁是因变量吧,这题目是研究什么的,然后通过数据可视化也好还是相关性系数矩阵也好还有向量组的形式表示更好,大致给出自变量和因变量之间的关系,权重占比小的这一列就不考虑数据处理了,这里为什么考虑这样去做而不是靠着自变量之间的关系去填充,是因为含有缺失值的变量列太多了,你要是一个一个去处理,我告诉你累死你,而且评委老师一看,你没懂我。然后你这边出结果了,为啥没拿奖,出题者他不可能在明面上跟你说都需要处理哪些列变量,你自己要是钻牛角尖我也没办法,自己还跟老师说:你不说你不写出来我怎么懂,然后老师说真正懂的人是不用别人告诉的。你俩就像情侣吵架一样一样的,啥用没有,浪费时间。
言归正传,该题题目第三段不是白写的,就直接告诉你谁是因变量:DX_bl,其余的都是围绕着这个而谈的;以下我就将阿尔茨海默病(AD)统称为老年痴呆。
这个题第一问说白了就是让你数据处理一下缺失值和异常值,然后通过数据分析写出来老年痴呆是啥样的,懂了么。
什么叫缺失值我不说了,什么叫异常值呢?异常值你可以把他认为是格式或数值偏差超过正常范围的数值,在该题中下面这个图里这个就算是异常值,因为在同一列中存在了多种数据类型,你得数据处理格式。
千万不要一上来就做热力分布图,如果变量数目适中还可以,该题上百个变量,你做的图像微雕一样,这不给自己挖坑呢么。所以你一开始老老实实做相关性矩阵表即可,然后把与DX_bl小的相关系数变量(含缺失值)的删掉即可,不用秀操作做热力分布图,脱裤子放屁的事真不用干。
做完之后你如果觉得单一,再去做基于不同自变量和因变量的拟合曲线关系图。至此,完成了删除变量前的操作。
所有问的思路今日已完成需要的请见下方“ 只会建模 QQ名片” 点击QQ名片即可
热力图程序狗屁没用
import seaborn as sns
import matplotlib.pyplot as plt
rf = df.corr(method='spearman')
sns.heatmap(rf,annot=True,vmax=1,vmin=0,xticklabels=True,yticklabels=True,square=True,cmap="YlGnBu")
plt.savefig('data1.png')
得出权重占比最大的前20名:
import seaborn as sns
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
sns.set(font='SimHei',font_scale=1.5)
sns.set(rc={"figure.figsize":(22,9)})
sns.barplot(features_df['特征'][:20],features_df['重要性'][:20])
plt.ylabel('importants')
plt.xlabel('features')
sns.despine(bottom=True)
plt.show()
全部思路及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可
2022年数维杯国际大学生数学建模挑战赛C题如何利用大脑结构特征和认知行为特征诊断阿尔茨海默病解题过程相关推荐
- 2022年数维杯国际大学生数学建模挑战赛D题三重拉尼娜事件下极端气候灾害损失评估与应对策略研究解题过程
2022年数维杯国际大学生数学建模挑战赛 D题 三重拉尼娜事件下极端气候灾害损失评估与应对策略研究 原题再现: 2022年7月至8月,中国南方许多城市经历了多天的炎热天气,而北方部分地区也出现了大 ...
- 2022年数维杯国际大学生数学建模挑战赛报名通知
小伙伴们大家好,今天重点来给大家介绍本学期除了美赛之外的,另外一场最具国际影响力的数模赛事,那就是数维杯国际赛,数维杯分为数维杯国赛和国际赛,国际赛和美赛形式一致,下面是本届竞赛的主要参赛信息,文末附 ...
- 2022年数维杯国际大学生数学建模挑战赛开赛公告
各参赛队伍: 为了保证2022年数维杯国际大学生数学建模挑战赛参赛队伍顺利参赛,现将竞赛开赛的相关事项通知如下: 一.时间节点 报名截止时间:北京时间2022年11月17日06:00(周四) 竞赛开始 ...
- 22年下数维杯国际大学生数学建模挑战赛C题与D题解析与思路
关于2022.11月数维杯国际赛的赛题,首先从赛题类型和难度进行分析,为大家提供选题建议 其中A (自动地震层位追踪)属于机理分析赛题.B (红蓝军团对抗)属于优化类赛题.C (阿尔茨海默病诊断)属于 ...
- 2022年数维杯国际赛【C题:利用大脑结构特征和认知行为特征诊断阿尔茨海默病】【D题:拉尼娜事件】思路模型代码全套资料!全网最全,持续更新...
大家好呀,数维杯国际赛早上8点开始了,拿到赛题之后我也在第一时间研究,现在先给大家一个初步的选题建议及C题的初步思路.欢迎小伙伴一起交流 首先是选题建议: AB题目.也就是mcm类型的,理论方面难度较 ...
- 2021数维杯国际大学生数学建模挑战赛报名通知
一.竞赛背景 为了培养学生的创新意识及运用数学方法和计算机技术解决实际问题的能力,内蒙古创新教育学会举办2021"数维杯"国际大学生数学建模挑战赛(以下简称竞赛),数维杯大学生数学 ...
- 2020“数维杯”国际大学生数学建模竞赛赛题分析
2020"数维杯"国际大学生数学建模竞赛赛题分析 1.ABCD赛题分析 1.1A题翻译:中国螺纹钢需求预测 1.2B题翻译:股票价格的混沌模型 1.3C题翻译:城市道路最佳除雪方案 ...
- 华为杯数学建模优秀论文_【优秀论文】2019数维杯国际大学生数学建模竞赛B题优秀论文...
推荐入群 2020数维杯国际赛参赛群13 2020数维杯国际大学生数学建模竞赛于2020年11月26日08:00(周四)-11月30日08:00(周一)进行,报名正在火热进行中,扫码了解详情或可直接报 ...
- 亚太杯数学建模竞赛优秀论文_【优秀论文】2019数维杯国际大学生数学建模竞赛C题优秀论文...
推荐入群 2020数维杯国际赛参赛群16 2020数维杯国际大学生数学建模竞赛于2020年11月26日08:00(周四)-11月30日08:00(周一)进行,报名正在火热进行中,扫码了解详情或可直接报 ...
最新文章
- webpack-dev-server 和webapck --watch的区别
- 你了解如何用GAN做语义分割吗
- SQLite第三课 源码编译错误以及解决
- java media player_MediaPlayerForJava(创建一个视频播放器)
- CSS常用选择器、伪元素选择器、伪类选择器大全——响应式Web系列学习笔记
- SAP S/4HANA Service Management和SAP FSM基于CPI的集成场景介绍
- Ubuntu安装BackExec Remote Agent for Linux
- 比较Spring AOP和AspectJ
- Linux中sudo的用法和sudoers配置详解
- 共轴双桨直升机飞行原理介绍
- 软件常见的各种版本英文缩写
- ajax $.get怎么使用,jquery之ajax之$.get方法的使用
- mbp使用brew安装unrar
- Eclipse 各种设置
- excel中插入文档
- Kubernetes 集群基于 Rook 的 Ceph 存储之块设备、文件系统、对象存储
- DeFi对金融世界的变革|读麦道夫庞氏骗局有感
- DSP中的EDMA是什么?
- XK3190 A12 E称重控制器RS232采集称重数据过程
- Activiti使用指南
热门文章
- 实验室-关于老铁整一个社会语录api与网抑云热评api(并引入百度语音tts)
- 【数据结构】无向图与有向图的连通性及相关算法
- auto.js 快手极速版刷视频3.0
- Adobe Creative Suite 3: Ready this year?
- JavaSE —— 使用 Javac 编译 Java 程序
- 大学计算机算法程序框图,2019高考真题:算法与程序框图,专题解析
- NUCLEO STM32H743购买和使用说明
- 3.东软跨境电商数仓项目架构设计
- 从iPhone6S发售谈富士康电商富连网
- java线程 模拟窗口售票