2018-SAE-based classification of school-aged children with autism spectrum disorders using functional magnetic resonance imaging

论文地址：https://www.researchgate.net/publication/322728713_SAE-based_classification_of_school-aged_children_with_autism_spectrum_disorders_using_functional_magnetic_resonance_imaging

文章目录

2018-SAE-based classification of school-aged children with autism spectrum disorders using functional magnetic resonance imaging
Abstract
1 Introduction
2 Materials and methods
- 2.1 Material characteristics
- 2.2 Data preprocessing
- 2.3 The proposed method
3 Results
4 Discussion
5 Conclusion

Abstract

本文采用一种新的深度学习方法和大脑频率来区分患有自闭症谱系障碍(ASD)的学龄儿童和发育正常(TD)的学龄儿童。首先对fMRI数据进行预处理，然后将每个受试者的数据集分解为30个独立分量(IC)。其次，选取关键独立分量并输入到堆叠式自动编码器(SAE)中。采用SAE进行特征减法和降维。最后，使用softmax分类器对ASD学龄儿童和TD学龄儿童进行区分。该工作的平均准确率高达87.21%(平均灵敏度为92.86%，平均特异度为84.32%)。分类结果表明，该方法具有自动区分学龄ASD儿童和TD学龄儿童的潜力。尝试使用基于深度学习的算法和大脑频率来区分学龄ASD儿童和TD学龄儿童可能是辅助临床应用的关键一步。

1 Introduction

自闭症谱系障碍(ASD)是一种发生在儿童早期的神经发育和网络层面的障碍[6,39]。在美国，每88个儿童中就有1个患有ASD，主要影响儿童的语言能力、社交能力、运动行为和感觉系统[33]。目前学龄儿童ASD的诊断多基于行为表型[13,29]， 多数医院有能力进行ASD筛查和诊断的儿科专家通常采用ADI-R (Autism diagnosis Interview-Revised)[21]或ADOS (Autism Diagnostic Observation Schedule)[22]。不幸的是，一项横断面调查显示，在美国马里兰州和特拉华州，这类专家只占2.02%的儿科医生。一句话,ASD的专家数量相对小,ASD患者(28岁,34)和诊断结果可能主观[37] ,因此,迫切需要有客观的工具可能帮助学龄儿童自闭症的早期诊断或反应的监测治疗。目的近年来出现了疾病特异性基因方法[19]、神经发育模型[4]、生物标志物方法[15]等诊断方法。然而，ASD的客观诊断仍然是一个具有挑战性的问题，目前的方法由于分类准确率较低，无法应用于临床诊断。

为了加快ASD计算机辅助诊断的发展，对ASD患儿的研究对于建立ASD基础神经生物学的准确模型或客观诊断算法和工具尤为重要。例如，一些基于结构磁共振成像的研究指出，默认模式网络(DMN)区域对于区分ASD个体和TD个体非常重要[28,38]。另一项对ASD儿童的研究表明，在前额皮质中有过多的神经元。利用功能磁共振成像(fMRI)， 研究人员[1,17,39]报告称，他们已经确定了大脑各区域之间的某些功能连接(FC)，这些连接似乎包含了有关该疾病的大量信息。此外，这些显示出FC和大脑频率之间的一些关系。 例如，有3项研究[14,16,25]揭示了神经和精神疾病的频率依赖性异常，并指出大脑在不同频段的激活可能提供更多与疾病病理相关的信息。例如，一项研究[45]将大脑频带分为四个频率子带[慢-2 (0.198-0.25 Hz)、慢-3 (0.073-0.198 Hz)、慢-4 (0.027-0.073 Hz)和慢-5 (0.01-0.027 Hz)]。另外两项研究[7,31]也揭示了不同波段的频率波动表现出不同的性质和生理功能。 Siegel[36]认为，大规模皮层网络中的神经元相关性是频率特异性的，应该是构成认知过程基础的神经元活动的指纹。Lynch[24]专注于整个低频段，他的工作将dmn相关电路的超连通性与自闭症儿童的核心社交缺陷联系起来。然而，到目前为止，这些基于大脑频率的调查已经证明了ASD和TD儿童的分类能力有限。

另一方面，一些传统的机器学习方法也被用于处理神经影像数据。例如Barttfeld[5] 使用支持向量机(SVM)对fMRI数据进行分类。Chen[8] 还使用SVM为特定频率的大脑FC指数提供了初步证据，最终可能用于ASD的检测。基于fMRI数据的生物标志物的识别将有助于的早期准确诊断[19]。 但两篇作品[5,8]的分类精度仅达到80%。为了提高客观诊断的可行性，一些关键方法开始将特征选择和分类算法应用于fMRI数据[17,30]。例如，Iidaka使用概率神经网络(PNN)对ASD[18]进行分类。总之，机器学习和模式识别算法已经发展成为大脑功能磁共振数据[37]的工作机器。

然而，处理像ASD这样复杂的神经发育障碍需要强大的技术。因此，我们的工作结合了新的深度学习方法和脑频率理论，利用fMRI数据区分学龄ASD儿童和TD学龄儿童，提高对精神疾病的理解、预测和治疗。采用堆叠式自动编码器(SAE)进行特征减法和降维，采用softmax分类器对ASD学龄儿童和TD学龄儿童进行预测。此外, 都使用的频率范围从 Slow-2 subbands Slow-6 而不是一个单一的 1与之前的一些研究相比[2,5,8,11,32]，在我们的工作中能够实现相对较高的分类精度和分类敏感性。

2 Materials and methods

2.1 Material characteristics

在这项工作中，一些学龄儿童静息状态的fMRI成像数据从ABIDE数据库下载(http://fcon_1000.projects.nitrc.org/indi/abide/)，该数据库允许将其不受限制地用于非商业用途。这些孩子接受了纽约大学朗格尼医学中心的扫描。根据年龄、性别和全面智商(FIQ)，只有42名学龄ASD儿童(38名男孩和4名女孩;平均年龄[SD，(标准差)]，9.78[1.52]岁;FIQ [SD], 110.29 [16.59]) 和 42 TD schoolaged 孩子平均年龄匹配 , 意味着 IQ (31 男孩和 11 girls;平均年龄[SD]， 10.22 [1.78];mean FIQ [SD]， 115.38[13.53])从NYU数据库中选取。自闭症儿童的研究对象为6 - 13岁患有ASD[33]的学龄儿童。大部分详细信息可以在 http://fcon_1000.projects.nitrc.org/ indi/abide/ 找到。这些儿童的人口统计数据如表1所示。

2.2 Data preprocessing

fMRI数据预处理采用多元探查线性优化分解成独立组件(MELODIC)，这是FMRIB软件库(FSL)的工具箱(www.fmrib.ox.ac.uk/ FSL)软件包。 数据预处理包括头部运动校正、切片定时校正、非脑组织切除、空间归一化、空间平滑。Each subject’s 数据集分解成 30 independent 组件 (IC) [26].它通过虚拟机(VMware Workstation, 11.1.0, VMM: 4 GB)在Windows (Windows 7, 64位，10.0.14393,CPU: Xeon® E5-1620, 3.5 GHz, MM: 64 GB)上运行。在这样的硬件和软件条件下，它大约用10分钟来处理一个主题的数据集。每个集成电路包含三个信息(即时间历程、功率谱和空间图)。图1、图2和图3显示了一个部件的三条信息。
功率谱是大脑频率功率的一种表达。之前的研究[23,35]表明，静息态FC主要位于慢-4和慢-5频段内，而最近的一项研究[3]表明，慢-3频段也有意义。因此，利用所有的频率子带可以得到更好的分类结果。因此，根据慢-2到慢-6[45]所有波段的最大能量标准，选择了20个关键元件。将20个关键部件的时间历程重塑为3400维关键特征数组，将所有受试者的84个关键特征数组重塑为3400×84维关键特征矩阵。经过0-1归一化后，将特征矩阵输入到提出的SAE中。

2.3 The proposed method

数据预处理后，将每个受试者的时间历程输入SAE，并将SAE的输出输入后续的softmax分类器。最后，使用softmax分类器对ASD和TD进行预测。在此过程中，SAE分类器和softmax分类器在本系统中得到了很好的统一，如图4所示。

SAE是由自动编码器[43]的多个隐层组成的神经网络，它是一个三层网络，采用无监督的方式训练。AE中无监督学习的诀窍在于，它通过应用反向传播算法，使输出值逐渐接近输入值。本文提出的增强式SAE结构如图5所示。

SAE共有10层，即输入层、8个隐藏层和输出层。 将8个隐藏层分为4组，每组包含2个隐藏层。每个组中的节点数相同。 4组中的节点数依次为600、400、100和40。 第lll层的第iii个激活单元ai(l)a^{(l)}_iai(l)可以通过权重参数www，偏置项bbb和激活函数fff由第(l−1)(l-1)(l−1)层的单元表示。

(nnn为第(l−1)(l-1)(l−1)层的单元数，工作中选取f(●)f(●)f(●)作为sss型函数)。

给定一个包含mmm个样本的训练集（即{(x(1),y(1)),⋯,(x(m),y(m))}\{(x^{(1)},y^{(1)}),\cdots, (x^{(m)},y^{(m)})\}{(x(1),y(1)),⋯,(x(m),y(m))}），其中y(i)y^{(i)}y(i)是第iii个类别标签样本（即y(i)∈{1,2,⋯,k}y^{(i)}\in \{1,2,\cdots,k\}y(i)∈{1,2,⋯,k}）。对于第一层，激活单元是输入数据（即a(1)=x(i)a^{(1)}= x^{(i)}a(1)=x(i)）。该研究将受试者分为两类（患有ASD的儿童和患有TD的儿童）。因此y(i)∈{1,2}y^{(i)}\in\{1,2\}y(i)∈{1,2}。 AE的目标是最小化学习www和bbb的输入和输出之间的距离。成本函数可以计算为：

（mmm是训练样本数，nl(nl=3)n_l(n_l=3)nl(nl=3)是层数，而sls_lsl是第lll层中的单位数）。在等式(3)中，第一项是代表学习质量的输入和输出之间的均方误差，而第二项是趋向于减小权重的大小并有助于防止学习过度拟合的正则化项。 λ\lambdaλ是权重衰减参数。
为了确保隐藏层的特征是稀疏的，必须在成本函数中引入一种稀疏约束来控制学习过程。因此，第jjj个隐藏单元的平均激活定义为（相对于输入xxx）：

如果ρ^j\hat{\rho}_jρ^j足够小(接近0.05)，则隐藏层的大多数单位应处于非活动状态。为了迫使ρ^j\hat{\rho}_jρ^j变为非常小的ρ\rhoρ值，基于Kullback-Leibler（KL）散度的概念设计了稀疏惩罚项：

其中PPP和QQQ表示两个离散的概率分布。在我们的案例中，对于i=1,2i = 1,2i=1,2, ,P(i)P(i)P(i)为ρρρ和1−ρ1-ρ1−ρ，且 ρ^j\hat{\rho}_jρ^j为QQQ，则KL散度变为：

稀疏惩罚项合并到成本函数中：

（β\betaβ是稀疏惩罚项的权重）。

在每次迭代之前，有必要计算隐藏层和输出层中所有单元对成本函数的贡献[43]。如[32]所示，有限内存BFGS（L-BFGS）是在反向传播过程中更新w和b的合适优化算法。为了进行研究，采用了L-BFGS。

使用softmax回归模型对ASD和TD受试者进行分类。具体而言，softmax回归函数hθ(x(i))h_θ(x^{(i)})hθ(x(i))（相对于softmax层的输入）采用以下形式：

其中x(i)x^{(i)}x(i)表示softmax的输入层，即SAE的输出。

系统内参数的具体设置主要涉及权重衰减，稀疏惩罚项和稀疏项的权重，如表2所示。

3 Results

所建议的系统是使用DELL精密塔式工作站（T5810）（CPU：Xeon E5-1620，3.5 GHz； MM：64 GB； OS：64位Windows 7专业版）和Matlab R2010a（7.10.0.499）执行的。，64位）。

为每个类别计算了一些统计指标。这些指标包括真阳性（TP），假阴性（FN），真阴性（TN）和假阳性（FP）。使用以下公式计算灵敏度，特异性，准确性，阳性预测值（PPV）和阴性预测值（NPV）的参数：

敏感性参数用于测量正确识别出的阳性结果的比例，换句话说，就是正确识别出患有ASD的ASD儿童的百分比。特异性参数测量正确识别的阴性结果的比例，或正确识别为TD儿童的TD儿童的百分比。交叉验证（CV）的结果显示在表3中。

包括性别，年龄，FIQ，手型或眼睛状况在内的各种因素均未对CV的准确性产生任何影响。
另一方面，在研究中提出的具有8个隐藏层的SAE也比其他具有不同隐藏层数的SAE算法更有效。 21倍CV实验结果表明，与其他算法相比，所提出的SAE算法在分类精度和计算时间成本之间具有更好的平衡，如表4所示。

4 Discussion

研究中采用的分析程序代表了一种完全不受假设和数据驱动的方法。在我们对42名ASD儿童和42名TD儿童的研究中，关键特征矩阵（3400×84）使用SAE和softmax回归算法对ASD受试者进行了分类，其敏感性约为93％，平均准确度为87.21％。
在先前的研究中，对40名ASD受试者和40 TD受试者进行了分类，其准确率仅为79％[1]。在另一项使用SVM的研究中，ASD（n = 12）和TD（n = 12）之间的分类准确性为91％[5]。第三项针对ASD（n = 13）和TD（n = 14）受试者的研究的准确度为78％[27]。基于显着网络的分类研究预测了ASD（n = 20）和TD儿童（n = 20）的患病率，准确性为78％[39]。根据最近的一份报告[18]，该分析中包括了20岁以下受试者的影像数据。该研究使用PNN对两组进行分类，准确度为90％（敏感性= 92％，特异性= 87％）。使用频率特定的静止状态功能连接性和SVM，另一个发现[8]能够达到79.17％的准确度。此外，该发现中的大多数区分特征都集中在Slow-4波段上，同时使用Slow-4和Slow-5特征时，可达到74％的准确度。仅使用Slow-4或Slow-5功能时，可以达到69％的精度。尽管这些研究取得了相对较好的结果，但它们仍然存在一些缺点。使用所有脑部频带（从Slow-2到Slow-6）和一种新颖的机器学习方法，我们的研究能够实现更高的灵敏度（92.86％）。更重要的是，该方法可能适用于ASD的学龄儿童的计算机辅助诊断。建议通过全脑频率的神经影像数据，将SAE和softmax分类器的框架作为区分学龄儿童ASD的更好选择。为了进一步确认上述结论，未来从ABIDE获得的较大数据集（例如n≥240）将对验证所提出的方法很有用。

5 Conclusion

总之，基于深度学习的方法通过使用静止状态FC成功地对ASD的学龄儿童进行了分类，其最高敏感性为92.86％。对于计算机辅助诊断而言，这是令人印象深刻的结果。本文提供的主要贡献是证明使用基于深度学习的方法在所有频率子带上都可以大大提高准确性和灵敏度。另外，我们想指出的是，提出的系统是在Matlab中实现的，以显示其可行性和准确性。未来的工作是在一个更高效的平台（例如Tensorflow）中加快速度。我们还尝试将提出的想法和方法扩展到计算机科学的其他领域[9，20，40–42，44]。

6 2018-SAE-based classification of school-aged children with ASD using functional magnetic resonanc相关推荐

基于稀疏表示的分类方法 Sparse Representation based Classification Method
文章来源 Jia K, Chan T H, Ma Y. Robust and practical face recognition via structured sparsity[J]. Comput ...
Sipakmed：a new dataset feature and image based classification of cervical cells——记一次复现论文经历
Sipakmed:a new dataset feature and image based classification of normal and pathological cervical ce ...
(few-shot)2020年few-shot learning Classification overview 小样本综述
小样本学习:基础 [blog] 1. 相关问题半监督学习(Semi-supervised Learning) 是同时从有标注和无标注的数据中学习最优假设 . 正样本半监督学习(Positive-un ...
ICLR 2019:A CLOSER LOOK AT FEW-SHOT CLASSIFICATION （ACK-FSC）
下方↓公众号后台回复"ACKFSC",即可获得论文原文电子资源. A CLOSER LOOK AT FEW-SHOT CLASSIFICATION 内容提要本文工作现有工作现 ...
一文概述 2018 年深度学习 NLP 十大创新思路
来源:AI科技评论摘要:Sebastian Ruder 是一位 NLP 方向的博士生.研究科学家,最近,他基于十几篇经典论文盘点了 2018 年 NLP 领域十个令人激动并具有影响力的想法,并将文章 ...
ECCV 2018 完整论文集 -- List 下载链接
下文列表为ECCV2018官网得到了今年接收论文列表,共779篇: 下文为ECCV2018的全部接收论文汇总 Oral: Convolutional Networks with Adaptive Co ...
Multivariate LSTM-FCNs for Time Series Classification 机翻
Multivariate LSTM-FCNs for Time Series Classification 前言论文链接 :https://arxiv.org/abs/1801.04503 Gith ...
face recognition[翻译][深度人脸识别:综述]
这里翻译下<Deep face recognition: a survey v4>. 1 引言由于它的非侵入性和自然特征,人脸识别已经成为身份识别中重要的生物认证技术,也已经应用到许多领 ...
AI 综述专栏 | 超长综述让你走近深度人脸识别
来源:人工智能前沿讲习班作者: 葛政相信做机器学习或深度学习的同学们回家总会有这样一个烦恼:亲朋好友询问你从事什么工作的时候,如何通俗地解释能避免尴尬? 我尝试过很多名词来形容自己的工作:机器学习 ...

6 2018-SAE-based classification of school-aged children with ASD using functional magnetic resonanc