脑图谱(大脑分区方式)可以显著影响分析结果,在脑成像数据集的分析中起着至关重要的作用。近年来,已经有几种基于MRI的划分脑图谱的方法。但在缺乏金标准(ground truth)的情况下,评估应该使用哪种图谱最为合适也有几种方法。本文回顾并批判性讨论了当前使用的识别适合于特定神经成像研究的最佳脑图谱的方法。文章认为,确定最佳图谱的标准必须取决于图谱的用途。文章提出了一种评估图谱适用性的目的论方法,即在不同的研究背景下评估不同的图谱,并分别确定适合每个研究问题的最佳图谱。本文发表在Journal of Neurophysiology杂志。

引言

大脑图谱是将大脑空间划分为具有不同功能作用的区域。传统上,脑图谱被定义为大脑中在一个或多个属性上具有相似性的位置,包括细胞或骨髓结构、与其他位置的连接模式、功能活动以及拓扑结构。虽然历史上的脑区划分是基于皮层的组织学特性构建的,但在过去二十年中,使用功能磁共振成像(fMRI)也构建了多个活体脑图谱。基于具有相似活动的体素服务于相同功能的假设,fMRI划分脑区的方式是将具有相似血氧水平依赖(BOLD)信号的体素分为一组功能上一致的区域。功能性脑图谱现已成为分析使用fMRI和扩散加权成像(DWI)获取的各种脑成像数据集的不可或缺的工具。脑图谱最常见的应用之一是计算不同脑区之间的功能和结构连接。功能连接计算为每个区域内体素的平均时间序列之间的相关系数。结构连接计算不同区域内体素的白质纤维数量。

基于fMRI的不同脑图谱具有三个区别。首先,图谱的构建方法不同,比如有基于K-means、频谱聚类和混合模型的算法。其次,图谱构建依赖于不同的分区粒度,比如划分大脑的脑区数量从几十个到几百个不等。第三,分区可以在个体或群体水平构建。群体水平分区通过结合一群被试的数据集构建出一个图谱,个体水平的分区则从单个被试的数据集构建图谱。图谱的结构和属性依赖于所有前面提到的因素。四个最常用的脑图谱如图1所示。可以看到,边界位置和区域形状在不同图谱之间差异很大。例如,Shen等人构建的图谱有更多不规则的形状,不像其他图谱有大致相同的粒度级别。另一方面,Craddock等人构建的图谱则更圆滑,并具有相对均匀的分布。

图1 常用的几种脑图谱示例。不同图谱采用了不同的算法、分区粒度、个体或群体数据。从这几张图的对照中可以看出这些因素都会影响图谱结构。

然而,真实情况(ground truth),也就是脑组织的微结构、功能活动、连接模式或拓扑结构的真实边界的确切位置尚不清楚。在缺乏真值做对比的情况下,要确定哪种脑图谱对大脑功能区域的划分更为准确并非易事。因此,现有的评估方式是将一个假设的“理想图谱”与要评估的谱图的属性进行比较。也就是说,图谱的评价是基于这些图谱与一个理想图谱的属性有多契合。理想图谱是指,具有高度相似的功能活动或者功能连接属性的脑组织被划分为同一个区域,并且不同区域之间具有明显的区别。图谱的稳健性则通过量化不同个体之间、同一个体不同扫描之间,以及划分算法的不同初始化值得到的脑区划分方式的可重复性进行验证。最后一种评价方式是,使用未用于构建图谱的信息,比如微观结构图或任务诱发活动,来评价某个图谱捕捉脑组织已知特性的程度,如脑的微观结构或者语言的偏侧化。文献中有很多量化这些评价特征的方法和措施,但神经影像学界缺乏对现有评估策略的综述。

此外,不太可能存在如前所述的真值图谱。大脑中的相邻位置可能在一个特性(例如微观结构)上有所不同,而在其他特性(功能活动、连接模式和拓扑结构)上则没有差异。因此,大脑图谱通常被视为分析成像数据集的工具,而不是揭示某些基本事实的方法。然而,现有的评估分割方法的策略并没有回答使用脑图谱分析数据集的神经成像领域研究人员最关注的问题:哪个脑图谱能够最大程度地揭示感兴趣的信号?例如,一项旨在确定精神分裂症患者大脑区域之间的功能连接的研究需要一个大脑图谱,其区域连接模式要能最大限度地区分健康受试者和患有精神分裂症的受试者。当前的图谱评估方法则并不能回答这些问题。因此,哪一种图谱更适合于不同的应用,这一问题在很大程度上尚未得到探索。

本文主张一种基于背景的评估方法,针对不同的应用评估图谱的效用,并确定适用于不同研究目的的最佳图谱。

评估方法

哪一个图谱能更准确地将大脑划分为功能相关的区域呢?在缺乏真值的情况下,图谱的信效度评估是依据它们将大脑分割成具有类似功能活动或连通性轮廓的体素区域。效度的评估方式是看一个图谱与理想图谱的符合程度。信度的评估方式是通过系统地量化构建图谱时可能的随机性来进行评估,比如是算法固有的随机性,或者是在构建图谱时使用的数据集中存在的随机性。除了这些评估策略外,一种补充方法是使用外部信息源,即构建图谱时未使用的信息,来验证图谱有效性。这些评估策略中的每一个都会检查大脑图谱的一组不同的期望特征。这些策略的分类如图2所示。在下文中,我们介绍了每种方法以及文献中使用的方法和措施。

图2 评价方法的分类。我们将评估方法分为三类。每种方法都会评估不同类别的图谱特性。效度评估是对图谱特性与理想图谱特性匹配程度的评估。信度评估评估脑区的可重复性。外部验证使用除用于构建图谱的数据集之外的其他信息源评估图谱。

效度评估

效度评估一个图谱与理想图谱所具有的特征的一致性。理想图谱的特征是同一区域内具有高度一致性,区域间则具有异质性,即衡量不同区域的体素之间与同一区域的体素之间的不相似程度。此外,理想的图谱是可以把人工数据集中的体素分配到“正确”的区域的(假如有真值的话)。每个理想特征的评估方法描述为:区域同致性、区域异质性和有监督评估。

区域同质性

       一个有效的图谱应该会具有高度“同质”的区域,即由彼此高度相似的体素组成的区域。同质性是指每个区域内体素时间序列之间的相似性或其功能连通性分布的相似性。由高度相似的体素组成的区域比由具有不同时间序列或连接性轮廓的体素构成的区域具有更高的同质性值。换句话说,同质性是衡量每个区域由相似体素组成的程度。因此,更同质区域内的体素更有可能发挥相同的功能作用,使同质性成为有效的大脑分割的理想属性。表1中提供了用于量化同质性指标的度量。

表1 同质性度量指标

 彼此空间接近的体素具有相似功能活动和连通性的自然趋势。将相邻体素任意组合在一起也可以产生具有高同质性的区域。因此,解释这种高同质性很重要。计算方式是通过将给定图谱的同质性值与不考虑其时间序列之间的相似性、只将空间上连续的体素任意分组为区域得到的值进行比较来实现的。需要注意的是,在这种计算方式中要保证随机生成的只依据空间相邻而不考虑时间序列相似性得到的图谱的区域数量和大小要至少与比较的图谱大致相同,因为区域越小就越容易有更高的同质性(图3)。因为往一个区域里加入更多体素会提高差异性,从而导致相似性降低。一个有效的分割方式必须导向一个比随机分割的图谱的同质性值显著更高的结果。

图3 同质性地形图。两个不同粒度的同质性地形图对比,不同颜色表示不同的同质性值。

A:把大脑分为100个脑区的图谱,同质性在枕叶较高,眶额叶和腹侧颞叶较低。

B:分为1000个脑区的图谱。与A相比,同质性值整体更高,因为脑区更小。

同质性值通常是平均所有大脑区域得到的单个值。然而,整个大脑的区域同质性并不一致,即不同区域具有不同的同质性值。例如,一项研究报告,腹侧颞叶和眶额皮质的同质性值较低,可能是由于这些区域的信噪比较低。因此,我们认为,可以以脑图的形式单独报告不同区域的同质性值(图3)。这样的脑图可以更详细地比较不同的分割方式。此外,同质性值的空间差异性要求开发对SNR水平变化具有鲁棒性的同质性度量,这也许可以通过依据SNR适当归一化每个区域的同质性来实现。

区域异质性

高同质性是有效图谱的必要标准,但这还不够。有效的图谱应该要在不同区域之间有较大区分,即与分配给同一区域的体素相比,分配给不同区域的体素应该是不同的。在数据科学领域,衡量区域异质性的指标是区域异质程度,也被称作聚类验证指数。区域分离度是单个指标,量化了区域内和区域间体素相似性的平衡,它需要计算两个分量。第一个被称为内聚,描述了分配给同一区域的体素之间的相似性,在概念上类似于区域同质性。第二个组件称为分离,用于描述分配给不同区域的体素之间的相似性。这两个分量的量化也同样用到了计算区域同质性的体素相似性度量。

表2给出了用于图谱效度的若干聚类分离标准。一些常用的度量,如轮廓指数和聚类质量指数,采用归一化的值以利于解释极端情况。范围的下限表示区域之间没有分离,即指定给同一区域的体素与指定给不同区域的体元相似。较高的极值表示完全分离,即,分配给同一区域的体素最大相似,分配给不同区域的体素最小相似。

表2 区域异质性指标

在使用不同数学公式的情况下,发现不同的聚类分离标准在数据集的分离和紧凑程度方面基本一致。然而,已知分组真值的模拟研究表明,具有高轮廓分数的数据集的划分与由大小不等的组包含噪声数据点组成的数据集划分最为相似。这两种特征已知存在于功能磁共振成像数据集中。因此,与表2中列出的其他测量方法相比,Silhouette轮廓指数是一种更稳健的聚类分离测量方法。采用Silhouette轮廓指数作为用于测量聚类分离的单一测量方法将进一步促进不同图谱之间的直接比较。

有监督评估

有监督评估是将被评估的图谱与“标准图谱”进行比较。理想情况下,标准图谱是大脑的“真实”图谱,但这是未知的。因此,需要通过创建合成数据集来构建标准图谱,方式是先定义图谱,再生成每个区域内体素的模拟时间序列,从而为每个区域内的体素分配高度相似的时间序列,为不同区域的体素分配不同的时间序列。然后,将分割算法应用于该合成数据集,并使用表3中列出的图谱相似性度量将结果图谱与合成标准图谱进行比较。这种方法的挑战在于创建与BOLD活动类似的模拟时间序列。有多个主题被用于构建模拟fMRI活动。文献中的一个主题是为每个区域内的体素分配一个共享的时间序列,但叠加各自独立的噪声。文献中使用的典型时间序列是不同相位的正弦波、自回归过程生成的波形、与血流动力学响应函数卷积的自回归过程产生的波形以及相隔几个空间距离区域的平均真实fMRI时间序列。另一个主题是通过将公共相位分配给细胞结构划定区域内所有体素的真实fMRI时间序列来创建模拟区域,或者将旨在模拟血流动力学响应的时空动力学的相关结构施加到真实fMRI时间序列上,去除其自相关,以生成模拟数据集。去除自相关被称为预白化,它消除了由自相关引起的伪成对相关。真实fMRI时间序列比模拟时间序列更适合合成数据集,因为它们更准确地捕捉了真实数据集的时空结构,例如空间自相关、血流动力学响应和时间频率。由于合成数据集不被视为完全捕捉了BOLD活动的时空结构,因此,应用于这些数据集时,任何细分算法的性能都将被视为其应用于实际数据集时的性能上限。

表3 图谱相似性度量

表3中列出的一些图谱相似性度量,如校准后的随机指数和校准后的互信息指数,校准了通过比较两个随机图谱预期观察到的基线。仿真数据表明,当体素的数量大于区域数量的100倍时,校准是不必要的,尤其是对于粒度较粗的图谱。但是,如果不满足此标准,则必须使用经过校准的度量,或者必须将结果值与随机生成的具有相似区域数量和大小的图谱与要比较的两个图谱进行比较的值进行比较。

信度评估

      信度用于评估大脑分区的可重复性。通常的测量指标是图谱结果的差异性。变化较小的图谱更容易被重复,因此被认为更可靠。图谱的差异性可归因于三个因素:1)分割算法固有的随机性,称为扫描内可变性,2)同一个体不同扫描中的随机性(称为个体内可变性),以及3)因受试者特定特质而产生的可变性,称为个体间差异性。可变性量化需要比较由相同方法生成的多个图谱。结果的变化越大,它们之间的一致程度就越低,这是通过相似性度量来衡量的。

在效度评估中,讨论了量化不同来源可变性的方法。此处描述的效度评估类似于数据挖掘文献中的“聚类稳定性”概念。聚类方案的稳定性是指当聚类算法多次应用于同一数据集或应用于从同一分布中采样的多个数据集时,结果的一致性。稳定性分析是评估图谱分区算法的常用方法。

扫描内差异性

计算扫描内差异性的目的是评估分割算法固有的随机性对结果的影响。通过多次对同一扫描应用相同的分割算法,并使用表3中列出的图谱相似性度量比较结果,可以对扫描内可变性进行量化。扫描内可变性与需要随机初始化的K均值和混合模型等分割算法相似,体素对区域的初始分配是随机的。然后,该算法迭代计算每个体素和每个脑区内的体素之间的相似性,并将体素重新分配到它们最相似的脑区,以搜索最大化分配给同一区域的体素间相似性的结果。算法初始化数次,每次都会产生不同的结果。扫描内差异性是对这些不同解决方案的差异的度量。有几种方法可以从不同初始化产生的不同解决方案中构造单个图谱。一种方法是选择使某些标准(如似然性)最大化的解决方案。另一种方法是将所有解决方案组合成单个图谱,以捕获所有单个解决方案之间的共性。扫描内可变性的值是用于评估最终分割质量的相关信息。对初始条件更敏感的分割算法不太可能收敛到分割问题的最优解。值得关注的是,报告扫描内差异性目前在脑分区文献中并不常见。具有更高扫描内可变性的分割算法可受益于初始化方法,该技术增加了算法寻找全局最优解的倾向,尽管其在脑图谱文献中的应用尚未充分探索。

个体内差异性

个体内差异性用于评估从同一受试者获取的不同扫描数据集构建的图谱的差异性。如果在不同扫描中捕获的信息是可变的,则使用相同算法从同一受试者的不同扫描中获得的图谱可能不同。引起这一改变的因素有扫描仪引起的噪声、生理性噪声、月经周期和受试者在扫描时的身体水分含量。受试者的认知状态也会带来额外的差异性,例如他们在扫描获取之前是否进食或摄入咖啡因,何时进行的扫描,困倦,睡眠剥夺,情绪,以及他们在扫描之前执行的认知任务。

一些研究计算了个体内差异性。对于大多数算法,报告的个体内差异性小于40%,这意味着从同一受试者的不同数据集生成的图谱彼此之间的一致性至少为60%。个体内差异性随细分粒度而变化,但变化的程度和方式高度依赖于细分算法。对于K-means和分层聚类算法,发现两个不同粒度级别的个体内差异性差异高达10%,而对于其他算法,差异可忽略不计(<5%)。个体内差异性在整个大脑中也是异质的,感觉运动皮层的差异性高于联合皮层。最后,个体内差异性随着扫描时间的增加而降低。先前有研究报道,需要至少30分钟的静息状态数据才能获得小于15%的个体内差异性,并且对于超过90分钟的静息态数据,个体内变异率通常小于5%。

减少不同扫描中体素之间成对相关性的差异性可以潜在地降低个体内差异性。这样做的一种方法是组合在不同日期收集的数据集,以平均出由受试者认知状态引入的差异性。预处理参数的选择,特别是时间滤波器的截止频率,也被证明会影响成对相关性的可变性。可以合理地预期,使用最小化成对相关性可变性的预处理流程也会降低功能分区的个体内可变性。

目前,报告个体内差异性的常用方法是报告单个值,该值计算同一个体的两个图谱之间的一致程度。然而,如前所述,一些研究表明,个体内差异性在整个大脑中并不均匀,在感觉和运动皮质中更高。这些可变性模式是否源于这些研究中使用的特定分割算法尚不清楚。我们建议针对大脑中的不同位置报告个体内差异性,例如以地形图的形式报告,而不是报告一个单一的数字,尽管这目前不是常见做法。此类地形图可能提供有关个体内变量可能来源的信息,并可能导致减少这些变量的补救措施。

个体间差异性

个体间差异性量化了不同个体采用同一算法构建的图谱之间的差异性。个体大脑共享一个共同的功能组织,但大脑区域的确切大小、位置和排列因受试者而异。尽管个体存在差异,但一个可靠的图谱有望捕捉到受试者之间大脑的共同组织结构。具有较低个体间差异性的分割方法被认为更可靠。

我们注意到,在解释个体间差异性所表达的信息时必须谨慎。个体间差异性是由“真实”的个体间差异和噪声引起的,包括分割过程的不精确性,例如算法以及数据预处理中的成像噪声和不精确性。因此,即使分割算法做得很好,个体间的变异性也不会为零。为了消除真正的个体间差异和个体内变异性的影响,许多研究量化了组水平分组之间的一致性。通过组合来自多个个体的数据集来构建组级分组,从而平均出个体内和个体间的变量。组间变异性通常对图谱粒度不敏感,尽管对于使用谱聚类算法构建的图谱来说会随着粒度的增加而降低。

组水平的图谱需要把个体大脑配准到一个公共立体定位空间。配准是根据单个大脑的形态学对齐T1加权图像实现的。已有研究发现通过功能特征而不是形态学特征进行配准时可以显著提高不同组别之间的图谱可重复性。因为大脑的解剖结构和功能并不是紧密相关的。当基于解剖学进行配准时,不同大脑中对应的体素在功能上不一定相似,从而也许会导致组间差异性的增加。

脑图谱的结构被证明与年龄有关。当比较两对年龄不同的群体的大脑图谱时,一些潜变量可能会影响真实的差异性。为了最小化年龄的影响,进行组水平的图谱比较时应该要保证两组人有相同的年龄分布

测量真实的个体间差异也是很多研究的兴趣所在。对个体间差异性的可靠估计需要最小化个体内差异性对两个个体水平的图谱差异的贡献。例如,如果两个被试是一天中的不同时间进行扫描的,他们的fMRI激活就会受到自身节律的系统性影响。现在还不知道这种节律变化是否会系统性地影响被试的个体水平的脑图谱和个体间的脑图谱。因此,最好能结合一个被试在不同扫描时间的数据构建脑图谱,从而平均掉这种个体内的差异性。或者,可使用分层统计模型明确估计个体内差异性,该模型从数据中同时估计受试者内的变异性和个体间的变异性,并已证明无需组合多个扫描。

个体间变异性平均来看大于个体内变异性。然而,与个体内变异性不同,与感觉运动皮层相比,联合皮层的个体间变异性更高。这一观察结果的一个可能解释是,在个体之间,联合皮层的功能连接本身比感觉运动区域更可变。也有报道称,与个体间行为差异相关的大脑部分体素的功能连接分布更为多变,表明大脑组织和行为的个体间变异性之间可能存在联系。

外部验证

外部验证方法使用了未用于构建图谱的外部信息源。其基本原理是,准确地将大脑划分为功能上有意义的区域的大脑图谱预计可以预测即便是该图谱算法未指定的但已知的大脑特性。从本质上讲,外部验证通过使用未用于构建图谱的特征来验证脑图谱的有效性,也即同时评估了脑图谱的泛化能力。通常用于评估细分的三个外部来源是:1)大脑的微观结构,2)任务诱发活动,以及3)个人特征

在接下来的内容中,我们将简要描述其使用方法。

与微观结构的配准

评估脑图谱与脑微观结构的匹配程度。这种方法背后的基本原理是观察到神经组织的不同特征彼此高度相关。一些专注于感觉和运动区域的研究表明,具有相似细胞结构的体素也具有相似的功能活性。

与微结构的配准通常是通过将从一个图谱中选择的一组脑区与基于在体内测量的灰质结构定义的区域或Brodmann的细胞结构定义区域进行比较来进行的。Brodmann分区基于微观特征,包括皮质层的形成、细胞簇和跨皮质柱的排列以及存在的某些细胞类型。在体内测量的神经组织的髓鞘结构捕获了大脑组织中在整个皮层中变化的髓鞘密度。通过目视检查定性地与微观结构对齐,并使用相似性度量(如一致性百分比、骰子系数和边界之间的距离定量地对齐。

将功能分区与细胞和结构定义的区域进行比较,发现了几个有趣的趋势。首先,随着细分粒度的增加,功能分区和微观结构定义区域之间的一致性增加。其次,基于主沟位置(如AAL或Desikan脑图谱)而非功能活动的脑图谱与细胞结构定义区域的一致性高于功能分区。这一观察带来了一个疑问,因为只有少数细胞结构定义的区域的边界与用于构建图谱的宏观结构地标对齐,如AAL和Deskian。虽然这些结果可能反映了脑分区方法的性能不佳,但另一种可能的解释是,功能分区和微观结构定义的区域具有不同的组织边界。例如,在视觉皮层中,功能分区与视觉皮层的视网膜地形图对齐,而不是与其细胞结构对齐。另一个例子是Gao等人对非人灵长类动物的研究。他们观察到,运动皮层中由分组算法划定的区域与细胞结构定义的初级和运动前区域并不匹配。原因在于,前运动区和主运动区都包括身体的运动图,而分组算法将参与控制每个身体相同部位的体素分组在一起,即使它们在细胞结构上是不同的。这些示例表明,基于功能活动和微观结构定义区域的细分之间的错位不一定是由于细分中的不准确,而是由于这些模式捕捉了神经组织的不同特征。因此,功能分区和微观结构图之间的不一致并不一定反映出较差的分组性能,还需要更多研究才能知道分区表现。

Gao等人的研究同样揭露了使用动物模型测量功能图谱的方法。使用猴子和大鼠等动物模型的主要优势在于,它们大脑的微观结构已通过侵入性组织学和追踪技术得到广泛研究。光遗传学和微刺激等侵入性扰动方法还允许检查大脑区域之间的因果功能联系,以及它与功能磁共振成像捕获的功能连通性的关系。最后,与用于人类成像研究的现有技术(例如,3-T扫描仪,用于人类连接组项目的2 mm空间分辨率)相比,啮齿类动物可使用更强大的MRI扫描仪[例如,9.4 T],允许以更高的空间分辨率(例如,0.2 mm)成像功能活动。除了动物模型的方法学优势外,动物大脑的整体功能组织似乎在物种间是一致的。例如,在大鼠和猴子中也发现了默认模式网络。另一个例子是,大鼠的海马-前额叶功能网络与人类的几乎一样。这些研究表明,动物模型提供了一种很有前途的方法来研究人脑分区。

与任务相关激活的配准

通过对具有类似BOLD活动的体素进行分组,大脑分割算法有望将大脑划分为功能相关的区域。因此,任务诱发活动将与具有与任务相关功能的脑区匹配。不过需要注意的是,与任务诱发活动的比较仅适用于大脑中能够被已知任务(如感觉和运动皮质)稳定激活的部分。由于各种原因,如功能磁共振成像信噪比的异质性和大脑不同部位任务激活的粒度差异,不能说与大脑某些部位的任务诱发活动能够很好匹配的图谱在匹配其他部位时也是准确的。因此为了使用任务诱发活动进行评估,我们建议收集激活大脑不同部分(包括联合皮层、感觉运动皮层和皮层下结构)的各种任务的任务诱发功能磁共振成像数据。

检查给定图谱与任务诱发活动的匹配程度的一种方法是定性地比较分区区域与任务激活区域的匹配情况,例如,目测对比属于视觉皮层的区域与实际被视觉刺激激活的区域是否一致。另一种方法是定量计算分割区域与使用任务诱发激活定义的区域之间的一致性。这种量化的一种方法是使用划分相似性指标来度量两组区域之间的一致性。然而,使用任务诱发激活定义区域需要使用z分数,并且必须在不同阈值下执行,以确保结果不依赖于阈值的选择。另一种方法是测量每个区域的任务诱发激活的同质性,作为分配给该区域的体素的z评分任务诱发活动的方差。该方法避免了对激活z分数进行阈值化的需要。

一项研究报告称,大脑分区和任务诱发活动之间的对齐依赖于任务,某些任务的对齐程度高于其他任务。这可能是因为这种划分在一些脑区比其他脑区更精确。然而,一项研究表明,与fMRI测量的任务诱发活动相比,使用侵入性电刺激估计的术前功能图与大脑的功能图谱对齐更好。总的来说,应通过检查任务诱发数据集的可靠性来增强与任务诱发活动作为评估方法的一致性。一种最小化大脑状态波动对个体内变异性的贡献以及由此导致的功能图谱和任务诱发活动之间的错位的方法是在同一session中同时收集静息状态和任务态。另一种可能的解决方案是使用具有更高重测信度的任务,如工作记忆、心理理论、情绪面部匹配和金钱激励延迟任务,尽管这种方法减少了可用于评估的任务数量。

对个体特征的预测

大脑的组织取决于个体特征,如性别、年龄、惯用手、语言偏侧性、工作记忆等复杂认知任务的表现以及个性特征。分组算法捕捉预测个人特征的组织差异的能力表明了其在研究不同个人特征的神经基础方面的实用性。为了系统地量化给定图谱的预测能力,将图谱的某些属性(如区域大小)用作独立变量,以预测一个或多个个人特征。预测能力通过多种方法进行量化,如相关性分析,统计测试,以及使用机器学习算法进行分类。

这种评价方法产生了令人鼓舞的结果。使用脑区地形图和网络地形图作为自变量将受试者分为男性和女性的分类精度为60%至85%,其中网络地形图的计算方式是使用脑区作为节点,将其时间序列之间的成对相关性作为边。在这两种情况下,在较高的细分粒度下可实现更高的性能。另一个个人特征是语言偏侧性,它捕捉了语义分类任务中跨大脑半球功能磁共振成像活动的不对称性。语言偏侧性与区域间功能连接的偏侧程度显著相关(r=0.6)。在右手和左手个体中,脑区结构本身的偏侧性也显著不同。认知任务(如工作记忆和阅读)的表现也与区域地形图(r=0.13)和区域大小(r=0.08)相关。

最近的研究表明,与静息状态相比,使用任务诱发活动测量的功能连接放大了行为个体差异。因此,使用静息状态活动作为自变量会降低图谱的预测能力。此外,一些任务(如赌博、工作记忆和情绪处理任务)比其他任务(如运动、语言处理、社会认知和关系处理任务)更能突出个体间的差异。因此,当使用需要计算脑区功能连接作为自变量的图谱时,最好使用从一组任务中收集的任务诱发活动。

可能用于评估脑图谱的个人特征种类相当多。举几个例子,年龄、双耳分听和许多人格特征等特征都与大脑的组织有关。这些特征中的每一个都可用于图谱评估。

决定恰当的区域数量

没有广泛商定的用于分割大脑的区域数量或粒度级别。细分粒度取决于选择区域数量的方法。虽然有几种细分方法能够估计从数据本身解释给定数据集的最佳脑区数,但其他方法需要用户指定脑区数。目前还不知道什么样的划分粒度更能描述数据。因此,图谱研究开发了两种数据驱动的方法来确定脑区的最佳数量。

 第一种方法是选择能够让脑区间差异最大化的脑区数量。在该方法中,构建了多个不同粒度级别的图谱,并计算了每个图谱的分离指标,然后选择在脑区之间产生最高间隔的粒度级别。在表2中列出的用于测量分离指标的测量中,模拟显示剪影和Davie–Bouldin指数在检索模拟噪声数据集中的真实组数方面最为成功。

第二种方法是选择最大化再现或等效最小化图谱变异性的区域数。使用的指标是最小化扫描内和个体间变异量。

选择使可变性最小化的粒度背后的基本原理是,选择错误的区域数会引入额外的变异源。更具体地说,如果区域数低于数据集中的真实组数,则算法将合并多个此类真实组以构建更大的组。由于合并不是基于数据中真正的底层分组结构,因此选择哪一个真正的分组是正确的就比较武断。因此,将该算法应用于不同的数据样本或从不同的初始条件开始,将导致不同的真组集合和不同的划分结果的合并。相反,当区域数高于真实组数时,真实组被任意分割为更小的组,并且根据特定的数据集和初始条件,每次应用算法时分割的方式不同。因此,如果区域的数量不是最优的,则生成的图谱将是高度异质性的。然而,已经表明,某些分组结构的存在可以导致除真实数目之外的许多组的变异性最小。例如,如果一个数据集由三个真实组组成,其中三个组中的两个组彼此更相似,则选择将数据聚类为两个组将始终导致算法将两个更相似的组合并在一起。因此,当通过最小化可变性选择区域数量时,分析必须辅之以其他标准,如区域分离或数据科学领域常用的其他方法。

基于研究目的的评价方法

尽管上述用于评估脑分区的方法对于表征脑分区的不同特性是必要的,但使用脑分区分析各种类型数据集的脑成像研究领域也关注哪些脑分区更能突出给定研究中的感兴趣信号。例如,一项旨在识别神经系统疾病引起的功能连接变化的研究需要一个能最大限度地区分对照组和患有该疾病的受试者的大脑分区。

我们认为,在为给定研究选择脑区时,应采用目的论方法。大脑分区本质上是一个聚类问题,近年来,数据科学界的研究人员认为,任何聚类算法的适当评估方法同样应面向聚类的特定应用。同样,我们在这里提出,应在预期应用的背景下评估大脑分区,以及前面讨论的评估方法。分区算法、粒度以及它是从单个主题或多个主题的数据集构建的,都需要针对任何给定应用程序进行相关参数的优化。

此外,我们相信,构建“分区问题分类法”有助于为不同的应用类别确定合适的分类和评估方法。这种方法在工程的不同分支中都取得了丰硕的成果。分类法应包括大脑图谱的主要应用类别,然后,可以在每个应用类别的背景中比较和评估不同的图谱。我们进一步认为,这种比较应该以数据驱动的方式进行。分割的选择可以看作是准备fMRI数据进行分析的一个步骤,需要针对特定应用进行优化。优化需要尝试多个细分并报告其性能,正如一些研究已经完成的(图5A)。随着在实际应用中使用和测试更多的分割图谱,预计将出现更完整的方案,说明哪些图谱可能更适合不同的应用类别。例如,在一个背景中,无论用于构建脑区的算法或问题数量如何,低粒度级别的分区可能是最优的,而在另一个背景中,使用特定算法构建的高粒度级别分区可能是最佳选择。已有多项研究证明了目的论方法的重要性以及使用数据驱动方法的必要性。

数据驱动的目的论方法在对于给定的背景,不清楚哪种划分是最优的情况下是有用的。但当直观地假设什么样的图谱可能适合于给定的应用程序时,它也可以防止潜在的偏差。同时,对多个图谱的测试也需要避免过拟合的情况。一些具体的例子可以见原文。

未来方向

关于现有的图谱,一个隐含的假设是,fMRI所捕获的大脑功能组织随着时间的推移是静止的。这一假设受到了一项观察的挑战,即功能连接曲线在静息状态下不是静止的,而是在数十秒的时间尺度上在几个大脑状态之间切换。功能分区区域的数量和空间位置由于大脑状态的改变而发生变化。此外,由静息状态功能磁共振成像构建的功能区与由任务诱发活动构建的功能区不同。由任务诱发活动构建的功能性分组的结构也取决于特定任务。当前的评估方法没有考虑到功能分区的动态性质,并且可能会错误地报告出较低的性能,因为用于评估的数据集与用于构建图谱的数据集是在不同的状态下获取的。处理fMRI数据集非平稳性的一种潜在方法是构建特定状态的功能图谱,并使用在相同状态下获取的fMRI数据集对其进行评估。

目前的评估方法只关注健康大脑的分区。脑图谱经常用于研究不同神经系统疾病的机制。如果疾病改变了大脑的组织结构,那么根据从健康受试者获得的数据构建的大脑图谱不适合对患有疾病的个体的大脑进行分区。从健康个体和神经系统疾病个体获得的数据集构建的分组之间的比较,以及使用专门为不同疾病构建的分组是否有利于研究这些疾病有待进一步研究。

很少有研究关注了用于构建图谱的fMRI数据集的评估。用于构建功能性脑分区的功能磁共振成像数据集经过预处理,包括带通滤波和空间平滑。然而,滤波器的截止频率和空间平滑程度因研究而异。截止频率的选择影响了功能磁共振数据集的重测可靠性,并可能影响功能图谱的再现性。空间平滑也会影响大脑中的功能连接模式,如果针对该模式进行了优化,则可能会提高大脑图谱的质量。尽管少数研究报告了对空间平滑的敏感性可以忽略不计,但目前尚不清楚其他现有图谱对空间平滑规模的敏感性。此外,初步结果表明,预白化功能磁共振成像时间序列可以通过消除自相关引起的体素之间的虚假相关性来提高细分质量。预白化也被证明是生物标记物发现和任务激活体素估计的一个有前途的预处理步骤。预白化是否对大脑图谱的质量有显著影响尚待研究。

结论

      目前还没有一致意见认为哪一个大脑分区图谱在识别大脑功能相关区域方面最准确。在缺乏真值的情况下,已经根据与理想的大脑分区图谱的相似程度、可重复性和可推广性对大脑图谱进行了评估。很明显,没有一个单一的图谱具有理想图谱的所有特征。然而,基于效度、信度或外部信息源评估方法并不能评估大脑图谱在不同环境中的效用。因此,我们建议在预期使用图谱的背景下进行评估。

我们主张构建适用不同大脑图谱的应用指导方案,并分别为不同的应用场景识别最佳大脑谱图,而不是使用单一的图谱。识别不同场景下最佳适用的大脑图谱的方式应主要为数据驱动,即不事先假设使用什么图谱是适当的,而是要使用不同粒度的图谱,并比较它们在识别感兴趣信号方面的性能。适合于应用场景的图谱是能够最大限度地识别感兴趣信号的图谱。理想情况下,一旦在不同的背景中完成了此优化过程,就会总结出适用于不同背景的最佳图谱模式。

评估基于功能磁共振成像的脑图谱相关推荐

  1. 基于功能连接组的自闭症预测模型

    自闭症是一种异质性的神经发育状况,基于功能磁共振成像的研究已经有助于深化我们对大脑网络活动影响的理解.我们回顾了使用功能连接性和症状的预测建模如何帮助揭示这种病状的关键见解.我们讨论了不同的预测框架如 ...

  2. BP综述:自闭症中基于功能连接体的预测模型

    自闭症是一种异质性的神经发育疾病,基于功能磁共振成像的研究有助于推进我们对其对大脑网络活动影响的理解.我们回顾了使用功能连接和症状的测量的预测建模如何帮助揭示对这种情况的关键见解.我们讨论了不同的预测 ...

  3. Radiology:脑损伤患者基于语言任务的功能磁共振成像与静息态功能磁共振成像对躯体运动网络的识别

    在过去的几十年里,功能性磁共振成像(fMRI)被广泛用于术前规划,有证据表明,附加信息可以改变很大一部分脑肿瘤患者的治疗方法.术前功能磁共振成像有助于减小开颅手术的规模,并通过促进术中定位或减少对定位 ...

  4. 基于磁共振成像的脑龄研究:可解释的人工智能的当前状态和未来挑战

    在人的一生中,大脑会发生与年龄相关的显著变化,个体的衰老速度会显示出明显的个体间差异,从而产生作为大脑特征在特定认知领域上的大脑标记.这些是由各种各样的因素形成的,既有内部的,也有外部的.最近,研究人 ...

  5. 静息态功能磁共振成像:关于静息态功能连接和脑网络分析方法

    自诞生之初,人类就对大脑中发生的事情充满好奇.功能磁共振成像是一种重要的工具,它有助于无创地检查.定位和探索大脑的语言.记忆等功能.近年来,神经科学研究的焦点明显转向了"静息态"下 ...

  6. NeuroImage:功能磁共振成像中自发、短暂脑网络相互作用的行为相关性

    <本文同步发布于"脑之说"微信公众号,欢迎搜索关注~~> 摘要:几十年来,不同脑区自发波动的功能磁共振成像(fMRI)信号与行为之间的关系一直处于探索阶段,这些信号间的 ...

  7. matlab plv,一种基于微状态的脑功能网络构建方法与流程

    本发明涉及脑功能网络研究技术领域,更具体而言,涉及一种基于微状态的脑功能网络构建方法. 背景技术: 复杂网络作为近年来一种新兴的数据分析方法,被应用于各个方面.由于大脑是一个十分复杂的系统,不同神经元 ...

  8. 一个用于Allen脑图谱基因数据的工具箱|abagen详细使用教程-获取基于脑区的基因表达矩阵(脑区*gene)

    艾伦人类脑图谱(Allen Human Brain Atlas) 艾伦人类脑图谱是一个由艾伦脑科学研究所(Allen Institute for Brain Science)开发的在线基因表达图谱数据 ...

  9. 第四章 脑功能磁共振成像

    第四章 脑功能磁共振成像 fMRI简介 HBP:人类脑计划,利用现代化信息工具探索大脑 现代神经科学:多学科.多水平的综合研究领域 脑功能成像fMRI及其特点 脑功能成像fMRI: fMRI根据MRI ...

  10. 艾伦脑科学研究所,脑图谱,小鼠不同的功能脑区,可视化展示

    艾伦脑科学研究所,脑图谱,小鼠不同的功能脑区,可视化展示 https://portal.brain-map.org/ 广告: https://alleninstitute.org/what-we-do ...

最新文章

  1. 带你感受小而美的看板协作工具Leangoo的魅力
  2. ActiveX开发知多少?
  3. php 析构不执行,PHP析构方法 __destruct() 不触发的两个解决办法
  4. jquery隐藏或者显示一个元素
  5. DNS 网关 路由 交换机 网桥 协议 服务器 这些都是什么关系?
  6. [转贴]Integrating FrontPage and VS .NET
  7. 今日代码(200708)--缺失值处理
  8. C++课程设计,12306模拟写起来就是这么粗暴
  9. 《迷宫》之站立会议—5.15
  10. java堆外内存溢出_JVM 案例 - 堆外内存导致的溢出错误
  11. 内网通看不到其他人_小学生在新版本里用“吃鸡内挂”,巡查员:封不了,手机自带的...
  12. 作者:程致远(1991-),男,东北大学计算机科学系硕士生
  13. ubuntun 16.04 AttributeError: type object 'Callable' has no attribute '_abc_registry'
  14. c#委托把方法当成参数
  15. 机器学习、数据分析类面经分享
  16. 验证码识别库 python_python 验证码识别库pytesseract的使用
  17. 在Vue项目中引入 ECharts 3D 路径图 Flights GL(需安装echarts、echarts-gl、jQuery依赖,已踩坑)
  18. android 斜线 绘制_Android绘图:绘制直线的 drawLine方法
  19. linux hba卡超时时间,如何设置Emulex HBA 卡超时参数
  20. 2021年茶艺师(中级)考试内容及茶艺师(中级)操作证考试

热门文章

  1. 5分钟学会双拼 双拼输入法 最简单的双拼入门教学 图文教程
  2. 将网页转换成pdf文档的方法
  3. Magento 自定义EMS FEDEX DHL UPS扩展 第三章
  4. ExtJs6 响应式布局
  5. 汽车线性二自由度动力学模型-simulink仿真
  6. 大学四年毕业季我用Python写了一个论文降重工具(希望能帮助到学弟学妹)
  7. php简短一句话木马免杀,免杀/一句话木马(PHP)
  8. 【FPGA】精品FPGA书籍推荐
  9. 尚硅谷_宋红康_JDBC
  10. SEO黑帽寄生虫快排的生成原理及做法[详解]