在过去几年中,从脑肿瘤患者中采集的具有常规临床用途的神经影像数据的数量、种类和复杂性以及由此产生的影像参数数量都大幅增加。因此,如果没有人工智能(AI)领域的方法支持,对成像数据进行及时且成本效益高的评估几乎是不可能的。人工智能可以推进并缩减图像处理工作流程中的各种耗时步骤(例如肿瘤分割),从而优化生产效率。此外,影像数据的自动化和基于计算机的分析可能有助于提高数据的可比性,因为它与评估临床医生的经验水平无关。重要的是,人工智能提供了从常规获得的脑肿瘤患者神经图像中提取新特征的可能性。结合患者数据(例如生存率、分子标记或基因组学),可以构建数学模型,例如预测治疗反应或预后,以及分子标记的非侵入性评估。人工智能领域中,用于图像特征的计算、识别和提取,以及预后或预测数学模型的生成的分支学科,被称为影像组学。本文综述了神经肿瘤学中基于特征的影像组学的基础知识、通用工作流程和方法,并提供了临床应用的精选范例。本文发表在Methods杂志。

1.介绍

脑癌的诊断主要基于神经影像学发现,以及从肿瘤切除或活检中获得的组织样本的组织分子评估。几十年来,大多数解剖神经成像技术,如对比增强计算机断层扫描(CT)或磁共振成像(MRI),已用于脑肿瘤诊断、治疗计划和随访。最近,主要来源于高级MRI和氨基酸PET以及技术发展(例如PET/CT和PET/MRI异机融合扫描技术)的额外成像参数越来越多,它们在脑肿瘤患者中产生了大量复杂的神经成像数据。如果没有足够的计算机技术支持,及时评估这些应用于临床日常工作中的潜在诊断信息将耗费很高的成本,并且几乎不可行。在这里,人工智能新兴领域的方法为进一步支持临床医生提供了新的选择。特别是人工智能可以部分或完全自动化地执行诊断程序中的各个步骤,因此,如人工检测和病灶分割这类特别耗时的过程,都是由计算机执行的,只需要临床医生进行最终确认。并且,基于人工智能的方法可以提升图像处理与分析的速度,从而提高生产率。此外,基于人工智能的影像数据自动分析可能有助于提高获得结果的可比性,因为它与评估临床医生的经验水平无关。

人工智能还可以从常规采集的影像中提取尚未被发掘的特征。具体来说,可以从常规获取的神经成像数据中提取定量和半定量图像特征,而这些数据通常超出了人类的洞察范围。最后,这些图像特征的子集结合患者信息(如生存数据、分子标记或基因组学),可用于开发描述潜在脑肿瘤生物学特征的数学模型。随后,这些模型可用于基本的临床问题,例如预测治疗反应或预后,以及分子标记的非侵入性评估。图像特征的计算、识别和提取,以及预后或预测数学模型的生成,都总结在影像组学这个术语下,这是人工智能广阔领域内的一个专门的应用。

本文综述了影像组学的基础知识、通用的工作流程和方法,重点介绍了神经肿瘤学中基于特征的影像组学,并提供了临床应用的精选范例。

2.影像组学

“图像不仅仅是图片,它们还是数据”(Radiology:影像组学:图像不仅仅是图片,它们还是数据)。罗伯特·吉利斯(Robert Gillies)及其同事的这一直观而精确的定义很好地阐明了影像组学的基本思想。影像组学可细分为基于特征的影像组学和基于深度学习的影像组学,并且通常用于常规采集的成像数据,从而允许以低成本进行额外的数据分析。由于影像组学特征要么是在数学上预定义的(基于特征的影像组学),要么是通过基于高级统计学和机器学习的半自动或全自动方法训练计算模型从数据中生成的(基于深度学习的影像组学),与那些较为主观和依赖于判读者的临床评估相比,影像组学结果具有更好的鲁棒性、可靠性和可复用性。如上所述,脑肿瘤的组织分子特征对于治疗决策和预后至关重要。影像基因组学是影像组学的一个分支学科,旨在对分子标记、基因突变或染色体畸变进行非侵入性预测,尤其是在无法获取组织样本的情况下。

2.1 基于特征的影像组学

基于特征的影像组学利用一组数学上预定义的特征,这些特征通常是从分割的感兴趣区域(ROI)或感兴趣体积(VOI)中提取的。在特征提取之后,通过特征筛选算法确定相关特征的子集,以避免过拟合,并生成鲁棒性强和可泛化的预测模型。应注意的是,不正确的特征选择也可能导致过拟合。例如,如果基于非常同质的数据集(相同的扫描仪和采集协议)进行特征筛选,则所选特征可能与其他设置无关。因此,使用异质的数据集(不同的扫描仪和采集协议)进行特征筛选可降低仅选择局部相关特征的概率,从而降低过拟合的风险。由于计算出的特征是独立于数据进行定义的,因此基于特征的影像组学不一定需要大数据集,而且计算时间通常较少。此外,由于特征及其数学定义是已知的,因此可以对生物学类比进行解释。然而,大多数提取的特征都非常复杂,即纹理参数与生理学或病理生理学意义或解释之间的直接联系很难被人类察觉,甚至不可能被察觉。以下总结了基于特征的影像组学工作流程中最关键的处理步骤。

2.1.1 图像预处理

影像组学的主要目标是从医学图像中生成和使用定量特征。此外,提取的特征和生成的模型应具有可复用性和泛化性,尤其是在使用来自不同扫描仪和不同采集协议的数据时(临床中采集的数据通常来自不同扫描仪和不同采集协议)。为了实现这些目标,必须执行几个预处理步骤。影像组学分析中典型的预处理步骤包括但不限于:灰度归一化、空间平滑、空间重采样、降噪以及MRI非均匀场校正。

2.1.2 肿瘤分割

对于脑肿瘤,包括胶质瘤和脑转移瘤,在临床常规中,通常在MR或CT图像上进行手动分割,以进行放射治疗的规划或治疗反应的体积评估。手动、三维分割脑肿瘤,包括对比度增强、坏死和病灶周围浮肿区域,既费时又费力。由于分割后的肿瘤为基于特征的影像组学分析建立了基础,因此分割轮廓直接影响影像组学分析的结果。为了克服这个问题,目前正在开发几种机器学习算法(包括纹理特征分析和基于深度学习的方法)并对其进行评估,以自动检测和分割脑转移瘤和神经胶质瘤。然而,尽管这些工具已经可用于支持肿瘤分割,但在最终成为临床常规的一部分之前,它们的可靠性和附加价值仍有待证明。

2.1.3 特征提取

我们可以从医学图像中提取不同类型的定量特征,其中大多数特征反映了肿瘤的异质性。虽然可以计算出数百个在数学定义方式上略有不同的特征,但这些特征通常可被划分在以下四个子组中:

i)形状特征反映了分割的ROI或VOI的几何关系和特性,例如最大直径、最大表面积、体积、紧凑度或球形度。

ii)一阶统计特征或基于直方图的特征使用直方图反映图像强度的分布,直方图描述分割的ROI或VOI中单个像素或体素强度值的分布,而不考虑其空间方位和空间关系。典型的基于直方图的特征有:平均值、中值、最小值、最大值、熵(随机性)、均匀性、不对称性(偏度)或峰度(平坦度)。

iii)二阶统计特征或纹理特征量化了肿瘤内部异质性。纹理特征反映了相邻像素或体素或像素或体素组的强度级别之间的统计关系。纹理特征不是直接从原始图像中计算出来的,而是从已经对原始图像中像素或体素之间的特定空间关系进行了编码的不同描述矩阵中计算出来的。纹理分析最主要的矩阵是灰度共生矩阵(GLCM),它反映了沿固定方向在特定距离内相邻像素(组)或体素(组)中灰度级别的统计关系。基于GLCM,可以计算多个纹理特征,如对比度、能量、相关性、同质性、方差、非相似性、聚类显著性、聚类倾向性和最大概率邻域灰度依赖矩阵(NGLDM)反映了一个体素与其26个相邻体素在三维空间中的灰度差异。其中,纹理特征中的粗糙度、对比度和频繁度可以通过NGLDM计算出来。灰度行程矩阵(GLRLM)对每个图像灰度的同质行程大小进行编码。基于GLRLM,可以提取诸如短行程强调(SRE)、长行程强调(LRE)、低灰度行程强调(LGRE)、高灰度行程强调(HGRE)或行程百分比(RP)等特征。其他一些矩阵用于编码原始图像中图像强度之间的某些空间关系,从中可以计算出大量纹理特征。

iv)高阶统计特征通常在应用特定数学变换(滤波器)后,通过统计方法计算得出,例如,用于识别重复模型、噪声抑制、边缘增强、定向梯度直方图或局部二值模式(LBP)。应用的数学变换或滤波器,包括高斯滤波图像的拉普拉斯变换(高斯的拉普拉斯变换)、小波变换或傅立叶变换、闵可夫斯基泛函或分形分析。

2.1.4 特征筛选

提取的定量特征对于从成像数据中生成预测模型并不同等重要。大多数特征要么是恒定的、冗余的、重复的、不相关的、高度相关的,要么会导致数据的过拟合,这使得依赖模型对图像噪声高度敏感。过拟合描述了一种方法上的误判,即生成的模型与分析的(成像)数据集的对应过于紧密,甚至匹配。过拟合可以在用于训练的数据集上获得完美的分类精度,但会使模型过于专一化,无法对新的或额外的成像数据进行分类,也无法可靠地预测结果。降低过拟合风险的一种方法是在模型生成之前进行特征筛选。有几种常用于影像组学的特征集缩减技术,可分为有监督和无监督特征选择技术。无监督特征选择技术不考虑类别标签,只是简单地从特征空间中删除冗余特征。在影像组学中,两种最常用的无监督特征选择方法是:主成分分析(PCA)和聚类分析。虽然这些方法降低了过拟合的风险,但它们通常不会得到最优特征子集。

相比之下,有监督特征选择技术考虑了特征与类别标签的关系,使得特征选择是基于它们对分类问题的贡献而执行的,即,对区分各组数据的贡献最大的特征是首选的。有三种常用的有监督特征集缩减方法:

i)过滤方法(单变量方法)测试特征和标签之间的关系,而不考虑它们是否冗余,即相互之间的相关性。常用的滤波方法包括但不限于Wilcoxon秩和检验、Fisher分数、卡方值、学生t检验或最小冗余最大相关(mRMR)。虽然过滤方法通常用于特征筛选,但未考虑特征之间的相关性和相互作用。

ii)包装方法(多变量方法)通过研究整个特征空间,并考虑到测试特征与数据集中其他特征之间的关系,打破了了这一限制。这里使用预测模型评估特征子集的性能。根据给定算法的性能质量评估每个新特征子集。包装方法是计算密集型的,因为它们的目标是找到产生最佳性能模型的特征子集。因此,包装方法也被称为贪婪算法。包装方法的突出示例有前向特征选择、反向特征消除、穷举特征选择或双向搜索。

iii)嵌入式方法在构建机器学习模型本身的过程中执行特征选择,即在模型训练期间就选择最优特征子集。因此,嵌入式方法结合了过滤方法和包装方法的优点。由于考虑了特征之间的关系,嵌入式方法比过滤方法更精确,比包装方法更快速,并且不容易造成数据过拟合。常用的嵌入式方法有岭回归、基于树的算法建模,如随机森林分类器、最小绝对收缩和选择算法(LASSO)。

2.1.5 模型生成与评估

在特征筛选之后,可以建立一个数学模型来预测已知的基本事实,例如特定的基因突变或肿瘤复发,而不是与治疗相关的组织变化。在机器学习中,根据研究的目的,可以使用几种算法来生成预测模型。影像组学中最流行的算法是:线性回归和逻辑回归、决策树(如随机森林)、支持向量机、神经网络和生存分析删失数据情况下的Cox风险比例回归模型。在同一数据集上生成模型并测试其性能是一个方法上的错误,也会导致过拟合。当然,简单地重复训练数据标签的模型将在相同的数据上获得完美的分类结果,但无法在未知的数据中预测出任何有用的信息。因此,在有监督的机器学习中,通常使用分层抽样将可用数据集细分为:训练数据集和验证数据集,以确保训练和验证数据集具有与完整集几乎相同的每类样本百分比(图1)。后者对于小型或不平衡数据集尤其重要。在模型训练和验证之后,理想情况下,该模型最终应用于第三个数据集,即所谓的测试数据集。在最佳情况下,测试数据集表示模型在应用于临床常规时将面对的数据,即来自不同机构、扫描仪、采集协议或分割的数据。因此,测试数据集是评估模型性能、鲁棒性和可靠性的黄金标准。需要注意的是,测试数据集决不能用于调整模型参数。然而,特别是对于小型数据集,可以在没有外部测试数据集的情况下应用统计学方法(如自举法或交叉验证)来评估模型性能(图2)。

图1 数据拆分目的:将可用数据集分为训练数据和测试数据。

训练数据进一步细分为训练数据集(绿色)和验证数据集(黄色)。训练数据集用于训练模型,而验证数据集用于评估模型。如果模型性能不令人满意,则可以调整模型参数,并在训练数据集中训练另一个模型。可以重复此过程,直到生成性能更好的模型。最后,将最佳模型应用于理想地表示真实世界数据的测试数据集。重要的是,测试数据集不应用于调整模型参数。(有关此图例中颜色参照的解释,请读者参考本文的web版本。)

图2十折交叉验证

十折交叉验证:将训练数据集(绿色)划分为十个大小相等的子集,其中一个子集保留为验证数据(黄色),其余九个数据集用作训练数据。之后,该过程重复10次,每个子集使用一次作为验证数据。然后,对每次迭代的分类准确率进行平均,生成最终准确率以对模型性能进行单独评估。(有关此图例中颜色参照的解释,请读者参考本文的web版本。)

2.2 基于深度学习的影像组学

基于深度学习的影像组学使用人工神经网络(ANN)模拟人类视觉系统的功能,并在不同的缩放比例和抽象层级上从输入的图像中自动提取高维特征。基于深度学习的影像组学对于模式识别或高维非线性数据的分类特别有帮助。

该工作流程与前面描述的工作流程有根本的不同。在基于深度学习的影像组学中,使用不同的网络结构,即线性和非线性函数的堆栈,如卷积神经网络(CNN)或自动编码器,从输入的数据中找到最相关的特征。训练一个单层神经网络级联系统用于学习和识别图像数据中与分类相关的结构,而无需事先定义或选择特征。然后将这些特征结构的组合进一步组合,以生成具有更高抽象层级的特征。

最后,提取的特征可以由网络进一步处理以进行分析和分类,也可以不借助网络,而使用不同的分类器,例如决策树、回归模型或支持向量机。需要注意的是,由于网络是从数据中生成和学习基本特征,因此很少执行特征筛选,但为了避免过拟合,使用了正则化和Dropout(dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。)等技术。由于特征与输入数据高度相关,基于深度学习的影像组学通常需要比基于特征的影像组学更大的数据集,这限制了其在神经肿瘤学研究中的适用性,因为在神经肿瘤学研究中,可用数据集的数量往往是有限的。然而,迁移学习可以克服这一局限性,方法是应用已经在不同但密切相关的任务中训练过的神经网络,例如,由成像数据训练的神经网络用于胶质瘤的自动分割也可能有助于脑转移瘤的分割。通过使用网络的先验知识,可以减少获得一致结果所需的数据量以及计算需求量。

3. 影像组学在神经肿瘤学中的应用

影像组学在脑肿瘤患者中的应用主要是基于常规MRI的分析。一些研究已经探讨了影像组学在区分脑胶质瘤和脑转移瘤患者在治疗相关改变和肿瘤进展方面的有效性,这是一个相当重要的临床问题。此外,一些研究还评估了影像组学在脑肿瘤的分类和分子特征方面的作用,这与2016年修订的世界卫生组织对中枢神经系统(CNS)肿瘤的分类具有高度相关性。在这种分类中,建议在组织学中加入分子标记来确定脑肿瘤实体。此外,胶质瘤患者的治疗策略与决策也主要基于分子标记。特别是异柠檬酸脱氢酶(IDH)基因、1p/19q染色体臂的杂合性丢失、MGMT启动子甲基化状态具有很高的临床相关性。为了确定这些标记物,需要从肿瘤切除或活检中获得组织样本。因此,上述分子表征的非侵入性方法具有重要的科学意义和临床意义。

下文总结了在脑肿瘤患者中使用基于特征的影像组学以及基于深度学习的影像组学的特定研究中的关键发现。表1-3概述了我们所讨论的研究、核心处理步骤和主要结果。

表1 基于特征的MRI影像组学在神经肿瘤学中的应用

*五折交叉验证;**留一法交叉验证;***十折交叉验证;

AUC:受试者操作特征曲线(ROC)下的面积;BM:脑转移瘤;CCC:一致性相关系数;DTI:弥散张量成像;DWI:弥散加权成像;FLAIR:液体衰减反转恢复序列;IDH:异柠檬酸脱氢酶;LASSO:最小绝对收缩和选择算法;MGMT:O6甲基鸟嘌呤DNA甲基转移酶;MRI:磁共振成像;mRMR:最小冗余最大相关算法;MRS:磁共振波谱;n.a.:不可用;PCA:主成分分析;PWI:灌注加权成像;RFE:递归特征消除;SAM:微阵列显著性分析;SVM:支持向量机;T1:T1加权成像;T1-CE:T1加权增强成像;T2:T2加权成像;TRC:治疗相关改变。

表2 基于特征的PET影像组学在神经肿瘤学中的应用

*十折交叉验证;**留一法交叉验证;AUC:受试者操作特征曲线(ROC)下的面积;BM:脑转移瘤;FDG:18F-氟代脱氧葡萄糖;FET:O-(2-18F-氟代乙基)-L-酪氨酸;IDH:异柠檬酸脱氢酶;LASSO:最小绝对收缩和选择算法;MGMT:O6甲基鸟嘌呤DNA甲基转移酶;MRI:磁共振成像;n.a.:不可用;PET:正电子发射断层扫描;RFE:递归特征消除;SVM:支持向量机;T1-CE:T1加权增强成像;TRC:治疗相关改变。

表3 基于深度学习的MRI影像组学在神经肿瘤学中的应用

+神经网络中输入变量的特征的相对重要性计算;*五折交叉验证;**十折交叉验证;

AUC:受试者操作特征曲线(ROC)下的面积;CNN:卷积神经网络;DTI:弥散张量成像;FLAIR:液体衰减反转恢复序列;IDH:异柠檬酸脱氢酶;MGMT:O6甲基鸟嘌呤DNA甲基转移酶;MRI:磁共振成像;n.a.:不可用;PCA:主成分分析;ResNet:残差网络;SVM:支持向量机;T1:T1加权成像;T1-CE:增强T1加权像;T2:T2加权成像;TRC:治疗相关改变。

3.1 新诊断的脑胶质瘤患者WHO分级的测定

尽管根据修订后的WHO级别划分,基因分型参数对脑肿瘤的分级越来越重要,但组织学方法对组织样本的初步评估仍然起着重要作用。因此,有几项研究对新诊断的胶质瘤患者进行了影像组学研究,以确定其WHO级别。

Cho及其同事的一项研究调查了基于特征的影像组学在胶质瘤分级中的作用。他们使用了来自BraTs的285个数据集,包括增强前后的T1加权像、T2加权像和液体衰减反转恢复序列(FLAIR),共提取了468个影像组学特征。特征筛选采用mRMR算法,然后用三种不同的分类器进行模型生成。选择5个特征,经过五折交叉验证后,随机森林分类器显示最高的ROC曲线下面积(AUC)为0.92,用于胶质瘤分级的评估。考虑到临床常规中使用的采集参数和扫描仪类型的差异,Hsieh及其同事使用灰度不变的MRI特征,即所谓的LBPs,在107名患者中区分WHO IV级胶质母细胞瘤与WHO II级和III级胶质母细胞瘤。使用来自美国国家癌症研究所(NCI)癌症成像档案馆(TCIA)的对比增强T1加权MRI扫描。计算成像特征并在用于肿瘤分级的逻辑回归分类器中组合,使用留一法交叉验证来测试模型的性能。LBP特征诊断准确率高达93%(灵敏度:97%,阴性预测值:99%,AUC:0.94),显著优于传统的纹理特征(准确率:84%,灵敏度:76%,阴性预测值:89%,AUC:0.89)。然而,这个模型在外部数据集上缺乏进一步的验证。

Tian及其同事使用常规MRI、DWI和ASL获得的灌注参数对153名患者的胶质瘤进行分级。使用支持向量机分类器进行模型生成,并通过ROC分析以确定模型准确率。使用来自所有MR对比剂的纹理信息的多参数模型在WHO III级、IV级以及 II级胶质瘤的分类中产生了最大的AUC,为0.97。Vamvakas及其同事也采用了多参数模型。使用PWI、DTI和MRS计算常规MRI和高级MRI的纹理特征和直方图特征,共获得了每个患者的581个特征。在应用支持向量机分类器进行特征筛选和分类后,基于21个特征使用留一交叉验证对分类器进行训练和测试,得到96%的准确率(灵敏度:96%,特异度:96%,AUC:0.96)。作者的结论是,在胶质瘤患者的治疗前分类方面,多参数MRI结合影像组学分析具有巨大的潜力。

Pyka及其同事证明了使用示踪剂O-(2-18F-氟代乙基)-L-酪氨酸(O-(2-[18F]fluoroethyl)-L-tyrosine,FET )区分WHO III级和IV级胶质瘤的氨基酸PET的影像组学可行性。从GLCM中计算出的纹理特征结合基于FET-PET的代谢性肿瘤体积得出了85%的诊断准确率。

Yang和他的同事调查了基于深度学习的影像组学使用CNN对113名基于对比增强T1加权像的患者进行胶质瘤分级的有效性,探讨了两种常用的CNN(AlexNet和GoogLeNet)。预先训练好的GoogLeNet在测试数据集中表现出最好的分类准确率,其AUC为0.94。这项研究表明,使用预先训练好的CNN进行迁移学习对于脑胶质瘤患者的临床决策是有效的,尤其是在可用数据集数量较少的情况下。

3.2 脑胶质瘤IDH基因和1p/19q联合缺失的预测

修订后的WHO中枢神经系统肿瘤分类强调了分子参数的重要性,如IDH基因或1p/19q染色体臂杂合性丢失对胶质瘤分类的影响。这导致了两组不同肿瘤的出现,它们的临床预后差异极大:IDH突变型胶质瘤,通常是星形细胞瘤(没有1p/19q联合缺失)或少突胶质细胞瘤(含有1p/19q联合缺失),通常比IDH野生型胶质瘤(如星形细胞瘤或胶质母细胞瘤)预后更好。然而,这些参数的确定需要组织样本。因此,几个团队研究了影像组学在非侵入性预测胶质瘤患者的这些重要分子标记中的作用。

Shofty及其同事在基于来自常规MRI的152个影像组学特征的袋装决策树分类器进行五折交叉验证以确定染色体1p/19q联合缺失后,得到了87%的准确率。同样,Han及其同事使用随机森林分类器,根据277例WHO II级和III级胶质瘤患者的常规MRI生成影像组学特征。最终的模型在训练数据集中获得了0.89的AUC,在测试数据集中AUC达到了0.76,并超过了仅基于临床参数的模型。有趣的是,使用影像组学和临床参数相结合的模型并没有改善对染色体1p/19q联合缺失的预测。Zhou及其同事使用了一项大规模多中心试验的常规MRI数据,其中包括500多名患者,用于预测IDH基因和1p/19q联合缺失状态。在特征提取后,使用随机森林分类器生成模型,并在TCIA的另一组MR图像上对最终的模型进行测试,训练和测试队列中的AUC为0.92。将IDH突变型胶质瘤患者的子集用于训练另一个模型来预测1p/19q联合缺失状态。该模型在训练中获得了0.67的中等AUC,在测试队列中达到了0.69。Lu及其同事使用了来自TCIA的214名恶性胶质瘤患者的常规MRI数据。测试数据集包含来自不同机构的70名患者的MRI数据。基于支持向量机分类器的多层机器学习模型可预测IDH基因和1p/19q状态,诊断准确率分别为90%和80%。

Lohmann及其同事对84名脑胶质瘤患者进行了FET-PET影像组学预测IDH基因的评估。在特征筛选之后,可以确定一个简单的双参数逻辑回归模型,经过十折交叉验证后,该模型的诊断准确率达到80%。一组患者在高分辨率的BrainPET扫描仪上进行了检查,由于其更高的空间分辨率和灵敏度,预计在影像组学分析中会产生更好的结果。事实上,对接受BrainPET检查的28名患者进行的亚组分析显示,经过十折交叉验证后,诊断准确率最高,为86%。分析结果必须在更广泛的数据集中得到证实。

Eichinger及其同事的一项研究采用了从T2WI和DTI中提取的LBP特征,这些特征被用于训练具有单隐藏层的CNN。在测试数据集中可以预测IDH基因,诊断准确率高达95%。Chang及其同事采用来自TCIA的259名胶质瘤患者的常规MRI数据对CNN进行训练,并通过PCA提取相关的影像特征。IDH基因和1p/19q联合缺失状态的诊断准确率分别为94%和92%。Li及其同事使用增强后的T1和FLAIR MRI对119例WHO II级胶质瘤患者的IDH基因进行了预测。使用CNN进行肿瘤分割,每个病例生成的特征超过16,000个。最后,在支持向量机分类器中使用494个特征的子集,得到0.96的AUC。有趣的是,作者将结果与基于特征的影像组学方法进行了比较,在该方法中,IDH基因型的预测AUC显著偏低,为0.86。

3.3 胶质母细胞瘤中MGMT启动子甲基化状态的检测

MGMT启动子的甲基化状态对于预测胶质母细胞瘤患者对烷化剂化疗的反应具有重要的临床价值。因此,一些研究将影像组学应用于MGMT启动子甲基化状态的非侵入性检测。

Li及其同事在计算了1700多个影像组学特征后,通过常规MRI预测了胶质母细胞瘤患者的MGMT启动子甲基化状态。最终的随机森林分类器使用了6个特征的子集,生成了0.88的AUC。在这里,影像组学特征与临床参数的结合并没有进一步提高模型准确性。同样,Xi及其同事从常规MRI中提取了1600多个影像组学特征,利用36个特征的子集,最终模型在验证数据集中达到了87%的诊断准确率,在测试数据集中达到了80%的诊断准确率。

Kong及其同事从107名原发性胶质瘤患者的2-[18F]-氟-2-脱氧-D-葡萄糖(FDG)PET扫描中提取了1500多个特征。在连续应用Wilcoxon秩和检验和Lasso正则化的逻辑回归进行特征筛选后,使用支持向量机分类器对5个特征进行建模。该模型在训练数据集上的AUC为0.94,在测试数据集上的AUC为0.86。

Chang及其同事使用CNN根据来自TCIA的259名胶质瘤患者的常规MRI预测了MGMT启动子甲基化状态,准确率为83%。在Korfiatis及其同事的一项研究中,比较了三种不同的残差网络(ResNet)结构,以预测MGMT启动子的甲基化状态。作者使用来自155名患者的常规MRI数据,发现ResNet50(即具有50层架构的ResNet)在测试数据集中展现出最好的性能,准确率接近95%。

3.4 人脑胶质瘤增殖活性的评价

Ki-67是肿瘤细胞增殖的标志,其在脑肿瘤组织标本中的表达水平通常是通过从组织标本中获得的免疫组织化学来评估的。用Ki-67评估胶质瘤的增殖活性可能对神经病理的鉴别诊断和治疗决策有价值。目前正在研究评估Ki-67表达水平的非侵入性方法。

Li及其同事使用了117名WHO II级和III级胶质瘤患者的T2加权磁共振成像来实现这一目的。使用Ki-67免疫组织化学作为参考,可以识别包含9个用于预测Ki-67表达水平的特征的影像组学特征,在验证数据集中产生约89%的诊断准确率。

Kong及其同事使用FDG-PET影像组学预测Ki-67的表达水平。从123例原发性胶质瘤患者的FDG-PET扫描中提取了1500多个影像组学特征。从中筛选了9个特征,最终的模型由支持向量机构建,在测试数据集中的准确率为73%。然而,作者得出结论,FDG-PET和MRI影像组学的结合可能会提高诊断的准确性。

3.5 恶性胶质瘤患者治疗相关改变与肿瘤进展的鉴别

在恶性胶质瘤患者中,肿瘤组织与治疗相关改变(如假性进展)的早期分化具有极大的临床相关性。假性进展的特征是MRI上出现渐进性强化的病变,通常在恶性胶质瘤患者放疗或放化疗的同时进行替莫唑胺化疗后12周内,在不改变任何治疗方法的情况下,MRI表现自发改善。虽然一些研究已经证明了氨基酸PET和PWI对假性进展的诊断价值,但影像组学可能会增加额外的信息来进一步提高诊断的准确性。

Kim及其同事使用了一个多参数模型,该模型融合了常规和高级MRI(DWI和PWI),在外部测试数据集中得出了0.85的AUC。与基于单一成像对比度的其他模型相比,多参数模型更优越。类似地,Hu及其同事将PWI和DWI与常规MRI相结合,在31名患者中区分假性进展和肿瘤进展。生成的支持向量机模型使用了8个特征,AUC为0.94(灵敏度:90%,特异性:94%)。这两项研究都强调了多参数成像在影像组学和神经肿瘤学的机器学习方法中的价值。

Lohmann及其同事使用了来自35名患者的FET-PET扫描结果。在使用两种不同的分割方法人为增加可用样本数量后,最终的逻辑回归模型使用了三个纹理特征,在训练数据集中的诊断准确率为92%,在测试数据集中的诊断准确率为86%。同样,该模型必须在更广泛的队列研究中证明其泛化性。

Jang及其同事开发了一种CNN,它结合了78名患者增强后的MRI的临床和影像特征。该网络在测试数据集中获得了0.83的AUC。有趣的是,作者还研究了仅基于临床或影像特征的CNN的表现,在两种情况下的表现都较差。最近,Li及其同事提出了一种基于深度卷积生成对抗网络(DCGAN)和名为DC-AL GAN的CNN(AlexNet)的特征学习方法。将DC-AL GAN从DTI中提取的鉴别特征集用于支持向量机分类器的分类任务,并在验证数据集中获得了92%的诊断准确率(AUC:0.95)。

3.6 脑转移瘤患者治疗相关改变与局部肿瘤复发的鉴别

在脑转移瘤患者中,除了脑胶质瘤,肿瘤复发与治疗相关改变的区别也非常重要,因为脑转移瘤患者经常接受立体定向放射治疗。因此,放射性损伤(尤其是放射性坏死)在放射外科手术后可能并不罕见,仅使用常规MRI通常无法将这些变化与局部脑转移瘤复发进行区分。

Zhang及其同事从经过伽玛刀放射外科治疗后的87名患者的常规MRI数据中计算出285个影像组学特征。由于后续的成像数据也是可用的,作者还可以研究特征的复现性,并确定具有复现价值的特征子集。此外,还评估了影像组学特征(Delta影像组学)的变化对肿瘤进展的诊断。最后,集成分类器建立的模型在验证数据集中得出了73%的诊断准确率。然而,没有可用的测试数据集。Peng及其同事从66名患者的常规MRI数据中提取了影像组学特征。该诊断模型是由执行特征筛选和分类的IsoSVM算法生成的,模型的AUC为0.81(灵敏度:87%,特异度:65%)。有趣的是,经验丰富的放射科医生也只能对73%的数据进行正确地分类(灵敏度:97%,特异性:19%)。

Lohmann及其同事对52名患者的多模态FET-PET/MRI数据进行了影像组学分析,以区分治疗相关改变与脑转移瘤复发。在使用Wilcoxon秩和检验进行特征筛选后,分别为FET-PET/MRI组合特征集以及每种模式生成逻辑回归模型。FET-PET/MRI模型的诊断准确率最高,留一法交叉验证后AUC为0.86。因此,使用多模态成像的影像组学似乎比单独使用任何一种模态都能获得更高的准确性。

4.结论

综上所述,基于特征和基于深度学习的影像组学在神经肿瘤学领域受到越来越多的评价。影像组学应该被认为是一种额外的诊断信息来源,特别是结合临床、组织病理学、分子以及常规影像参数,具有显著改善脑肿瘤患者的诊断和管理的巨大潜力。

尽管如此,大多数研究还缺乏在更广泛的、来自多机构的数据集中对生成的模型进行进一步验证,目前这种情况阻碍了这些机器学习技术的适用性和潜在的临床例行化。此外,需要对图像采集和影像组学分析工作流程进行标准化。尽管各种用于特征提取和数据评估的软件工具包和算法(如pyradiomics、MaZda和LifeX)正在逐渐投入使用,但大多数研究中使用的工作流程仍然很复杂,经常使用高度专业化和自校正的算法,使其他研究人员无法理解其中的细节,更不用说复现结果了。因此,在未来的研究中应更多地考虑不同的图像采集协议、图像重建或预处理参数对影像组学特征和计算模型的影响。

总而言之,基于特征和基于深度学习的影像组学都具有巨大的潜力,可以为脑肿瘤患者的许多高度相关的临床问题提供重要的诊断信息。

神经肿瘤组学基础知识、工作流程及应用相关推荐

  1. 学理发是先去学校还是去理发店学基础知识

    学理发是先去学校还是去理发店学基础知识 网友一,匿名认为: 学理发还是先去学校比较好,因为所有的事都是理论指导实践,这是一个颠扑不灭的真理.     有很多人学理发的时侯选择去店里学徒,从一无所知想成 ...

  2. SAP SD基础知识之流程概览

    SAP SD基础知识之流程概览 销售流程 销售流程从建立客户关系开始,至开出销售发票终止. 售前活动Pre-Sales Activities(客户询.报价)--> 销售订单处理sales ord ...

  3. 色彩学基础知识(转)

    源:色彩学基础知识 加法混色  采用红(Red).绿(Green).蓝(Blue)三种色光进行混色来显示其他颜色.色光越混合越亮,因此称为加法混色.电视.电脑的显示就采用加法混色原理. 红(R)绿(G ...

  4. 外汇入门必学基础知识——基本面分析

    外汇入门必学基础知识--基本面分析 基本面分析是指对影响一国经济以及货币汇率变化的核心要素进行研究,它旨在通过分析一系列经济指标.政府政策及事件,来预测某一经济周期中的汇率变化和市场趋势.基本面数据不 ...

  5. Python基础总结(一、二) 基础知识及流程控制

    目录 第一章  Python基础知识(简略) 一.良好的代码格式(可提升代码的可读性) (一)注释: (二)缩进: (三)输入输出: (四)标识符和关键字: 二.变量和数据类型: (一)变量: (二) ...

  6. python语言流程控制语句的格式_慢步学python,编程基础知识,流程控制语句if

    慢步业余学python编程,今天休息继续分享python编程知识. 面向过程编程,重要的是程序的流程,今天说说流程控制语句if. 在我们高中数学中就有流程图的学习,只是没有真正应用起来而已,办公软件也 ...

  7. 网站搭建基础知识、流程概括

    最近突发奇想想自己搞个网站玩玩,我是什么都不懂得纯菜鸟,就把最基本的东西写下来,如果有不对的烦请大牛们指点一下,希望对一些人都用. 一.做网站的流程: 购买域名.购买空间.解析和绑定.上传建站程序.完 ...

  8. JAVA基础知识----三大流程控制结构

    1.流程控制语句 Ø在一个程序执行的过程中,各条语句的执行顺序对程序的结果是有直接影响的.也就是说程序的流程对运行结果有直接的影响.所以,我们必须清楚每条语句的执行流程.而且,很多时候我们要通过控制语 ...

  9. 关于wordpress的一些基础知识+安装流程+使用说明(还没整理完)

    Wordrepss不是常规的web框架,而是独立成为一种框架 LNAP={L=LinuxN=NginxA=MysqlP=PHPLNAP=\left\{ \begin{aligned} L & ...

最新文章

  1. 游戏中的AI及实用算法逻辑
  2. F. Strange Array(Codeforces Round #727 (Div. 2))(主席树)
  3. Android官方开发文档Training系列课程中文版:多样屏幕之支持不同的屏幕密度
  4. MySql 优化的 30 条建议
  5. (57)Verilog HDL选择运算符:?
  6. 瑞幸:现在卖24元一杯已经很便宜了 以后还要降价
  7. 4选1选择器(第一天)
  8. STM32高速脉冲发波方案
  9. 自定义形状的ImageView制作
  10. 数据安全法整理学习笔记
  11. 微信企业付款至银行卡 详细Demo 独立封装
  12. cad打开卡死_CAD启动时闪退怎么办?打开CAD就死机怎么办?
  13. ubuntu18.04中文输入法(by搜狗)
  14. Lora、zigbee比较
  15. Unity编码解析以及常用转换
  16. 使用pymysql将excel表格的数据导入mysql数据库(CRUD)(附代码)
  17. 未来5年做好随时失业的准备
  18. 熊掌号必备SEO知识4:已开通熊掌号,站点换域名了怎么办?
  19. Eclipse运行jsp文件(基于tomcat),界面404或者显示无法访问
  20. 初游青云山——温泉之旅

热门文章

  1. 安装httpd并修改apache服务器的首页,虚拟主机,配置不同端口号的虚拟主机访问Apache服务器
  2. java static void_今天终于搞懂了:为什么 Java 的 main 方法必须是 public static void?...
  3. Elasticsearch——基础(笔记)
  4. 1 C++ 11 新特性
  5. zdog+anime跳舞的小星星动画js特效
  6. python自动垃圾分类_现在垃圾都得分类,如何利用Python快速实现一个垃圾分类APP?...
  7. 在外部凋用Class中的private函数
  8. SR技术概述与基本概念(SR-BESR-TE)
  9. arcgis使用arcpy计算土地利用LUCC变化转移矩阵、马尔科夫模型变化表,最好用的方法TabulateArea实现两期数据变化统计
  10. ASCII字符代码表,python 生成字母a到z字母,生产倒序列表