Radiogenomic analysis of vascular endothelial growth factor in patients with diffuse gliomas

  • 相关概念
  • Abstract
  • Introduction
  • Materials and methods
    • Patients
    • Clinical characteristics
    • Data acquisition and region of interest segmentation
    • Feature extraction
    • Immunohistochemistry (免疫组织化学)
    • Feature selection and classification
    • Statistical analysis
  • Results
    • Feature selection and classification
    • Correlations between selected features
  • Discussion
  • Conclusion
  • Supplementary information

弥漫性胶质瘤患者血管内皮生长因子的放射基因组学分析

相关概念

  • 分子亚型:
    随着人类基因组计划的完成及分子生物学技术的应用, 以肿瘤形态学结合基因表达特征的分子分型概念已被医学界认同。 而以基因表达谱和基因芯片为基础提出的癌症基因分型,能更精确的反应肿瘤的生物学行为。主要意义就是有利于选择和研究更具针对性的个性化治疗方法。根据每一位患者的分子分型及其他相关因素,制定个体化、系统性的治疗方案。
  • 异质性:
    在遗传学中,基因型决定表型。但表型相同的个体,可能具有不同的基因型,即一种性状可以由多个不同的基因控制。这种现象称为遗传异质性(gentic heterogeneity)。
  • 基因型与表型:
    ① 基因型:是指某一生物个体全部基因组合的总称。它反映生物体的遗传构成,即从双亲获得的全部基因的总和。
    ② 表型:有机体可被观察到的结构和功能方面的特性,如形态和行为方面的特征。
  • 胶质母细胞瘤(glioblastomas, GBM)
    胶质母细胞瘤;恶性胶质瘤;成胶质细胞瘤

Abstract

Objective:
  应用放射组学分析预测弥漫性胶质瘤患者血管内皮生长因子(VEGF)的表达。
Materials and methods:
  回顾性分析239例弥漫性胶质瘤 (World Health Organization grades II–IV)患者的术前磁共振图像。这些患者被随机分配到训练组(n=160)或验证组(n=79),比例为2:1。对于每个患者,共提取431个放射组学特征。特征选择采用最小冗余最大相关性(minimum redundancy maximum relevance, mRMR)算法。然后,使用所选择的特征和支持向量机(support vector machine, SVM)分类器,开发了用于预测VEGF状态的机器学习模型。使用接收者操作特征曲线(receiver operating characteristic curve, ROC curve)分析评估模型在两组中的预测性能,并评估所选特征之间的相关性。
Results:
  基于mRMR算法,选择9个放射组学特征来生成与VEGF相关的弥漫性胶质瘤放射组特征。该放射学特征由2个一阶统计量或相关小波特征(熵和最小值)和7个纹理特征或相关小波特征(包括聚类趋势和长期低灰度重点)组成。
  以曲线下面积(area under curve, AUC)衡量的预测效率,训练组为74.1%,验证组为70.2%。两组的9个放射学特征之间的总体相关性都很低。  
Conclusions:
  放射组学分析有助于有效预测弥漫性胶质瘤中VEGF的状态,这表明利用肿瘤衍生的放射组学特征预测基因组学信息是可行的。
Keywords: Vascular endothelial growth factor, Diffuse gliomas, Radiomic analysis, Machine learning

Introduction

——
  根据世界卫生组织(WHO)的标准,弥漫性胶质瘤的分级从II级到IV级,是最常见的脑部原发性恶性肿瘤。手术切除联合放疗、化疗是主要治疗方法。随着精准医疗的发展,胶质瘤的分子分型对于患者的治疗和预后越来越重要。2016年,世卫组织将分子表型引入中枢神经系统肿瘤分类标准。因此,现在重要的是在治疗前确定胶质瘤的分子亚型。
  血管生成受血管内皮生长因子(VEGF)调控,是肿瘤细胞恶性程度的标志。 VEGF高表达的肿瘤细胞往往预后差,生存期短。此外,VEGF是一种在肿瘤发生发展过程中具有重要意义的生物标志物,在胶质瘤尤其是复发性胶质母细胞瘤(GBM)的治疗中也是一个很有前途的靶点。尽管贝伐单抗等抗血管生成疗法已被证实能提高复发GBM患者的无进展生存率,但它对未选择的患者可能没有好处。 因此,VEGF表达的评估在GBM的治疗中具有很大的应用前景。
  磁共振成像(MRI)在临床上得到了广泛的应用,尤其是对肿瘤的非侵入性成像,已成为中枢神经系统肿瘤诊断中最常用的方法之一。然而,值得注意的是,目前的MRI应用只能定性地分析肿瘤的物理化学特征。这忽略了图像中的大量数字信息。放射组学是一种从放射图像中提取纹理信息用于分析和计算的非侵入性方法。 一些研究已经将放射组学技术应用于肿瘤分析,并证明该方法是可行的。
研究现状:
  ① 一些研究人员使用CNN来确定异柠檬酸脱氢酶(IDH)突变状态、1p/19q共缺失和O6甲基鸟嘌呤DNA甲基转移酶(MGMT)启动子甲基化状态。
  ②一些研究人员发现表皮生长因子受体(EGFR)胞外区错义突变与临床影像和治疗反应的关系,并建立了EGFRvIII的影像特征。
  这些放射组学方法已成功地用于预测胶质瘤IDH突变基因型、EGFR和Ki67的表达,为无创性检测VEGF的表达状态奠定了基础。
  在本研究中,我们从已知VEGF表达水平的胶质瘤患者术前MRI扫描中提取了大量的放射组学特征。 我们假设放射特征可以通过机器学习算法预测胶质瘤中VEGF的表达水平。

Materials and methods

Patients

本研究共纳入239例胶质瘤患者。所有患者均于2010.06~2012.09在北京天坛医院胶质瘤治疗中心接受治疗,均符合以下标准:
  ① 经组织病理证实的原发性胶质瘤,WHO II-IV级;
  ② 术前T2w MRI可用;
  ③ 已知VEGF表达状态;
  ④ 已知的特定临床特征(Additional file 1: Figure S1)。
  描述排除和纳入患者的流程图显示在Additional file 1: Figure S1(下图)。

  患者被随机分配到训练组(n=160)或验证组(n=79),而不考虑VEGF的表达水平。使用从R软件产生的随机数执行随机过程。训练组用于建立机器学习模型,以通过放射组学特征预测VEGF表达水平,验证组用于评估模型的预测精度。

Clinical characteristics

——
  训练组和验证组患者的中位年龄分别为43.0岁和42.5岁。总共有157名男性和82名女性,通过随机分配,104名男性和56名女性被分配到训练组,53名男性和26名女性被分配到验证组。训练组低表达患者为63例,高表达患者为97例,验证组分别为为27例和52例。用学生t检验和卡方检验比较两组特征的分布情况。两组间在年龄(p=0.736)、性别(p=0.749)、肿瘤分级(p=0.725)、血管内皮生长因子表达水平(p=0.435)、肿瘤部位(p=0.860)等方面均无显著性差异。有关患者临床特征的详细信息见表1。

Data acquisition and region of interest segmentation

——
  MRI扫描使用3.0-T扫描仪(179例患者:TRIO,3.0-T,西门子;60例患者:Sigma,3.0-T,GE)。肿瘤ROI仅在T2w图像上分割,因为本研究包括II-IV级胶质瘤(低级别胶质瘤的肿瘤边界很难在T1w和对比增强序列上识别)。T2w图像采集参数为repetition time 4500-6000 ms, echo time 84-122.5 ms, section thickness 3-5 mm, field of view of (180-240) mm × (219-256)mm, and matrix size (160-512) × (208-512)pixels。由两位神经放射科医生(分别在神经放射学领域有8年和10年工作经验)使用MRIcron软件在T2图像上手动描绘ROI。根据以前的文献,T2图像上的感兴趣区被定义为水肿区。第三位有10年工作经验的资深神经放射科医生随后重新评估了ROI,并在缺乏共识的情况下做出了最终决定。

Feature extraction

——
  为了减少由于数据不均匀性造成的偏差,将每幅图像中的体素强度归一化为z分布。特征提取前将MRI层厚重采样至1 mm。431个定量放射组学特征的提取如前所述进行,并且与每个特征有关的详细公式在该前一报告中作为附加文件3给出。特征提取是在3D模式下进行的,并且是向前传递。我们仅从术前T2序列中提取放射组学特征,共获得431个放射组特征。特征集包括14个一阶统计量(与图像的信号强度分布有关),8个基于形状和大小的特征(量化肿瘤的形状和大小),33个纹理特征(与肿瘤内部的异质性有关),376个由第1组和第3组特征经小波分解得到的小波特征(采用定向低通和高通滤波,将原始特征分解为8个成分)。所有特征提取过程都是使用内部开发并在MATLAB(2014a)中实现的软件进行的。放射学组特征的详细功能列在附加文件3中,并且所提取的特征符合图像生物标记标准化倡议。

Immunohistochemistry (免疫组织化学)

——
  VEGF的表达水平是由一位有八年工作经验的病理学家使用从患者身上收集的典型肿瘤样本进行评估的。根据制造商的说明,使用1:100稀释度的抗VEGF抗体进行免疫染色。简而言之,将福尔马林固定的石蜡包埋组织切片切成5-μm切片,然后干燥,在二甲苯中脱蜡,在分级乙醇中漂洗,在双蒸水中再水化。两位对临床数据视而不见的病理学家对染色程度进行了评分。
  根据临床实际对血管内皮生长因子表达水平进行评分:(−)代表无表达或罕见表达(<5%阳性细胞);(+)代表轻度表达(6%-25%阳性细胞);(++)代表中度表达(26%-50%阳性细胞);(+++)代表强表达(>50%阳性细胞)。
  低VEGF表达定义为(−和+),高VEGF表达定义为(++和+++)。

Feature selection and classification

——
  为了建立放射组学模型,应用最小冗余最大相关(mRMR)算法进行特征选取,从提取的431个放射组学特征中选择特征子集。mRMR算法是一种有效的数据筛选工具,在以往的许多研究中得到了广泛的应用。此外,我们利用支持向量机(SVM)分类器建立了用于VEGF预测的机器学习模型。支持向量机分类器是一种广泛使用的模式识别工具。在10次交叉验证的基础上,采用网格搜索法(grid-search)确定SVM分类器的参数:
  kernel=radialkernel = radialkernel=radial;
  gamma={10−4,10−3,10−2,10−1,1,10,102,103,104}gamma=\{10^{−4},10^{−3},10^{−2},10^{−1},1,10,10^2,10^3,10^4\}gamma={10−4,10−3,10−2,10−1,1,10,102,103,104};
  cost={10−4,10−3,10−2,10−1,1,10,102,103,104}cost=\{10^{−4},10^{−3},10^{−2},10^{−1},1,10,10^2,10^3,10^4\}cost={10−4,10−3,10−2,10−1,1,10,102,103,104}。
  通过这些方法,我们利用训练组的数据建立了基于放射组学的预测模型,并在验证组进行了验证。放射组学分析方案如图1所示。

图1 放射组学分析方案。获取MRI后,利用图像数据进行肿瘤分割。然后从分割的肿瘤中提取高通量放射组学特征,并使用这些提取的特征进行进一步的放射组学分析。

Statistical analysis

——
  统计分析和图形生成主要使用R软件进行。mRMR和SVM算法分别使用“mRMRe”和“e1071”软件包进行。接受者工作特征(ROC)曲线和相关热图分别用“proc”和“corrlot”软件包描绘。临床特征之间的差异采用卡方检验或学生t检验进行评估。

Results

Feature selection and classification

——
  在本研究中,使用了一种称为mRMR算法的有效特征选择工具,并从总共431个放射组学特征中筛选出包含9个特征的子集。表2显示了这9个选定功能的名称和描述。

  根据交叉验证过程,当参数Gamma=10−3Gamma=10^{−3}Gamma=10−3和Cost=10−3Cost=10^{−3}Cost=10−3时,SVM分类器性能最好。基于选定的放射学特征和SVM分类器,使用来自训练组的数据建立了预测VEGF表达状态的机器学习模型。曲线下面积(AUC)在训练组(图2a)为0.741,在验证组(图2b)为0.702。在ROC曲线分析中,训练组最佳截断点为−0.356,其敏感度、特异度和准确度分别为83.5、58.7和71.3%;而验证组的最佳截断点为−0.570,其敏感度、特异度和准确度分别为67.9、70.6和72.3%。因此,所选择的9个放射组学特征可以作为VEGF相关的特征,在训练组中通过mRMR和SVM算法建立的模型在验证组中表现出有效的性能。
图2 训练组和验证组中用于VEGF状态预测的ROC曲线分析,a为训练组,b为验证组。训练自在最佳分界值(−0.356)下,其敏感度、特异度和准确度分别为83.5%、58.7%和71.3%(红点)。验证组在最佳分界值(−0.570)下的敏感度、特异度和准确度分别为67.9%、70.6%和72.3%(红点)。

Correlations between selected features

——
  训练组和验证组的VEGF相关特征之间的相关性如图3所示。虽然9个特征中的部分特征之间表现出较高的正相关或负相关,但总体的相关性较低(训练组均值±标准差=0.112±0.029,验证组为0.174±0.052),表明这些特征是相互独立的。
图3 在训练组和验证组中,构成VEGF相关放射组学特征集的9个放射组学特征之间的相关性。黄点表示正相关,蓝点表示负相关。不同大小和颜色深度的点表示不同的相关系数。用叉号覆盖的圆点表示相关性不显著(p>0.05)。

Discussion

——
  在目前的研究中,通过从确诊的胶质瘤患者的T2加权图像中提取特征数据来分析VEGF相关的放射学特征。从每个序列中提取图像特征,并利用mRMR算法和支持向量机分类器建立基于放射组学的模型来预测VEGF的表达水平。该模型在训练组和验证组的AUC分别为74.1%和70.2%。总体而言,结果表明,VEGF的表达可以用非侵入性的放射学数据来预测,并且集成多变量特征的机器学习方法比使用单个特征更有效。
  已有报道血管内皮生长因子状态与某些影像学特征有关。先前的一项研究报告,不同VEGF状态的胶质瘤往往位于不同的位置。他们发现VEGF高表达的胶质母细胞瘤更可能位于左侧额叶和右侧尾状核,而VEGF低表达的胶质母细胞瘤更常位于右侧脑室的后部。我们在我们的研究队列中对59名患者验证了他们的发现,因为只有59名患者被诊断为胶质母细胞瘤。如Additional file 2: Figure S2所示,预测准确率为60%。值得注意的是,有11名患者的肿瘤没有累及左额叶、右尾状核或右侧脑室后部,无法分类。这种情况会限制该方法的应用。

  此外,Awpari R等人发现相对脑血容量和相对脑血流量与VEGF表达水平显著相关;Li K等报道结合放射学特征和VEGF表达水平可以预测盆腔淋巴结转移;Yin Q等人揭示了肿瘤血管生成与PET/MRI放射成像特征之间的关系;Begg N等人分析了低氧途径的放射组学特征,并预测了GBM的总存活率。这些研究表明,有一些放射学特征与VEGF的表达状况显著相关,但他们没有使用独立的验证数据集来评估他们的发现,而且他们的预测能力有限。近年来,放射组学分析与算法相结合在放射学研究中得到了广泛的应用,成为研究图像与肿瘤关系的有效工具。许多研究人员已经证明,放射组学模型可以有效地预测分子表达状态。放射组学也用于预测抗血管生成治疗反应。我们认为放射学特征和VEGF表达状态之间存在临床有用的关系。
  本研究建立的模型在训练组和验证组均有效,证实了放射组学可以预测肿瘤组织中VEGF表达水平的假设。以前的研究表明,熵可以作为肿瘤内异质性和肿瘤恶性程度的指标,这可以作为解释放射学特征与VEGF表达之间关系的一个例子。此外,先前的研究表明,VEGF高表达的胶质瘤患者更容易出现组织水肿。T2序列能更准确地反映肿瘤和组织水肿情况。这可能是基于T2序列选择的特征能够有效地建立VEGF预测模型的原因。
  为了建立放射组学模型,应用mRMR算法从提取的431个放射组学特征中选择9个特征的子集。mRMR算法是一种有效的数据降维算法,用于寻找一组相关和独立的特征,在生物信息分析中得到了广泛的应用。维数灾难可以用mRMR算法求解。支持向量机分类器是一种有效的工具,在模式识别方面表现出比其他算法更好的性能。本研究将mRMR算法与支持向量机分类器相结合,开发了一种能够有效预测胶质母细胞瘤患者VEGF表达状态的方法。
  目前的研究有一些局限性。所有图像都是在单个中心生成的,因此需要在未来进行多中心研究,以考察该模型的普适性。此外,所报道的放射组学特征与VEGF表达的相关性还需要通过与组织活检结果的比较来进一步研究。这也是一项回顾性研究,因此需要进行前瞻性研究来验证预测模型的准确性。案例是手动注释的。在我们目前的工作中,我们正在尝试使用一种自动分割的方法来提高放射组学分析流程速度。下一步,我们将收集更多的MRI协议,如T1W和FLAIR(另外还有MRS、DTI),以便进一步构建高级模型。最后,MRI扫描没有经过标准图谱的后处理,这可能会使结果的重现性变得困难。

Conclusion

——
  综上所述,在本研究中,VEGF的表达水平与胶质瘤的放射学特征有显著的相关性。利用mRMR算法和支持向量机分类器,建立了VEGF表达水平放射组学特征,并对训练组和验证组的VEGF表达水平进行了有效的预测。放射基因组学分析表明,从放射图像中提取的放射组学特征也可以反映VEGF的表达水平,提示放射组学方法有可能成为基因表达水平的无创性替代指标,进一步辅助患者的个体化治疗。

Supplementary information

文献阅读_Radiogenomic analysis of vascular endothelial growth factor in patients with diffuse gliomas相关推荐

  1. 文献阅读-Pan-Cancer Analysis of lncRNA Regulation Supports Their Targeting of Cancer Genes in Each Tumor

    Pan-Cancer Analysis of lncRNA Regulation Supports Their Targeting of Cancer Genes in Each Tumor Cont ...

  2. 细胞亚器文献阅读之酵母液泡与线粒体的动态互作A Dynamic Interface between Vacuoles and Mitochondria in Yeast

    细胞亚器文献阅读之酵母液泡与线粒体的动态互作A Dynamic Interface between Vacuoles and Mitochondria in Yeast 本文和前一篇阅读的文献之间的关 ...

  3. 细胞亚器文献阅读二~An ER-Mitochondria Tethering Complex Revealed by a Synthetic Biology Screen

    细胞亚器文献阅读二~An ER-Mitochondria Tethering Complex Revealed by a Synthetic Biology Screen 通过合成生物学筛选ER和Mi ...

  4. 条件随机场(Conditional random fields,CRFs)文献阅读指南

    与最大熵模型相似,条件随机场(Conditional random fields,CRFs)是一种机器学习模型,在自然语言处理的许多领域(如词性标注.中文分词.命名实体识别等)都有比较好的应用效果.条 ...

  5. 文献阅读疑问(202010)

    学习笔记,仅供参考 文章目录 文献阅读疑问 Unsupervised Deep Embedding for Clustering Analysis 文献阅读疑问 Unsupervised Deep E ...

  6. 文献阅读总结:网络表示学习/图学习

    本文是对网络表示学习/图学习(Network Representation Learning / Graph Learning)领域已读文献的归纳总结,长期更新. 朋友们,我们在github创建了一个 ...

  7. 【转载】关于文献阅读和科研选题

    本文转载自程明明老师博客:https://mmcheng.net/paperreading/ ‎ 对于论文的阅读和研究脉络的梳理很清晰,特别是在于找研究方向的建议上:从开山文献开始,会到当事人的角度去 ...

  8. 【文献复现】-氧还原反应塔菲尔斜率绘制(文献阅读)

    氧还原反应塔菲尔斜率绘制 氧还原反应模型 模型复现 本文主要是记录文献阅读与文献复现的内容,所阅读的文献为:Shinagawa_2015_Nature_Insight on Tafel slopes ...

  9. 文献阅读-Clinical and Biological subtypes of B-cell lymphoma revealed by microenvironment signature

    文献阅读 Clinical and Biological subtypes of B-cell lymphoma revealed by microenvironmental signature Ab ...

  10. 文献阅读笔记-CSC-数据集-A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check

    A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check 文献阅读笔记 论文相关信息: EMNLP-201 ...

最新文章

  1. springboot 定时器_基于SpringCloud?+?SpringBoot的 SaaS型微服务脚手架源码分享
  2. PyCharm去掉满屏的波浪线
  3. c语言编程游戏开代码错误,[蓝桥杯][历届试题]数字游戏 (C语言代码)(兄弟们帮我看一下为什么运行错误86%)...
  4. java 图片的路径_【JAVA技术】如何展现绝对路径下的图片
  5. DriverMessageBean配置详解
  6. Android系统信息获取 之四:系统语言信息获取
  7. iOS开发学习之NSFetchedResultsController
  8. 海底捞张勇:谈钱,才是对员工最好的尊重
  9. 自己整理的90分以上最新物联网技术导论期末选择填空大题总考点
  10. 计算机工程与应用论文模板,计算机工程与应用论文模板
  11. 真是其了怪的jwplayer
  12. python正则表达式提取网页的图片链接
  13. C++利用Zip库解压缩文件
  14. 美金融犯罪执法局文件遭泄露:汇丰、摩根大通、渣打等国际大行涉嫌非法转移资金...
  15. 计算机无法读光盘,win7系统无法读取光盘数据怎么办 电脑光驱读不出光盘数据解决方法...
  16. JSCRIPT如何调试
  17. minecraft图标文件_如何在任何操作系统上查找Minecraft保存的游戏文件夹
  18. 【Java并发基础】Java内存模型解决有序性和可见性
  19. 为什么手机移动4G信号满格,网速却非常慢?这些原因你知道吗
  20. 弘玑Cyclone代表中国RPA进入Gartner魔力象限:迄今国内厂商最佳排名,迈入全球一线阵营

热门文章

  1. 即时通讯im源码软件uniapp(基于开源在线交友聊天系统源码框架)
  2. 5分钟使用Unity制作AR应用,结合EasyAR制作AR
  3. python语料库_NLPPython笔记——语料库
  4. windows操作系统---1
  5. Windows Azure 虚机密码忘记处理
  6. 分门别类刷leetcode——动态规划(C++实现)
  7. 人事档案信息管理系统的面向对象的分析、设计和实现
  8. CF755F PolandBall and Gifts
  9. 百度开发者搜索及个人搜索方式总结
  10. 关于openpyxl读取excel中图片(shape)的注意点