来源:放射学实践

作者:史张、刘崎

影像组学概念

从影像图像中提取的全部特征就是“影像组学”,而通过特征选择后所挑选出那些具有预测价值特征集合通常被称为“影像组学标签(radiomic signature)”。

影像组学源于计算机辅助检测或诊断(computer-aided detection or diagnosis,CAD),是将影像定量分析与机器学习方法结合起来。目前,影像组学的基本作用是通过大量的影像组学特征对肿瘤感兴趣区进行定量分析,从而可以提供有价值的诊断、预后或预测信息。影像组学的目的是探索和利用这些信息资源来开发诊断、预测或预后的影像组学模型,以支持个性化的临床决策和改善个体化的治疗选择。

影像组学的工作流程

1.图像采集

目前,主要通过CT、MRI和PET-CT等影像扫描方式来进行图像的采集。CT是影像组学研究中使用最广泛的成像模式,其具有空间分辨率高的影像特点,可评估肿瘤和淋巴结的组织密度、形状、质地及纹理特征。PET-CT可同时获得组织的密度及代谢信息,常用于肿瘤的检测和分期,是影像组学将功能成像与潜在肿瘤生物学行为直接进行关联的一种研究手段。MRI在软组织成像中表现突出,可提供高对比度的结构信息和功能信息,其中弥散加权成像(DWI)和动态对比增强磁共振成像(DCE-MRI)可以反应组织细胞结构及微血管生成情况,通过对这些图像的采集,可提取更有效的影像组学特征。

2.图像分割

图像分割是指对感兴趣区部位的分割,也就是在影像图像上勾画出感兴趣区域,从而针对这一特定区域计算出影像组学特征。目前,图像分割的方法有3种,即人工分割法、半自动分割法及自动分割法。

手动分割法被应用于大多数影像学研究中,其优势在于准确度高并且对不规则的肿瘤边界勾画精细,但其受主观因素影响较大,可重复性低,且耗时久、效率低。

相反,自动或半自动分割法则表现出较高的可重复性和时效性,其中半自动分割法为目前影像组学图像分割的主要方法。例如,MattonenSA等对肺癌的研究中指出先由研究者根据实体肿瘤反应评估标准(the ResponseEvaluation Criteria in Solid Tumors,RECIST 1.1)测量肿瘤最长轴径,然后再用自动算法去勾勒出实体肿瘤的区域,从而完成图像分割。

与半自动分割法相比,自动分割法可以实现排除人为因素,更好地达到自动化、可重复且效率高的效果。目前,应用于影像组学的完全自动分割法还没有统一的方案及标准,但是自动分割技术已经初有成效,其中,CAD自动分割乳腺肿瘤已应用十余年,其分割结果的准确性跟人工手动分割相比无几差别。这些都表明实现感兴趣区的自动分割法将是未来影像组学图像分割的一个重要研究方向。

3.图像特征提取和量化

影像组学特征可以分为:形状特征,一阶直方图特征,二阶直方图或纹理特征。还有一些获取于特定图像的影像组学特征(如PET中的SUV度量),以及仅适用于多模式数据集的分形和融合特征。

(1)形状特征:包括描述ROI大小的特征,例如体积、表面积、二维和三维的最大直径以及有效直径(与ROI具有相同体积的球体直径),以及描述ROI与球体的相似程度的特征,如表面体积比、致密度、偏心度、球形度等。

(2)一阶直方图特征:描述与ROI内的体素强度分布有关的特征,不包含它们之间相互的空间作用,可通过直方图分析计算得到,包括均数、中位数、最小值、最大值、标准差、偏度和峰度。这些特征可反应所测体素的对称性、均匀性以及局部强度分布变化。

(3)二阶直方图或纹理特征:是描述体素空间分布强度等级的特征。图像纹理是指在强度水平可感知或可测量的空间变化,它被视为一个灰度级,是一种视觉感知的图像局部特征的综合[9]。二阶特征包括:灰度共生矩阵(gray level co-occurrence matrix,GLCM)、灰度级长矩阵(gray level run-length matrix,GLRLM)、灰度级带矩阵(gray level size zone matrix,GLSZM)和邻域灰度差分矩阵(neighborhood gray-tone differencematrix,NGTDM)。

a)GLCM是一个其行列数表示灰度值、单元格包含灰度值处于一定关系(角度、距离)次数的矩阵,也称为二阶直方图。在GLCM上计算的特征包括熵(二阶熵,与异质性有关)、能量(也被定义为角二次矩,再次描述图像的均匀性)、对比度(其测量局部变化)、同质性(图像局部灰度均衡性的度量)、不相似性和相关性。

b)GLRLM是二维矩阵,其中每个元素(i,j)描述了ja灰度级i在指定的方向上连续出现的次数[10],灰度运行是在图像中预设方向上具有相同强度的连续体素的长度。

c)GLSZM是在行和列处的元素存储具有灰度级和大小的区域(具有相同灰度级的连接体素)数量的矩阵。GLSZM包括描述小/大区和低/高灰度区分布的特征。

d)NGTDM,其第i项是所有具有灰色调i的像素与其周围邻域像素平均值之差的总和。NGTDM的影像组学特征包括粗糙度、对比度、冗繁度、复杂度、纹理强度等。

(4)融合和分形特征:融合特征与多模态图像数据集相关,其可通过配准技术与几何图像对齐。分形特征是分析评估不同层面表面的自相似性和粗糙度,这些区域的复杂性由Hausdorff的分形维(fractal dimension,FD)量化呈现,该分形维是一个模式的自我重复纹理,并具有放大特征。

4.特征选择

最简单的特征选择方法是根据变量的稳定程度或相关性制定一个评分标准,以此标准对变量进行筛选。另外,在消除相关特征时,使用相关矩阵消除高度相关的特征,通过消除那些高度相关的特性,剩下“非冗余”的特征集,其中常用的方法有LASSO(least absolute shrinkage and selection operator)Cox回归模型、最大相关最小冗余(maximum relevance and minimum redundancy,mRMR)、RELIEF (RELevance In EstimatingFeatures)、主成分分析法(principal component analysis,PCA)等。

(1)LASSOCox回归模型,是最常用的特性选择方法之一,它是一种收缩和变量选择方法的回归模型,它使罚对数似然函数最大化,并适用于高维数据的回归。

(2)mRMR通过计算一组特性和结果变量之间的相互信息(mutual information,MI),对输入的特征进行排名,最大化MI、最小化更高排名的MI平均值,从而达到降维的效果。

(3)RELIEF是最近比较热门的特征选择方法之一,其方法是根据属性之间的区分进行排名。与其他方法相比,RELIEF可以有效地评估强相互依赖的特征,并显示出更高的预测准确性。RELIEF算法能够检测特征之间的上下关联信息,从而更准确地处理存在依赖关系的情况。

(4)PCA是将多个变量通过线性变换以选择出少量重要变量的一种多元统计分析方法,即能将相关性强的影像组学特征合并为主成分,各主成分间相互独立从而实现将高维空间简化为二维或三维空间。

5.建立模型

目前,有许多机器学习的方法可被用于建立基于影像组学特征的预测和分类模型,其中很多都是之前服务于CAD的。在影像组学建模中,logistic回归模型因其简单易行,成为最受欢迎且常用的监督分类器;另外,常用的机器学习模型还有随机森林(random forest)、支持向量机(SVM)、人工神经网络(Artificial neural networks,ANNs)、聚类分析(clustering analysis)、“leave-one out”交叉验证(LOOCV)、自举法(bootstrapping)。

(1)随机森林:是基于机器学习中一个较普遍的决策树概念,将假设表示为连续的“如果-然后”,这一点很类似于人类推理。在该方法中,训练一组决策树,并且该算法引入两个级别的随机化。所有的决策树被训练后,对所有单株树进行预测,并将选出最高频的一类作为最终结果。

(2)SVM:是一种先前用于CAD的有辨识监督机器学习的技术,它利用边界将数据点分为两类(如反应者或无反应者),该方法在CAD微钙化检测中有较高的判别力,并经常用于影像组学。

(3)ANNs:是经典的机器学习方法之一,也被用于基于超分类的基因组学研究。卷积神经网络(Convolutional Neural Network,CNN)是一种特殊的前馈神经网络,用于学习直接对原始图像进行操作的图像数据的分层表现,通过尝试自动提取高度表现的成像特征,CNN消除了对图像预处理和特征选择的依赖性。该方法在MRI对三阴乳腺癌的判别中要优于其他预测模型。

(4)聚类分析:属于无监督分类(unsupervised classifiers),其可将抽象对象集合分组,在分组的过程中对类似的对象组成的多个类进行分析,目标是在相似的基础上收集数据来进行分类。共识聚类(consensusclusterin)是常用于降维的聚类分析。有报道称共识聚类可以在440个特征的集合空间中识别出13个非冗余特征聚类。

(5)LOOCV:是用于内部验证的最常用的技术,也称为“jackknife”。该算法除了一个数据点被用于测试外其余所有数据均用于训练或拟合,这个过程在每次LOOCV迭代中重复,使得每个数据点只剩下一次。

(6)自举法(bootstrapping):由原始数据生成大量自举样本,引导数据集是一系列数据(特征,结果),每个数据来自患者队列中随机选择的患者,每个自举样本重复建模。该方法提供了模型参数和模型评估指数AUC或CI值的分布,从而可以评估特征的不确定性。

影像组学的质量评估

2017年10月,在Nature Reviews Clinical Oncology中提到影像组学质量评分(radiomics quality score,RQS)及其标准。RQS共有16个项目,每个项目下方均有2-3个选项,测试者只需要勾选即可,满分36分。RQS标准对预测模型的所有方面都需要进行全面和清晰的评估和打分,以尽量减少偏差,从而提高预测模型的实用性。

作者单位:中国人民解放军海军军医大学附属第一医院放射科

影像组学ibex_影像组学技术方法相关推荐

  1. 影像组学ibex_影像组学的基本概念与临床应用

    近年来大数据技术与医学影像辅助诊断的有机融合产生了新的影像组学方法,其通过从影像中提取海量特征来量化肿瘤等重大疾病,可以有效解决肿瘤异质性难以定量评估的问题,具有重要的临床价值.影像组学技术来源于计算 ...

  2. 影像组学ibex_影像组学学习笔记

    题外话 这仍然是一篇学习笔记.近期在不同的学术会议上,有幸聆听学习了几位影像组学的大咖做报告,受益匪浅.以大咖们的报告为指导,自己也学习查找了一些文献,加入了一点点自己的理解和想法,整理成一篇笔记,与 ...

  3. 影像组学ibex_影像组学的图像分析及模型构建

    影像组学的图像分析及模型构建 隋赫 1 ,莫展豪 1 ,孙旭 2 ,李雪佳 1 ,刘景鑫 1 [摘 要] [ 摘 要 ] 影像组学是精准医疗时代的新兴领域,涉及多系统疾病的筛查. 诊断.治疗及预后评估 ...

  4. 影像组学ibex_影像基因组学

    在重要精神疾病(精神分裂症.抑郁症等)关键基因对脑结构或脑功能的调控研究方面,我们进行了系统探索,取得了系列研究结果. (1) 基于扩散张量影像研究了DISC1对脑结构网络的影响,发现DISC1 Se ...

  5. Cell Genomics封面|北大吴华君组利用空间多组学技术解析肿瘤内空间异质性(附招聘)...

    Cell Genomics封面|吴华君课题组利用空间多组学技术解析肿瘤内空间异质性 肿瘤内异质性(intra-tumor heterogeneity,ITH)是癌症复发转移的重要驱动因素之一.随着单细 ...

  6. BMC Biology:香港城市大学孙燕妮组发表高准确度预测病毒宿主的工具

    使用基于 GCN 的半监督学习预测原核病毒的宿主 Predicting the hosts of prokaryotic viruses using GCN-based semi-supervised ...

  7. 西湖大学鞠峰组招聘微生物组学、病毒组学与生物信息学博士后

    # 点击蓝字 关注我们 # 课题组介绍 环境微生物组学研究环境中全部微生物及其遗传信息,其方法学基础与理论拓展应用是国际学术前沿和热点,关键科学问题包括:1)如何全面高效定量识别微生物群落? 2)群落 ...

  8. 福建农林大学朱方捷组招聘讲师/副教授/助理——生信分析方向

    福建农林大学转录系统生物学课题组招聘(生信分析.组培转化) 工作地点: 福建农林大学海峡联合研究院 薪金: 18-30万 招聘岗位: 讲师/副教授/助理 实验室网址: http://hbmcsysbi ...

  9. 西湖大学鞠峰组:环境宏病毒组学分析思路与常用工具

    环境宏病毒组学分析思路与常用工具 袁凌1, 2,倪艳4,鞠峰1, 2, 3 * 1 浙江省海岸带环境与资源研究重点实验室,工学院, 西湖大学, 杭州, 浙江 2  前沿技术研究所, 浙江西湖高等研究院 ...

  10. 医学影像设备学_2020考研:影像大咖告诉你,学影像,就业好,不求人。

    医学学科里,有一门专业:医学影像,一直处于比较尴尬的地位:虽然是诊断医生,有执业医生证及大型设备上岗证,但是在同行眼里却是技师.拍片儿的.但是,最近几年医学影像专业迅速崛起,成了医学生就业热门专业. ...

最新文章

  1. 新的小游戏发布啦。Pop Jungle
  2. python列表(数组)
  3. python json dumps与loads
  4. 解决ssh连接Linux服务器经常掉线不稳定的问题
  5. SQL Server里那些我们应该知道的系统存储过程
  6. [html] 切页面时,每次都动手刷新看效果很麻烦,如果要让你写一个实时刷新预览的工具你该怎么写?
  7. 常用并发工具类(并发集合类)
  8. 三星Galaxy Note 10 Pro渲染图曝光:挖孔屏+前摄居中
  9. 开源监控解决方案Nagios+Cacti+PNP4Nagios+NConf+NDOUtils+Nagvis(九)NagVis安装
  10. django orm 操作表
  11. modelsim与quartus仿真的区别
  12. 养老---任重而道远
  13. 1155低功耗cpu排行_低功耗是亮点 Intel第三代酷睿CPU评测
  14. 9月20日.周日 第一场正式的比赛:2020年CCPC网络赛
  15. Docker笔记-常用命令
  16. Better to follow, follow to be better(2019 ICCV)
  17. GTX960M安装tensorflow-gpu心得
  18. Android 自定义加载Dialog 运行效果流畅
  19. Dev-Control-gridview的属性说明
  20. 基于STM32F4的CANopen快速SDO通信(超级详细)

热门文章

  1. Windows副本不是正版
  2. P3110 [USACO14DEC]驮运Piggy Back-最短路,spfa
  3. 【虹科科普】信号发生器分类及任意波形发生器原理
  4. [狗子的PM之路]数据埋点
  5. QT5 自定义窗口的详细设计方案
  6. TypeError: from_buffer() cannot return the address of the raw string within a str or unicode or byte
  7. 桌面计算机休眠快捷键,电脑休眠快捷键是什么
  8. 【自学Python:Day3】放假的心该怎么冷静下来学……
  9. 刨根系列之volatile详解
  10. 通过Python给头像加国旗,10多行代码搞定,就别@官方了