免疫检查点阻断已经彻底改变了癌症治疗,临床实验数据表明PD-1、PD-L1抗体的免疫治疗可以有效应对转移性黑色素瘤和多种其他类型的癌症。尽管无进展生存期显着增加,临床治疗结果也呈现很大的个体差异,只有一小部分患者对药物表现出持久的反应,大部分患者并未显示持久的反应。因此,找到一些预测临床预后的Bio-Marker,以便在开始治疗之前区分应答者(Responder)与无应答者(Nonresponder)是十分紧迫的。

2018年年初,瑞士苏黎世大学的研究人员在《Nature Medicine》杂志上发表了其在该领域的最新研究成果。他们发现,病人外周血PBMC中具有CD14+CD16−HLA-DRhi表型的经典单核细胞比例可以作为预测病人对PD-1药物反应性的Bio-Marker。

在这项研究中,科研人员选择了20个黑色素瘤病人在治疗前后的PBMC样本做为研究对象。为了对细胞的表型和功能进行系统深入的分析,他们利用质谱流式技术(Mass Cytometry)对样本进行高维单细胞分析。

A Workflow of “Data Driven Research”

质谱流式技术是近年来兴起的单细胞多参数分析技术,利用带有金属元素标签的抗体对细胞进行标记,然后利用质谱对单细胞上的标签元素进行检测,从原理上避免了传统流式技术所面临的荧光串色、自发荧光等问题。

出于研究工作的需要,研究人员一共使用了三个不同的抗体组合(Panel)对样本进行分析。第一个Panel包含30个白细胞Marker,可以识别外周血中所有主要免疫细胞亚群以及T细胞分化激活的各个阶段;第二个Panel主要是对T细胞表型和功能的细致分析,包含了T细胞相关的表面Marker以及各种相关的Cytokine;第三个Panel则主要针对髓系细胞,用来对髓系细胞进行更深入的亚群分析。三个Panel的共同使用从不同角度全方位展示了外周血PBMC样本中各类细胞亚群的表型和功能,以及其在不同分组(Responder和Nonresponder)或者治疗前后的差异。

毫无疑问,质谱流式高维检测的特性使其能够从有限的样本获得规模庞大的数据,这种能力对于 Biomarker的寻找是非常有帮助的。而从这些数据中找出我们所需要的“Biomarker”,则需要一套行之有效的数据分析方法和流程。

这项研究的目的是寻找预测PD-1抗体治疗预后的生物标志物,因此需要找出Responser 和 Nonresponder病人在治疗前的样本中的特征性差异。为了解决这个问题,作者采用了多种手段进行了数据挖掘。

在以往的质谱流式相关研究中,一个经典的数据分析流程被广泛采用:先用手工Gate或者聚类的方法将样本细分为若干亚群,然后利用统计学方法寻找和检查这些细胞亚群在比例、Marker表达强度等方面在不同分组之间的差异。

作者通过FlowSOM对细胞进行的聚类分析结果

所有亚群展示在viSNE图上

事实证明,这套流程行之有效。作者通过FlowSOM算法对样本进行多轮聚类分析,然后对两组样本所包含的各个亚群比例进行对比统计分析。结果表明,具有CD14+CD16−HLA-DRhi表型的经典单核细胞亚群比例在Responder中明显高于Nonresponder样本。

除了这种经典的分析方法,随着人工智能(Artificial Intelligent)时代的到来,一些新兴的机器学习算法也正在越来越多的被应用于质谱流式数据的分析,Cellcnn就是一个例子。Cellcnn是一种基于卷积神经网络的分析方法,通过机器学习自动获得能够显著区分两组样本的Marker组合。这是一种Data driven research方式进行的数据分析,尽量减少数据分析过程中的人工干预,其所得出的Marker组合不需要和已知亚群的表型一致,这也排除了人为主观因素对于数据分析结果的影响。

借助Cellcnn方法,研究人员对治疗前的两组样本数据进行分析,发现了一个髓系亚群在Responder中的比例为4.8% ± 2.0%,而Nonreponder样本中的比例为2.4% ± 1.5%,两者在统计学上具有显著差异。而这个髓系的亚群属于单核细胞,其核心表型为:CD14+CD33+HLA-DRhi ICAM1+CD64+CD141+CD86 +CD11c+CD38+PD-L1+CD11b+,viSNE图上的叠加对比表明,该亚群与前面经典方法筛到的亚群具有相当的一致性,这也显示了Cellcnn这一方法的有效性。

圆圈标记的是通过Cellcnn机器学习算法找到的可以区分

Nonresponder组和Responder组的特征性亚群

当然, Cellcnn只是人工智能在质谱流式数据分析方面的牛刀小试,可以肯定,在未来更多基于人工智能的分析方法会应用于质谱流式数据的分析,成为深度数据挖掘、临床Bio-Marker的寻找、甚至解决一些基础科学问题的有力工具;另一方面,人工智能的广泛和深度应用将进一步降低数据分析的门槛,这对于质谱流式技术的普及和对质谱流式数据的充分利用有着巨大的推动作用,可谓影响深远。

利用传统流式对新发现的BioMarker的临床验证

为了将质谱流式寻找到的Bio-Marker应用于临床,研究人员减少较少原来Panel中的Marker数量以便使用传统荧光流式进行验证。通过对来自另外31名患有黑素瘤的患者治疗前的PBMC进行了盲测。这组病人中包含15个应答者(Responder)和16个无应答者(Nonresponder),传统流式结果确认了在两组病人中CD14+CD16−HLA-DRhi的亚群比例存在显著差异。根据模型研究人员确定了19.38%做为最佳的判断阈值,即当这一亚群的比例大于19.38%时,推荐对病人使用抗体PD-1抗体治疗方案。这些结果显示出该研究光明的应用前景。

Reference:

1、High-dimensional single-cell analysis predicts response to anti-PD-1 immunotherapy. Krieg C etc., Nat Med. 2018 Feb;24(2):144-153.

2、CyTOF workflow: differential discovery in high-throughput high-dimensional cytometry datasets. Nowicka M ect., F1000research.11622.2. eCollection 2017.

数据挖掘肿瘤预测_Nature Medicine封面文章:利用单核细胞数量预测及评估肿瘤免疫治疗效果...相关推荐

  1. SMURF-Science封面文章使用的16S新流程

    肠道微生物是近两年的研究热点,但是去年登上Science封面的是一篇研究肿瘤中的微生物的文章,另人眼前一亮,有些肿瘤即使没有与外界环境相通,也是有微生物的存在的.外行看热闹,内行要看看他是具体怎么进行 ...

  2. ML之RF:基于Matlab利用RF算法实现根据乳腺肿瘤特征向量高精度(better)预测肿瘤的是恶性还是良性

    ML之RF:基于Matlab利用RF算法实现根据乳腺肿瘤特征向量高精度(better)预测肿瘤的是恶性还是良性 目录 输出结果 实现代码 输出结果 更新-- 实现代码 %RF:RF实现根据乳腺肿瘤特征 ...

  3. matlab切割肿瘤算法,ML之RF:基于Matlab利用RF算法实现根据乳腺肿瘤特征向量高精度(better)预测肿瘤的是恶性还是良性...

    ML之RF:基于Matlab利用RF算法实现根据乳腺肿瘤特征向量高精度(better)预测肿瘤的是恶性还是良性 目录 输出结果 实现代码 输出结果 更新-- 实现代码 %RF:RF实现根据乳腺肿瘤特征 ...

  4. NBT封面文章:水稻根系微生物组与氮肥利用效率关系(端午水稻专题)

    文章目录 中科院遗传发育所揭示籼粳稻根系微生物组与氮肥利用效率关系 评论 Reference 作者简介 白洋 储成才 张婧赢 刘永鑫 张娜 猜你喜欢 写在后面 今天端午节,祝大家节日快乐! 大家每年端 ...

  5. 利用python对b站某GPT-4解说视频的近万条弹幕进行爬取、数据挖掘、数据分析、弹幕数量预测及情绪分类

    目录 一.利用Python爬取弹幕 二.利用几行代码直接生成词云 三.将弹幕属性和内容放入mysql当中 四.分析弹幕在视频各节点的数量 1.分析视频各个片段出现的弹幕数量 2.分析视频各大章节出现的 ...

  6. 手把手带你重现菌群封面文章全部结果图表

    文章简介 图表解读与绘制 1. 水稻根系微生物随时间变化吗? 2. 微生物组随时间变化的规律 3. 哪些菌门随时间呈现规律变化呢? 4. 哪些菌可以作为生育时间的biomarkers? 猜你喜欢 写在 ...

  7. 中国科学封面文章:水稻田间全生育期根系微生物组的变化规律

    文章简介 人类体内和植物根系都存在着数量庞大种类繁多的微生物群落(微生物组).肠道微生物组随人类年龄的演化规律关系到人们的健康.与之类似,植物根系微生物组随植物生长的变化规律对植物健康也非常重要,与农 ...

  8. 利用网络数据预测企业失信行为

    利用网络数据预测企业失信行为 周涛,李艳丽,李倩, 陈端兵,谢文波,吴桐,曾途 电子科技大学大数据研究中心,四川 成都 611731  成都数联铭品科技有限公司,四川 成都 610041  成都数之联 ...

  9. ML之RF/kNNC/LoRC/SVMC/RFC/GBDTC:利用Pipeline(客户年龄/职业/婚姻/教育/违约/余额/住房等)预测客户是否购买该银行的产品二分类(评估、调优、推理)

    ML之RF/kNNC/LoRC/SVMC/RFC/GBDTC:利用Pipeline(客户年龄/职业/婚姻/教育/违约/余额/住房等)预测客户是否购买该银行的产品二分类(评估.调优.推理) 导读:根据客 ...

最新文章

  1. CVPR 2021 | 基于语义聚合与自适应2D-1D配准的手部三维重建(快手)
  2. Java克隆(Clone)的应用
  3. Django系列之启动入口源码分析
  4. 【Codeforces717F】Heroes of Making Magic III 线段树 + 找规律
  5. HTTP缓存相关知识介绍
  6. 1809企业战略管理
  7. Filter的基本用法一
  8. DataGridView的单元格内容即时更新方法
  9. nodejs 更新_NodeJs(一)我对NodeJs的认知
  10. python可以做力扣的题吗_力扣题目练习一
  11. 史上最简单的UIScrollView+Autolayout出坑指南
  12. ceph的读写性能测试
  13. FPGA 按键控制数码管
  14. 11g oracle 客户端驱动_oracle 11g 数据库驱动包
  15. python3.6 添加tab键功能
  16. 在switch时使用枚举类型
  17. 一文搞懂Overleaf(Latex)中的Environment和\newenvironment命令
  18. qt c语言混合编程 pdf,QT中的C++技术 pdf
  19. UE4-如何做一个简单的TPS角色(二)-实现角色基础移动
  20. 蜜蜂的群体决策:一万只蜜蜂如何投票选择最佳巢穴?

热门文章

  1. jquery ready方法实现原理
  2. 使用vux组件库常见报错($t)处理
  3. CSS3与页面布局学习笔记(二)——盒子模型(Box Model)、边距折叠、内联与块标签、CSSReset
  4. 仿淘宝网站的TabPage导航效果
  5. T - Memory and Trident CodeForces - 712B( 注意:* ++ = 的优先级
  6. scala akka通信机制
  7. 分解质因数-洛谷P3200 [HNOI2009]有趣的数列
  8. redis学习笔记——应用场景
  9. Python中如何读取xml的数据
  10. Collection 和 Map接口及其实现类总结