论文动机

流式细胞仪作为一种生物医学诊断技术,可以准确测量细胞特性。当前仪器已经实现了细胞的分类识别,但由于数据处理耗时的问题,尚不能对细胞进行实时分选。
基于之前的工作,本文作者提出采用深度学习来解决这一问题,在流式细胞仪的组成——激光信号上直接进行处理,省略了其他技术中费时的操作。该仪器可以在几毫秒之内检测出癌细胞,比之前的方法快数百倍。用这样的速度,可以在细胞检测后立刻将癌细胞从血液中分离出去,预防癌症转移。

技术方法

深度学习

深度学习属于机器学习,是一种采用大量数据来训练算法的人工智能。在深度学习中,神经网络算法用来模拟人的大脑工作。与其他机器学习类型相比,深度学习被证明在识别和生成图像、语音、音乐和影像上尤为有效。

论文采用基于 VGGNet 的卷积网络模型来进行细胞检测和识别。实验所采用的目标细胞为 T 淋巴杂交瘤细胞(OT-II)和人的结直肠癌细胞(SW-480),数据的准备过程以及模型架构如下图所示:

包含细胞信息的数据由高速 ADC 进行采集,每个波形数据先切割成 100 个小的波形片段,各片段之间的重叠率为 50%。 通过进一步处理,使得每个片段包含完整的脉冲。接着,将这些波形片段转换为二维阵列,使得波形分析的过程类似于采用卷积网络进行图像识别。经过处理的波形片段分别是携带 SW-480 细胞、OT-II 细胞以及不携带细胞信息的空白片段。他们被随机打乱后分成三个数据子集:训练集(占比 80%),验证集(占比 10%)和测试集(10%),并且三个子集之间没有交集。每次训练只有一部分数据(batch)参与。

深度神经网络模型由 16 个卷积层组成,其步长为 1,kernal 大小为 3 × 3,生成的特征图像深度从 16 增加到 64 个输出通道。在各个卷积层之间,采用窗口大小为 2 × 2 的最大池化层来进行降采样。 最后一个卷积层的输出被平铺为一维数据后进入三个全连接层:前两个有 1024 个节点,第三个有 64 个节点。并且采用 dropout 进行正则化,以及用 Adam 优化器来更新参数。

时域拉伸

光时域拉伸技术是 UCLA 发明的超高速测量技术。它采用超短激光来实现 1Tbit / s 的数据采样速度,比目前最快的微处理器速度还要快上 1000 倍。这个技术帮助科学家们发现了激光物理中的罕见现象,发明了新型的生物医疗仪器,如 3D 显微镜,光谱仪等。

论文中,采用时域拉伸成像系统快速捕获高通量细胞的空间信息。首先通过光脉冲线性扫描目标细胞,并将细胞的特征编码到这些光脉冲的光谱中,然后让脉冲在色散光纤中拉伸,并将光谱映射到时域上,最后由光电探测器捕获这些脉冲序列并转换为数字波形后,直接通过神经网络进行分析。

结果分析

在每个 epoch 中,对训练集和验证集的性能进行评估,结果如下图所示。比较每个类别的分类性能,发现在第一个训练 epoch 结束时就可以成功识别出 SW-480 细胞和 OT-II 细胞。训练和验证的 F1 score 不断增大,在大约 60 个 epoch 处达到最大值。并且,模型的泛化性能好。

下图分析了分类器的输出性能,将模型用于测试集,得到的结果分别通过 ROC 曲线和 PR 曲线来呈现。从图中可以看出,该分类器无论是从灵敏度/特异性,还是精确率/召回率上来看,均表现出良好的性能,且可靠性高。

应用:深度流式细胞仪

下图展示了深度流式细胞仪的工作机制。首先,微流体通道采用流体动力学聚焦机制,使得目标细胞对准光学相机的视场中心。然后基于时域拉伸成像的光学相机捕获高速流动的无标记的细胞信息,输出波形直接传递到已经训练好的深度神经网络,进行在线实时细胞分析,在细胞到达分选器之前给出准确的分类结果。不同类型的细胞将被赋予不同的极性电荷,使得它们被分选到不同的收集管中。

除了时域拉伸成像信号外,深度流式细胞仪还可以应用于其他传感器如 CMOS 或 CCD,PMTs 和光电二极管所捕获的信号。

亮点

论文所提出的深度卷积网络能够直接对流式细胞仪中输出的一维时间序列波形进行训练,自动提取数据特征,省去了图像合成和手动特征提取这些耗时的步骤,大幅缩短了细胞分析的整体用时。并且,直接对原始波形进行训练,可以挖掘出数据中更多的隐藏信息,从而获得更准确的细胞分类结果。

此外,由于采用了 NVidia 公司提供的 GPU,模型的处理时间(训练好的模型推断单个细胞样本的时间)可以进一步缩短,采用不同处理器的耗时对比如下表所示:

总结

本文提出了一种深度卷积神经网络,可以直接处理流式细胞仪的波形数据,从而快速识别细胞。这个系统在不到几毫秒的时间内便可实现细胞的精确分类,为实时的无标记细胞分选打开了新的途径。

点击以下标题查看更多往期内容:

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

?

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 下载论文

Nature论文解读:深度学习助力毫秒之间识别癌细胞相关推荐

  1. Densenet论文解读 深度学习领域论文分析博主

    深度学习领域论文分析博主 博客链接: https://my.csdn.net/u014380165 其中一篇文章: DenseNet算法详解: https://blog.csdn.net/u01438 ...

  2. 【每周CV论文】深度学习文本检测与识别入门必读文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 文本检测和识别是计算机视觉的一个非常重要的应 ...

  3. 【每周CV论文】深度学习图像降噪应该从阅读哪些文章开始

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像降噪是图像处理领域中非常传统和经典的问题 ...

  4. 中科院DeepMind联手,用深度学习揭示大脑如何识别人脸|Nature子刊

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI Deep ...

  5. Science评论:深度学习助力高通量结构生物信息学

    来源:集智俱乐部 作者:J. Pereira & T. Schwede 译者:刘培源  审校:赵雨亭 编辑:邓一雪  导语 以AlphaFold 2和RoseTTAfold等方法为代表的深度学 ...

  6. 论文合集 | 李飞飞新论文:深度学习代码搜索综述;Adobe用GAN生成动画(附地址)...

    来源:机器之心 本文约3200字,建议阅读7分钟. 本文介绍了李飞飞新论文,深度学习代码搜索综述,Adobe用GAN生成动画. 本周有李飞飞.朱玉可等的图像因果推理和吴恩达等的 NGBoost 新论文 ...

  7. 基于深度学习的命名实体识别研究综述——论文研读

    基于深度学习的命名实体识别研究综述 摘要: 0引言 1基于深度学习的命名实体识别方法 1.1基于卷积神经网络的命名实体识别方法 1.2基于循环神经网络的命名实体识别方法 1.3基于Transforme ...

  8. 【 非线性回归 Logistics-Regression 模块实现与源码解读 深度学习 Pytorch笔记 B站刘二大人(5/10)】

    非线性回归 Logistics-Regression 模块实现与源码解读 深度学习 Pytorch笔记 B站刘二大人(5/10) 数学推导 什么是logistics函数 在定义上Logistic函数或 ...

  9. 机器学习、数据科学、人工智能、深度学习和统计学之间的区别!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:Vincent Granville,来源:机器之心 在这篇文章中, ...

最新文章

  1. Recom Recall
  2. 【Angular】双向数据绑定--作用域树
  3. C语言打印输出红色字体
  4. c++中的文件读写的操作
  5. 跨多个专业的从业者想转行做单片机怎么办
  6. 完整的蓝屏错误代码大全详解
  7. WordPress模板制作教程
  8. Python批量将MP3音频转为WAV格式(附代码) | Python工具
  9. c计算机怎么读音发音英语,CACD是什么意思
  10. 直接在html打开ppt,PPT内如何直接看网页
  11. FATAL: Atom .R<CYM 383>.A<H 11> does not have a type.
  12. 找单生狗,模拟atoi,模拟offsetof,交换奇偶位
  13. react webpack配置组件路径引用 @与自定义
  14. 数据挖掘综合应用:数据预处理代码实战
  15. 【latex】LaTeX调整图片大小的方法;自动调整合适的大小
  16. internal compiler error
  17. 企业网络安全防御策略需要考虑哪些方面?
  18. 汉语言处理工具pyhanlp的简繁转换
  19. Docker版本名称YY.MM修改聚焦
  20. Ajax异步请求的步骤

热门文章

  1. e语言html显示框,html marguee标签
  2. linux apache 2.2下载,Linux下的Apache 2.2.* SSL证书安装
  3. python交互窗口怎么才能不连着上一个程序_python实现启动一个外部程序,并且不阻塞当前进程...
  4. Hadoop源码解读系列目录
  5. JavaScript中四种不同的属性检测方式比较
  6. MVC3 在提交表单以后 return View(model) 页面不会根据model的内容更新表单
  7. 趣味问题:你能用Reflection.Emit生成这段代码吗?
  8. 不能装载通讯模块。驱动程序安装不正确。
  9. python数据驱动ddt_python_数据驱动_ddt
  10. mysql的FIQ怎么安装_MySQL数据库设计总结