在2016杭州云栖大会第二日,北京中科晶云科技有限公司云平台产品总监卜德超在基因计算专场分享了《抗击:大数据分析助力遗传病肿瘤精准医疗》,他简要介绍了精准医疗,并且通过两个案例分别介绍了中科晶云在公有云和私有云上针对不同场景的解决方案。

以下内容根据演讲PPT及现场分享整理。


精准医疗时代

医药学领域从来不缺乏大数据,基于二代测序技术的基因检测大数据时代已经来临。精准医疗的短期目标是加强精准医疗在肿瘤、遗传病诊断治疗上的应用。精准医疗的长期目标是创建一个融合参与者、有责任的数据共享以及隐私保护的新型研究模型,挖掘疾病新的规律、发现新的诊疗模式。

痛点及难点

精准医疗进行得如火如荼,其中测序已经不再是问题,目前最关键的问题是数据的解读和分析。针对上述问题中科晶云构建了云平台。

如上图所示,细分为两个应用场景。单基因遗传病采用了公有云平台,肿瘤伴随诊断一体机采用的是私有云平台,因为一体机直接连接了测序仪,所以只能采用私有云模式。

单基因遗传病云平台

单基因遗传病是指只要一个基因异常就可以导致遗传病。单基因遗传病是如何检测出来的呢?往往是一个患者有各种的表型,导致临床难以诊断出来,但是通过基因测序可以找到其致病位点。这种方式反应了基因和疾病的关联关系,只有这种关系准确才能保证找出来的致病位点准确。针对这种案例,晶云平台采取了两个步骤:变异鉴定,变异解读。从用户的角度,主要通过数据上传、变异鉴定、变异解读、分析报告四个步骤完成解读。

数据上传

使用了阿里的OSS,速度稳定可靠,支持断点续传等技术。

变异鉴定

主要分为三种鉴定方式:单核苷酸变异(SNV)、插入缺失变异(INDEL)、拷贝数变异(CNV)。由于计算得到的结果有complex或者mnp的现象,所以鉴定之后需要有一个校正的过程来获得一个更准确的结果。阿里提供了一个很好的批量计算的能力——BCS服务,晶云利用BCS服务能够很快的将系统构建到云端,万核级的并行,不用再担心业务吞吐的限制。最终云端的分析速度达到了:全基因组测序数据,10亿Reads,100G数据在24小时内完成;全外显子测序数据,1亿Reads,10G数据大约5个小时完成;靶向测序数据,4 M Reads,330M数据大约14分钟完成。

变异解读

变异解读最关键的是需要具备基因和疾病相关的知识库,单基因遗传病最重要的是OMIM数据库。为了能让医学更好的介入变异解读,将OMIM数据库超过五千条单基因遗传病及其表型进行汉化,构建了中文的语义分词检索的算法。同时,将遗传规律做了细分,加上了可能常显、可能常隐两种规律。因为很多基因遗传病刚开始并不知道其遗传方式,OMIM只拥有五千多基因的数据库,而人类有两万多的基因,有些我们不知道的基因同样可能致病。

基于上下文的信息,构建了实现Reads可视化的浏览器。黄色部分是变异,白色部分是缺失的情况,从这个图我们可以直观地看到Reads传达的信息。那么,怎么在1000亿的数据中查出想要的信息?晶云采用了阿里的OTS进行了实现。OTS是分布式的表格存储,能很快的从大量数据中检索出想要的信息,精准获得想要区间的Reads信息。

分析报告

报告分为三个梯度:与患者表型相符的结果;与遗传方式明确的疾病相符的结果;与遗传方式不明确的疾病相符的结果。

晶锐肿瘤伴随诊断私有云平台

晶锐TM专用一体机与测序仪会有一个直连,然后经过两个关键的环节(找驱动基因、根据驱动基因获得推荐的治疗方式)。在底层,做了数据存储、计算、解读、传输、隐私等方面的管理。

一体机模块如上图所示。最底层是云存储和计算,其上方是NGS数据分析模块、基因型和疾病型模块。右边是管理性的,包括API、数据管理、可视化。

私有云也是可以伸缩的。最简单的情况,可以把这七项服务都布在一个节点上,相当于一台集成的服务器。每个服务也可以进行扩充,比如左下角的生物信息服务可以不断增加运算节点。右边是文献存储的API,包括API和Web。

一体机有4个特色:易、准、快、可定制。

“易”是指自动抓取,一键操作。易是直连测序仪的目的,省去了数据传输的时间,防止传输过程中可能出现的数据丢失问题以及一些不稳定的情况。晶锐与PGM Server建立安全数据交换通道,每隔5分钟扫描并下载测序仪新产生数据,当其检测到这批数据已经产生并且不再变化时,就会同步过来并且启动数据分析。

“准”是指专属流程、严格质控,主要体现在挑选致病基因的过程中,这是肿瘤伴随诊断中非常重要的一点。只有致病基因挑选准确,之后的药物推荐才能可靠。晶锐使用一代测序和QPCR对模型进行了验证。

“快”对于肿瘤诊断不是一个很大的问题,因为肿瘤相关的基因一般是十几个基因到一百多个基因之间,而且数据量差别并不是很大。一个批次32例肿瘤、17基因测序下机数据运行时间小于1个小时。

“可定制”是指多种Panel选择、自定义hotspot、本地知识库。由于晶锐使用的是私有云部署的方式,所以可以做一个很大的扩充,具体的扩充方式如上图所示。

云上的精准医疗——公有云、私有云案例分析和比较相关推荐

  1. 公有云 私有云 混合云_混合云的承诺,收益和产品

    公有云 私有云 混合云 云承诺为我们提供所有灵活性. 有机会在需要时访问无限资源并相应地付款. 我们不再需要花费时间安装,配置和维护服务器: 我们被承诺将有更多的时间来"仅仅编码" ...

  2. 公有云 私有云 混合云_您需要了解的有关混合云的知识

    公有云 私有云 混合云 在过去十年中出现的众多技术中,云计算以其从利基技术到全球主导地位的快速发展而著称. 云计算本身就造成了很多混乱,争论和争论,而混合了几种类型的云计算的"混合" ...

  3. 公有云 私有云 混合云_混合云不断变化的面貌

    公有云 私有云 混合云 根据您用来启动时钟的事件,云计算的使用时间才刚刚超过10年. 我们今天认为理所当然的一些有关云计算的术语和概念仍然较新. 美国国家标准技术研究院(NIST)的文档定义了现在熟悉 ...

  4. 公有云 私有云及架构

    目录 云 云计算 公有云,私有云,混合云 IaaS,PaaS,SaaS 云 数据存储中心,还能提供计算.服务和应用功能.即将电脑中所有的资料都存储到网络上,到任何一个地方,只要能上网,通过身份认证,就 ...

  5. 公有云私有云的区别_一分钟秒懂公有云、私有云、混合云的区别?

    公有云.私有云.混合云有什么区别?在讲这几个的区别前,可以先说下经常被一起谈起的云计算. 什么是云计算? 我们可以先理解云计算中的"云"是什么意思,通俗的理解,这里的"云 ...

  6. 公有云私有云的区别_私有云 vs. 公有云:谁更安全?

    "云变革" 早期时,在系统管理员眼中,用 "云" 这个比喻来圈定该技术栈是个有趣的选择.大脑意象中,云这种绵软蓬松的形象似乎难以锁定 IT 市场营销人员口中无处 ...

  7. 一分钟解决你的公有云私有云选择困难症

    全球的云计算产业如今是一日千里的发展势头,最近国际调研机构RightScale数据显示,有88%的企业在使用公有云,其余的选择了私有云与混合云. 许多的企业负责技术人员在选择哪种云服务时也往往有这样的 ...

  8. 公有云 私有云 混合云

    云技术: 云技术是指在广域网或局域网内将硬件.软件.网络等系列资源统一起来,实现数据的计算.储存.处理和共享的一种托管技术. 公有云  私有云:(以下摘自http://www.elecfans.com ...

  9. 私有云是伪命题:真正的私有云 ≈ 公有云

    私有云是伪命题:真正的私有云 ≈ 公有云 "真正私有云"与"私有云"的区别在于整合产品各方面的完整性,包括价格.敏捷性和服务广度等性能特征.同样重要的是与云供应 ...

最新文章

  1. html三列布局中间固定,常见的三列布局(左右固定宽度,中间自适应)
  2. Sleep()和wait()方法的区别
  3. 阿里面试官:什么样的人能在阿里晋升?
  4. BZOJ 4002--有意义的字符串(矩阵乘法)
  5. 错误:在keystone中无法找到默认角色user_Kubernetes RBAC角色权限控制
  6. Redis面试 - Redis的持久化机制
  7. jQuery使用ajax错误的重复发送请求的解决办法
  8. PyTorch深度学习快速实战入门《pytorch-handbook》
  9. [图灵程序设计丛书].持续交付:发布可靠软件的系统方法.pdf
  10. 2012年3月份第2周51Aspx源码发布详情
  11. C语言打印九九口诀表
  12. Linux Bridge简介
  13. 计算机二级access分数分布_计算机二级office题型及分值分布
  14. 微信协议服务器端口,优咖对你说| 从TCP协议栈角度分析微信常用业务模型
  15. 斑凶鹰来袭,斑鸠逃生
  16. 从学校家长委员会谈开去
  17. 四平方和python_成都房价现在多少?和北京差距很大吗?Python爬取了四万套房源!...
  18. 射线与圆、球相交检测
  19. 测试电脑的软件3dm,有用的小工具检测你的电脑能否运行Oculus Rift
  20. Lambda基本语法及使用

热门文章

  1. python基础常用语句-Python基本语句
  2. python urllib.request 爬虫 数据处理-python爬虫之json数据处理
  3. python常用标准库有哪些-Python开发中常用的标准库
  4. python小项目实例流程-公司内项目对接钉钉审批流程(python)
  5. python处理excel文件-python处理Excel文件
  6. Python的try... excep异常捕捉机制
  7. 如何理解H264 编码
  8. Tree命令安装和使用
  9. Unity3D学习笔记(十九):UGUI、Image、Text、Button
  10. 洛谷 P2574 XOR的艺术