面向组学大数据的生物信息学研究

作者:杨帅

一.本文讲了什么?

本文主要讲了如何在生物信息学中利用组合大数据,因为我们有着庞大组学数据却不能好好利用。

组学大数据:组学主要包括基因组学,蛋白组学,代谢组学,转录组学,脂类组学,免疫组学,糖组学和 RNA组学等。各组学就是研究他们各自以及它们之间的关系,例如基因组学这门学科就是研究这些基因以及这些基因间的关系。组学大数据就是这些组学在生物医学等领域中的研究应用所收集到的庞大数据。

云计算技术:云计算是一种利用互联网即可随时随地、按需便捷访问共享资源池的模型;通俗来讲,计算变成了一种可以购买的资源,我们购买云计算资源,把我们的数据上传计算,计算好结果后再下载下来分析结果即可。

多组学整合:多层组学整合分析是指对来自不同组学的数据源进行归一化处理、比较分析,建立不同组间数据的关系,综合多组学数据对生物过程从基因、转录、蛋白和代谢水平进行全面的深入的阐释,从而更好的对生物系统进行全面了解。

癌症驱动基因:与癌症发生发展相关的重要基因称为驱动基因,驱动基因决定了这个癌症的最主要的原因。当驱动基因突变后,就会把癌细胞“驱动”起来。

二.如何利用组合大数据?

作者提出了两个途径来利用组合大数据:

1.以云计算技术为平台,构建分析蛋白质大数据的平台。方法:基于MapReduce框架的数据库搜索算法。作者还开发了一个基于云计算技术的蛋白质大数据分析呈现平台CAPER3。

2.以生物学网络为基础整合多组学数据来进行癌症驱动基因的鉴定。方法:基于KEGG通路的驱动基因鉴定方法,研发了基于生物学网络的多组学数据分析体系Bionexr。

三.方法的优点

云计算技术给生物信息学大数据处理体系带来计算灵活性,充分利用了云计算的弹性计算能力。

四.方法的缺点

网络宽带是有限制的,增加计算资源并不一定能使性能有相应的提升,因此不清楚使用多少的计算资源才最合适。

面向组学大数据的生物信息学研究相关推荐

  1. Mol Plant | 多家单位联合发布小麦组学大数据可视化和在线分析平台WheatOmics

    随着小麦模式品种"中国春"的参考基因组以及不同倍性.不同品种小麦基因组/泛基因组的陆续发布,小麦研究业已进入了后基因组大数据时代.与此同时,基于外显子测序.基因组重测序.SNP芯片 ...

  2. 全程免费 - 挖矿转录组学大数据,中科院胡松年、方向东等开讲

    ▼生物信息学习的正确姿势(第三版) NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细 ...

  3. 【金猿案例展】某国家级研究所——组学大数据分析平台建设

    荣联科技集团案例 本案例由荣联科技集团投递并参与"数据猿年度金猿策划活动--2020大数据产业创新服务企业榜单及奖项"评选. 大数据产业创新服务媒体 --聚焦数据 · 改变商业 大 ...

  4. 爱思唯尔云论坛:疫情挑战下的大数据与人工智能研究

    2020注定是不寻常的一年,新冠肺炎疫情在全球多点暴发并迅速蔓延,给社会带来巨大影响的同时,也为大数据与人工智能研究者带来新的挑战.值此疫情之际,由爱思唯尔旗下大数据期刊Big Data Resear ...

  5. 水环境模型与大数据技术融合研究

    点击上方蓝字关注我们 水环境模型与大数据技术融合研究 马金锋1, 饶凯锋1, 李若男1,2, 张京1, 郑华1,2 1 中国科学院生态环境研究中心城市与区域生态国家重点实验室,北京 100085 2  ...

  6. 基于区块链的大数据交易模式研究与探索

    点击上方蓝字关注我们 基于区块链的大数据交易模式研究与探索 李源1, 高宁1, 孙晶1,2, 赵会群1 1 北方工业大学信息学院,北京 100144 2 北方工业大学大规模流数据集成与分析技术北京市重 ...

  7. 大数据时代传播研究中语料库分析方法的价值

    [摘要]:大数据时代的研究逻辑,对传播学研究形成了新的冲击,传统的文本分析方 法,已经不能满足对样本数量的宏阔和数据挖掘深度上的双重要求.语料库的研究方法 在数据新闻.舆情监测和学术研究等领域都可以得 ...

  8. 商务部首次明确支持无人商店;重庆邮电大学大数据智能研究院今揭牌成立

    大唐网络与北京发行集团共建基于 AI 的无人书店 雷锋网(公众号:雷锋网) AI 掘金志消息,2017年9月22日,大唐网络有限公司与北京发行集团有限责任公司在央企双创成就展会议现场举行战略合作协议签 ...

  9. 证券期货行业监管大数据治理方案研究

    证券期货行业监管大数据治理方案研究 蒋东兴1, 高若楠2, 王浩宇2 1. 中国证券监督管理委员会信息中心,北京 100033: 2. 中证信息技术服务有限责任公司,北京 100033 摘要:为充分发 ...

  10. 【2017年第4期】ISO/IEC JTC1/WG9大数据国际标准研究及对中国大数据标准化的影响...

    光亮1,张群2 1.华为技术有限公司,北京 100085:2. 中国电子技术标准化研究院,北京 100007 摘要:ISO/IEC JTC1/WG9是制定大数据基础性国际标准的官方组织,WG9在研的大 ...

最新文章

  1. 深度:生成模型(GAN)的最新进展
  2. mysql 缓存怎么设置_mysql中缓存如何设置
  3. 超图数据集管理基本操作和添加删除属性表字段
  4. Document for the hackthon
  5. 数据中台建设五步法(文末赠书)
  6. 统计学习方法 李航 读书笔记
  7. 实现根据条件删除_强大的定位空值法,1秒删除所有不想要的数据
  8. javascript事件之:谈谈自定义事件
  9. 当Java枚举遇到位掩码,还能这么玩?
  10. php tp框架验证,tp5.1验证 - thinkphp5.1框架学习 - php中文网博客
  11. 操作系统课程设计(linux操作系统)
  12. 标准C语言程序设计第七版pdf,C语言程序设计课程标准.PDF
  13. DGIOT国内首家轻量级物联网开源平台——真实电表接入实战教程
  14. JavaScript使用Modbus协议实现RTU设备连云
  15. 怎么用软件测试iPad,Apple:如何在iphone、ipad上安装一些常用命令行命令
  16. k8s(十三)、企业级docker仓库Harbor在kubernetes上搭建使用
  17. [UE4]获得特定类型的所有Actor:Get All Actors Of Class、Get All Actors with Interface、Get All Actors with Tag...
  18. 学习型组织的思维方式:保持努力,终身成长!
  19. 面子对中国人为什么这么重要
  20. c语言双精度小数点后取几位_c语言float类型小数点后位数

热门文章

  1. Windows11移动硬盘安装
  2. 中文停用词表(1893个)
  3. 利用VB.Net 通过Windows Sockets (Winsock)以及多线程编程进行桌面电脑与Pocket PC间的双向通信
  4. linux下shell脚本编程2
  5. 古代汉语复习资料与练习题(适合王力版教材)
  6. qtp(QuickTest Professional)的下载安装
  7. 【SVN】解决SVN安装语言包后无法选择中文的问题
  8. 一台显示器分成双屏_华硕显示器贴心相伴:云办公、云学习宅家无忧
  9. Fiddler中文版设置抓取某个网站的信息 2021-07-31
  10. python手册中文版-Python中文文档