三代测序关键计算技术开发及应用

Abstract

三代测序技术具有读长长(约20kbp),无PCR扩增偏好性和碱基修饰敏感性等特点,在动植物的基因组de novo组装和表观遗传检测研究中具有明显的优势。作为二代测序技术的有力补充或替代,已成为近年来研究的热点,其研究成果常发表于CNS等国际顶级期刊。

目前三代测序数据高测序错误率(12-15%)是三代数据分析面临的巨大挑战,高错误率引起的巨大计算资源消耗是阻碍三代测序广泛应用的重大瓶颈问题。

首先,在三代测序基因组组装方面,我们提出了全局种子投票打分模型和局部图序列校正模型,开发了快速组装系统MECAT。

MECAT在人数据集的组装速度是同类软件(Canu和FALCON)17-56倍,该研究成果于2017年发表在Nature Methods期刊,目前MECAT已组装了20余个中国特色植物基因组。

其次,在表观遗传学修饰检测方面,针对PacBio大型基因组DNA-6mA资源消耗问题,我们提出了基因组区域划分的并行检测方法并合作开发了Basemodes Spark。基于该软件首次系统地揭示了人类DNA-6mA图谱的分布规律,基因表达调控模式,甲基化酶(N6AMT和ALKBH1)及其与癌症关系,该研究成果于2018年发表在Molecular Cell杂志上。

此外,针对Nanopore表观修饰检测精度低问题,我们建立了识别Nanopore表观修饰(5mC和6mA)的深度循环神经网络(RNN)模型,开发了相应的软件DeepMod,实现了高精度全基因组单碱基水平检测5mC和6mA,5mC和6mA的检测平均精度可分别高达99%和90%,该成果于2019年发表在Nature Communications杂志上。

Bio

生物信息学博士,中山大学中山眼科中心副研究员,眼科学国家重点实验室独立PI。长期致力于生物大数据分析方法开发及应用研究,近年来针对三代测序基因组学、表观遗传学和蛋白质组学基础研究及应用中出现的计算瓶颈问题建立了系列关键算法和支撑软件。主要研究方向有:

(1)三代测序数据基因组计算方法研究:我们提出了全局种子投票打分和局部图序列校正计算模型,开发了快速组装系统MECAT,该系统比目前同类软件组装速度快17-56倍;

(2)三代测序表观遗传学方法开发及应用研究:我们提出了三代测序技术的DNA-6mA甲基化检测并行计算模型,首次系统揭示了人类DNA-6mA甲基化图谱,拓展了人类表观遗传学的研究方向;并且建立了首个识别Nanopore电信号修饰的深度学习模型,其鉴定5mC和6mA的精度可以高达99%和90%,拓宽了Nanopore测序技术应用领域;(

3)蛋白质组计算方法研究及应用:我们提出融入质谱峰强度特征的蛋白鉴定算法和磷酸化位点评估方法,显著提升了蛋白质组学技术的分析水平。

目前以第一或通讯作者在Nature Methods、Molecular Cell、Nature Communications等期刊发表高水平SCI论文十余篇,先后开发NECAT、DeepMod、MECAT和FANSe2等十余个生物信息学分析工具。

三代测序关键计算技术开发及应用相关推荐

  1. 基因测序技术发展历史及一、二、三代测序技术原理和应用

    基因测序技术发展历史及一.二.三代测序技术原理和应用 红皇后学术 公众号:红皇后学术(ID: zzlphs2516) 已关注 125 人赞同了该文章 基因测序技术 基因测序技术也称作DNA测序技术,即 ...

  2. 三代测序的简介和原理

    三代测序的简介 ​ 第三代测序技术是指单分子测序技术.DNA测序时,不需要经过PCR扩增,实现了对每一条DNA分子的单独测序.第三代测序技术也叫从头测序技术,即单分子实时DNA测序.第三代测序技术以P ...

  3. 基于三代测序技术的微生物组学研究进展

    基于三代测序技术的微生物组学研究进展 2020-09-04 09:16 微生物通常指一切难以用肉眼观察到的微小生物, 包括细菌.病毒.古菌.真菌以及一些微小的原生生物.微生物体积微小.结构简单, 却又 ...

  4. Nature 子刊:三代测序的DNA提取和宏基因组学分析

    改进的人类肠道微生物组的高分子量DNA提取,纳米孔测序和宏基因组学装配 Improved high-molecular-weight DNA extraction, nanopore sequenci ...

  5. 大数据时代千帆竞发,三代测序激流勇进

    大数据时代千帆竞发,三代测序激流勇进 2021-08-20 11:09 21世纪是生物的世纪,也是基因科技蓬勃发展和被广泛应用的世纪,每一代基因测序技术,无一例外地伴随着核心工具的变革和新应用场景的产 ...

  6. 三代测序的基本原理、组装方法和应用场景

    三代测序的基本原理.组装方法和应用场景 PB/Nanopore测序原理及优缺点介绍 PB:光信号,荧光基团结合碱基测序 Nanopore:电信号 优点 无GC偏好性 缺点 错误率较高 有效孔只有三分之 ...

  7. 二代测序组装PK三代测序组装

    二代测序组装PK三代测序组装 2016-07-29    编辑:诺禾致源 三代Pacbio测序技术 以其长读长,无需扩增,无GC偏好性等优势成为de novo组装的新宠儿. 然而,Pacbio测序成本 ...

  8. PacBio RS系列已被淘汰,PacBio Sequel成为三代测序最新起跑线。

    PacBio RS系列已被淘汰,PacBio Sequel成为三代测序最新起跑线. 来源: 查看手机网址 浏览:2432 发布日期:2017-06-13 08:57:46[大 中小] PacBio R ...

  9. 三代测序纠错软件汇总篇

    三代测序纠错软件汇总篇 原创: 李海滨 诺禾科服 2017-12-21 在之前推出的一篇微信中,已经介绍过了三代测序下机数据"三代全长转录组测序常见问题说明".那么我们拿到数据后是 ...

最新文章

  1. mysql表情符号变为_mysql Emoji表情字符集转换
  2. 从头开始学py,列表,字符串
  3. 6-4 链表拼接 (20分)_青岛喷绘制作公司不愿透露的喷绘布拼接与安装技巧,建议收藏...
  4. 编码原则:不变量/前置条件/后置条件
  5. GRUB引导另一个主分区
  6. 安装ubuntu20.4+gtx1050+cuda11.3
  7. R绘图 vs Python绘图(散点图、折线图、直方图、条形图、箱线图、饼图、热力图、蜘蛛图)
  8. 浅析 Linux 初始化系统(系统服务管理和控制程序/init system) -- UpStart
  9. JavaScript中带有示例的Math.cos()方法
  10. 次小生成树 最小度限制生成树
  11. PCL Lesson6:Eigen基础
  12. 金蝶专业版过账提示运行时错误5_金蝶财务软件的操作流程
  13. 农行笔试编程题(Java)记录
  14. 点到线的距离计算公式
  15. PDH性能测试之五--待续
  16. Eclipse - 更换新的工作空间后,怎么把上一个工作空间的配置复制过来
  17. 【经验分享】调试STM32F107VC单片机驱动DP83848以太网PHY芯片时遇到的问题
  18. 分享一个超级狠的面试题与经验
  19. 北京筑龙出席《中国招标》30周年座谈会暨理事年会并进行分享
  20. 【奇思妙想】0.1元成本柿饼派实现红外控制空调了

热门文章

  1. “双一流”本科生可得13.2万补贴!这座城市发布重磅人才新政
  2. 物体检测中的评价指标【文末赠书】
  3. windows node.js 安装
  4. Permission denied
  5. 对于模板渲染的页面,如何针对渲染出来的对象添加事件
  6. SpringMVC项目前台利用ajaxFileUpload传递图片后台接收
  7. 关于BMP格式图像的理解和读写(c++).docx
  8. Samtools(CentOS Linux)安装及常用命令详解
  9. 自动 Android* 应用测试
  10. linux进程操作命令,linux常用进程命令