多倍体单体型组装算法研究

喻昕  
【摘要】:人类已知的疾病都与基因有着直接或者间接的联系,研究不同个体间基因序列的差异对于了解人类的遗传,以及预防疾病等方面都有着重要的作用。SNP是单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。一个区域中倾向于以整体遗传给后代的SNP序列被称作是单体型。但受到测序技术的限制,直接通过测序得到完整的单体型序列十分困难,因此如何将测序得到的片段组装成单体型起来成为了一个新的难点。现有的单体型组装问题根据其优化原则大致有MSR,MFR,MEC等几类,这些问题绝大多数是NP-难的,多倍体单体型的组装由于其复杂的分型情况,缺乏有效的实用算法。由于新一代测序技术成本的降低和片段长度的增加,从测序片段重建多倍体基因组的多个单体型变得可行。本文提出了两个在新一代测序技术下的多倍体单体型组装算法Qhap和QChap算法。这两个算法都是基于MEC算法的改进。Qhap算法通过限制SNP矩阵中每一列的最大翻转数,大大降低了时间复杂度;同时引入了置信度分析,使得得到的单体型更加符合真实情况。对于从k-倍体基因组测序得到的片段,该算法试图将片段划分成k组,使得翻转位点的置信度分数总和最低。QChap算法是在Qhap算法的基础上,每列最大翻转个数由固定值改进为随着测序错误率和每列覆盖度变化情况而动态调整的值。在模拟和真实数据上的大量实验测试结果表明,Qhap和QChap算法可以有效地解决多倍体单体型组装问题,并且比近期的多倍体单倍型组装算法更快,更准确。

多倍体单体型组装算法研究相关推荐

  1. 基于半监督学习的单体型组装算法

    基于半监督学习的单体型组装算法 发布时间:2021-02-16 17:20 单体型组装(Haplotype Assembly)是根据测序得到的DNA片段通过各种模型算法来重建出生物个体的单体型.随着人 ...

  2. K单体型重建算法的研究

    K单体型重建算法的研究 王兆灿   [摘要]:随着新一代基因测序技术的飞速发展,以及单体型数据在人类遗传学等领域研究和应用的不断深入,对单体型数据的研究开始转向其他生物物种.由于测序技术的限制,通过生 ...

  3. 纳米孔测序高错误区域恢复率高达99%,肖传乐/刘奕志/王建新等在Nature子刊发表新校正组装算法

    纳米孔测序高错误区域恢复率高达99%,肖传乐/刘奕志/王建新等在Nature子刊发表新校正组装算法 2021-01-07 15:54 新基因组组装是基因组学最重要的任务之一.三代测序技术(PacBio ...

  4. 中国科学家研发新的全基因组组装算法

    重磅!中国科学家研发新的全基因组组装算法 2019-12-10 00:01 北京时间12月10日0时,<自然-方法学>在线发表了第一个能够跟上基因组测序产生速度的组装算法. 这篇论文只有两 ...

  5. 基于RNA测序技术的转录组从头拼接算法研究

    基于RNA测序技术的转录组从头拼接算法研究 摘要: 生物信息学主要研究分子生物学领域,而对于分子生物学领域,转录组的从头拼接又是其核心内容,即利用转录组的测序片段拼接出整个转录组中的所有表达的转录体. ...

  6. 经典算法研究系列:二、Dijkstra 算法初探

    经典算法研究系列:二.Dijkstra 算法初探  July   二零一一年一月 ====================== 本文主要参考:算法导论 第二版.维基百科. 写的不好之处,还望见谅. 本 ...

  7. 基于图机器学习的微生物网络关系预测算法研究

    龙亚辉预答辩公告 浏览次数:410日期:2021-03-19编辑:院研究生秘书 预答辩公告 论文题目 基于图机器学习的微生物网络关系预测算法研究 答辩人 龙亚辉 指导教师 骆嘉伟 答辩委员会 主席 王 ...

  8. 基于癌症基因组学数据的miRNA 功能模块识别算法研究

    题目: 基于癌症基因组学数据的miRNA 功能模块识别算法研究 摘要: 大量研究表明miRNA 的异常表达与癌症的发生.发展有关,且miRNA 通常以组合的 方式发挥其协同调控作用.因此,研究miRN ...

  9. 近期活动盘点:心电数据标注系统和深度学习诊断算法研究、2019年第六届清华大学大数据社会科学讲习班...

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: 第四期医工结合研讨会:心电数据标注系统和深度学习诊断算法研究 2019年7月11日 7月11日,"医工结合系列研讨会第四期会议: ...

最新文章

  1. 闭包,sync使用细节
  2. java序列化与深度拷贝
  3. 有效的形成传感器(执行器)的控制方式
  4. leetcode1433. 检查一个字符串是否可以打破另一个字符串(贪心算法)
  5. sphinx_Sphinx之谜:如何轻松地编写代码
  6. Java加密与解密的艺术~数字证书~模型分析
  7. Adob Flash Professional CS6发布Android手机应用报异常
  8. Theano at a Glance
  9. windows下nginx+mono+fastCGI部署asp.net网站
  10. 一页纸商业计划书 (Business Plan) 模板
  11. 十天学会单片机(1)单片机的认识、各进制、门运算、c51
  12. Bootstrap学习笔记02
  13. RMON MIB:远程监控管理信息库
  14. 一小时搭建实时数据分析平台
  15. Windows11 安装教程(Ultraiso-制作启动盘)
  16. 杂谈---令人抓狂的数据库行级锁问题
  17. python红楼梦词频统计_Python 红楼梦的字频与词频统计
  18. Revi开发 - 构件过滤器(FilteredElementCollector)
  19. js 获取日期,获取今天,昨天,前天,两天内,三天内,四天内,五天内 日期函数
  20. 放弃考研一头扎进春招,却磕得“头破血流”,这么拼值吗?

热门文章

  1. 这是马?小鹏发布可骑乘「智能马」,四不像长相太奇葩!
  2. ThinkPHP连接数据库
  3. GCLGP | 图卷积高斯过程
  4. Nat. Mach. Intel. | 突变后蛋白蛋白结合力的拓扑网络树预测模型
  5. 第三十一课.矩阵胶囊与EM路由
  6. 附录3:Pandas实例记录
  7. 小程序 a标签_微慕WordPress小程序增强版V2.0新版上线
  8. 在线作图|如何绘制一张星图
  9. 微生物组研发管理真的很难吗?
  10. QIIME 2教程. 15样品分类和回归q2-sample-classifier(2021.2)