背景

串联重复序列作为基因组重排研究的热点之一,对遗传疾病的遗传背景有着重要的影响。许多用于参考序列串联重复检测的方法获得了高质量的结果。但是,在de novo上下文中,没有可用的参考序列,串联重复检测仍然是一个难题。用第二代测序方法获得的短序列长度不足以跨越包含长重复的区域。这种长度限制是通过第三代测序平台(如太平洋生物科学技术公司)获得的长读来解决的。尽管如此,读取长度的增加伴随着明显的错误率的增加。当前长读研究的主要目标是处理高达16%的高错误率。

方法

在这篇论文中,我们提出了MixTaR,这是第一个串联重复检测的从头开始的方法,它结合了高质量的短读和大长度的长读。我们的混合算法使用一组短读来进行基于de Bruijn图的串联重复模式检测。然后使用长读验证这些模式,并使用局部贪婪程序集构造串联重复序列。结果混合焦油测试与模拟和实际读数从复杂的生物体。为了完整地分析它对错误的鲁棒性,我们使用不同错误率的短读和长读。然后根据检测到的串联重复的数量及其模式的长度对结果进行分析。

结论

该方法具有较高的精度和灵敏度。MixTaR的假阳性率很低,即使是高度错误的读取,它也能够检测出精确的串联重复,模式长度在显著的间隔内变化。

Hybrid de novo tandem repeat detection using short and long reads 使用短读和长读的混合从头到尾串联重复检测相关推荐

  1. Efficient Hybrid De Novo Error Correction and Assembly for Long Reads

    Efficient Hybrid De Novo Error Correction and Assembly for Long Reads       长read的高效的混合从头纠错和装配 Abstr ...

  2. CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读

    CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读 Motivation: 第二代测序技术为测序基因 ...

  3. LoRDEC:hybrid correction of long reads 长读的混合校正

    LoRDEC是2014年在法国蒙彼利埃大学的CNRS与赫尔辛基大学(芬兰)的Leena Salmela合作开发的一种生物信息学软件. LoRDEC处理来自第二代和第三代高通量测序仪的数据.这些数据称为 ...

  4. Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads

    Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads 混合和非混合方法对nanopore ...

  5. Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome

    Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome 牛津纳 ...

  6. Hybrid error correction and de novo assembly of single-molecule sequencing reads

    Hybrid error correction and de novo assembly of single-molecule sequencing reads 混合误差校正和重新组装的单分子测序读取 ...

  7. 一文搞定细菌基因组De Novo测序分析

    本文转自基因的生物信息学分析,链接 https://mp.weixin.qq.com/s/xWOlv5WVJ7LwTuRQDXmGzg 以一个细菌的测序数据为例子,介绍细菌基因组测序分析流程.本次实验 ...

  8. de novo转录组 流程_AI-De Novo分子设计

    de novo转录组 流程 大海捞针 (Needle in a Haystack) On average, it takes ten years and costs $2.6 billion doll ...

  9. Tools and Strategies for Long-Read Sequencing and De Novo Assembly of Plant Genomes

    Tools and Strategies for Long-Read Sequencing and De Novo Assembly of Plant Genomes 用于植物基因组长读测序和从头组装 ...

最新文章

  1. 发送IP和MAC地址的方法
  2. Python学习笔记:虚拟环境和包
  3. 跟燕十八学习PHP-第十九天-热身项目完善
  4. PostgreSQL学习笔记3之表的继承和分区
  5. linux重置root密码
  6. Taro+react开发(73):Taro.createSelectorQuery
  7. C++继承详解:共有(public)继承,私有(private)继承,保护(protected)继承
  8. navicat for mysql 用户_Navicat for MySQL 怎么/怎么添加管理用户?Navicat for MySQL 添加管理用户教程_37游游网...
  9. word2vec相似度计算_干货|文本相似度计算
  10. php get获取cookie值,golang web开发获取get、post、cookie参数
  11. NHibernate视频教程
  12. mysql 5.0 慢日志_MySQL的慢查询日志
  13. python实现bt下载器_10行 Python代码使用磁力链接批量下载种子
  14. Qt 弹出对话框选择图片并显示
  15. 利用FDTD进行超表面的仿真(一)——验证PB相位和转换效率的计算
  16. Global Illumination_Screen-Space Directional Occlusion(SSDO)
  17. 关于MySQL联合索引和优化军规
  18. iReport制作报表
  19. 计算机桌面图片唐诗,自动唐诗宋词桌面壁纸
  20. Android安装node js,如何在安卓手机上安装nodejs

热门文章

  1. catkin_make后输出:No module named ‘catkin_pkg‘
  2. 李飞飞团队最新论文:基于anchor关键点的类别级物体6D位姿跟踪
  3. Keras中神经网络可视化模块keras.utils.vis_util 的安装
  4. GaussianView5对分子结构.gjf文件的解读
  5. 用Selenium 爬虫下载文件,解除Chrome 下载警告 (Keep or Discard),设置下载目录的方法
  6. NetLogo入门(一)——熟悉操作界面
  7. linux进程操作命令,linux常用进程命令
  8. Microbiome:芝麻菜中肠杆菌科主导核心微生物组并贡献抗生素抗性组(简单套路16S+meta+培养组发高分文章)
  9. 扩增子分析解读4去嵌合体,非细菌序列,生成代表性序列和OTU表
  10. pandas使用dropna函数删除dataframe中全是缺失值的数据列(drop columns with all missing values in dataframe)