LoRDEC: a tool for correcting errors in long sequencing reads

Eric Rivals

21st August 2015

Abstract for keynote presentation at “German Conference in Bioinformatics”, Dortmund, Germany

Address: Laboratoire d’Informatique de Microélectronique et de Robotique de Montpellier (LIRMM) and Institute of Computational Biology (IBC)

CNRS and Université de Montpellier, France – http://www.lirmm.fr/˜rivals/

High-throughput DNA/RNA sequencing is a routine experiment in molecular biology and life sciences in general. For instance, it is increasingly used in the hospital as a key procedure of personalized medicine. Compared to the second generation, third generation sequencing technologies produce longer reads with comparatively lower throughput and higher error rate. Those errors include substitutions, indels, and they hinder or at least complicate downstream analysis like mapping or de novo assembly. However, these long read data are often used in conjunction with short reads of the 2nd generation.

I will present a hybrid strategy for correcting the long reads using the short reads that we introduced last year. Unlike existing error correction tools, ours, called LoRDEC, avoids aligning short reads on long reads, which is computationally intensive. Instead, it takes advantage of a succinct graph to represent the short reads, and compares long reads to paths in the graph. Experiments show that LoRDEC outperforms existing methods in running time and memory while achieving a comparable correction performance. It can correct both Pacific Biosciences and MinION reads from Oxford Nanopore.

LoRDEC is available at http://atgc.lirmm.fr/lordec; joint work with L. Salmela and A. Makrini

高通量DNA/RNA测序是分子生物学和生命科学的常规实验。

例如,它越来越多地作为个性化医疗的关键程序在医院中使用。

与第二代测序技术相比,第三代测序技术的读取时间更长,吞吐量更低,出错率更高

这些错误包括替换、插入,它们妨碍或至少使下游分析(如映射或从头组装)复杂化。然而,这些长读数据通常与第二代的短读一起使用。我将提出一种混合策略,使用我们去年引入的短读来纠正长读。

与现有的纠错工具不同,我们的LoRDEC避免了长读和短读之间的对齐,这需要大量的计算。相反,它利用简洁的图来表示短读,并将长读与图中的路径进行比较。实验表明,LoRDEC在运行时间和内存方面优于现有的方法,同时获得了相当的校正性能。它可以纠正太平洋生物科学和MinION读取牛津纳米孔。

LoRDEC: a tool for correcting errors in long sequencing reads 纠正长序列读取错误的工具相关推荐

  1. CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读

    CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读 Motivation: 第二代测序技术为测序基因 ...

  2. 网络错误修复工具:Network Fault Repair Tool Build20160414

    网络错误修复工具:Network Fault Repair Tool Build20160414 1 ::请勿轻易修改此文件,以避免不可预知的错误 gwsbhqt@163.com 2 3 @echo ...

  3. [Tool]分享一款好用的截频、截图、贴图工具

    分享一款好用的截频.截图.贴图工具 前言:写论文的时候是不是一边打开word码字,同时也需要在PDF和浏览器中查找资料,但是面对一个笔记本的小屏幕是不是会觉得屏幕不够用,分屏显示字体太小,不分屏也同时 ...

  4. 三代测序纠错软件汇总篇

    三代测序纠错软件汇总篇 原创: 李海滨 诺禾科服 2017-12-21 在之前推出的一篇微信中,已经介绍过了三代测序下机数据"三代全长转录组测序常见问题说明".那么我们拿到数据后是 ...

  5. Accurate self-correction of errors inlong reads using de Bruijn graphs LoRMA使用de Bruijn图对长read中的错误

    Accurate self-correction of errors inlong reads using de Bruijn graphs               LoRMA使用de Bruij ...

  6. 混合和可扩展的纠错算法,用于长读的插入缺失和替换错误

    混合和可扩展的纠错算法,用于长读的插入缺失和替换错误 Arghya Kusum Das, 萨彦·高斯瓦米( Sayan Goswami) 李基成& 承钟公园 BMC基因组学 卷 20,产品编号 ...

  7. Improved long read correction for de novo assembly using an FM-index

    改进了使用FM索引的从头组装的长读校正 摘要 长读测序正在改变基因组研究的前景,特别是从头组装.尽管长读技术固有的高错误率,增加的读长极大地提高了基因组装配的连续性和准确性.然而,这些技术的成本和产量 ...

  8. Java 编程要点之并发(Concurrency)详解

    本文同步至 http://www.waylau.com/essential-java-concurrency 计算机用户想当然地认为他们的系统在一个时间可以做多件事.他们认为,他们可以工作在一个字处理 ...

  9. Denoising DNA deep sequencing data—high-throughput sequencing errors and their correction

    去噪DNA深度测序数据,高通量测序误差及其校正 Abstract 描述常见高通量测序平台产生的错误并从技术人工制品中识别出真正的遗传变异是两个相互依赖的步骤,对许多分析如单核苷酸变异调用.单倍型推断. ...

最新文章

  1. 不用“背”单词,一个方法从普通二本到哥伦比亚大学:我是如何做到的?
  2. 【java网络编程】用TCP socket实现多线程图片上传
  3. 微型php框架 include/mysql.class.php
  4. 张量的通俗理解和计算
  5. 程序编码应保持良好的规范(C#)
  6. Effective C++ 第二版 1)const和inline 2)iostream
  7. git远程仓库的使用
  8. Android控件Gallery3D效果
  9. matlab调用kmeans_Matlab中Kmeans函数的使用
  10. 7天刷完剑指offer(一)
  11. python实现wifi自动连接,解决电脑wifi经常断开的问题
  12. perl and LWP 文档
  13. 什么是https证书?
  14. 屏幕录像软件有哪些?操作简单的屏幕录像方法推荐
  15. socket是什么?有什么作用?
  16. 问:未来5年的IT互联网行业,就业形势会是什么样的?
  17. 华硕主板如何设置开机自启_华硕主板开机启动项调整的三种方法
  18. Android或者Windows Phone在HTTP调用Google Map Api时返回英文结果的解决方法
  19. 批量修改文件后缀名,文件名
  20. Unity 2D游戏开发案例学习——Robble Swifthand(下)

热门文章

  1. 全球首个开源图像识别系统上线了!人脸、商品、车辆识别一网打尽!
  2. 第八期直播《立体视觉之立体匹配理论与实战》精彩回录
  3. Nat. Commun. | msiPL:质谱数据分析的新工具
  4. 第二十七课.深度强化学习(二)
  5. 怎么用linux设计一个小程序,“Linux”小程序发布一个月后,我们发现了什么
  6. 应用心理学跨考计算机难不难,跨专业心理学考研难不难 主要学什么
  7. php写网页6,基于ThinkPHP6+AdminLTE框架开发的响应式企业网站CMS系统PHP源码,ThinkPHP6开发的后台权限管理系统...
  8. 做工程师不懂这七点,难怪你总是混不好
  9. 在线作图丨数据降维方法⑥——消除趋势对应分析(Detrended correspondence analysis, DCA)
  10. Microbiome:Kraken2进行16S物种注释又快又准