使用ALGA进行 基因组规模的从头组装 

Sylwester斯瓦特, 阿图尔·拉斯考斯基(Artur Laskowski ) 扬·巴杜拉(Jan Badura ) 沃伊切赫Frohmberg , 帕维尔·沃西乔夫斯基(Pawel Wojciechowski ) 亚历山德拉·斯威兹(Aleksandra Swiercz ) 玛塔·卡斯普扎克(Marta Kasprzak), 雅克(Jacek Blazewicz)

作者须知

生物信息学,btab005,https: //doi.org/10.1093/bioinformatics/btab005
发布时间:
2021年1月20日

抽象
动机

基于重叠图方法从头基因组组装方法很少。它被认为比所谓的de Bruijn图方法能提供更准确的结果,但所需的时间更多,内存使用量也更多。

涉及重叠图模型的组装方法不能成功地计算更大的数据集是很常见的,这主要是由于计算机的内存限制。

这就是最近几十年来主要开发基于de Bruijn的组装方法的原因,该方法快速且相当准确。但是,后一种方法可能无法对更长或更多个重复的基因组进行操作,因为它们会将读取结果分解为更短的片段,并丢失了一部分信息。仍在寻找一种用于处理大数据集并使用重叠图模型的高效汇编程序。

结果

我们提出了一个新的基因组规模的从头开始基于重叠图方法的组装程序,专为短读测序数据而设计。ALGA方法结合了一些新思想,可在短时间内产生更精确的重叠群。在这些思想中,我们创建了一个稀疏但内容丰富的图,对图进行了归约,包括引用本地子图的最小生成树问题的过程,以及遍历图和同时分析到目前为止存储的重叠群。

在基因组装配中很少见,该算法几乎没有参数,用户只能设置一个可选参数。在对六个生物体进行真实实验获得的基因组规模测序数据的测试中,将ALGA与九个最先进的汇编程序进行了比较,它们的大小,覆盖范围,GC含量和重复率不同。从基因组重建的整体质量的角度来看,ALGA产生了最佳结果,这被认为是基因组覆盖率,准确性和所得序列长度之间的良好平衡。该算法是目前已完成的波兰国家基因组图谱项目中处理数据的工具之一。

可用性

可从http://alga.put.poznan.pl获得ALGA 。

补充资料

补充材料可从在线生物信息学获得

Genome-scale de novo assembly using ALGA 使用ALGA进行 基因组规模的从头组装相关推荐

  1. Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome

    Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome 牛津纳 ...

  2. The power of single molecule real-time sequencing technology in the de novo assembly of a eukaryotic

    The power of single molecule real-time sequencing technology in the de novo assembly of a eukaryotic ...

  3. Tools and Strategies for Long-Read Sequencing and De Novo Assembly of Plant Genomes

    Tools and Strategies for Long-Read Sequencing and De Novo Assembly of Plant Genomes 用于植物基因组长读测序和从头组装 ...

  4. de novo assembly是新的基因组装配

    de novo assembly是新的基因组装配,(de novo 的意思是全新,assembly是序列拼接),即在没有参考序列的情况下进行序列拼接,对未知基因组序列进行测序,利用生物信息学分析手段, ...

  5. Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads

    Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads 混合和非混合方法对nanopore ...

  6. Hybrid error correction and de novo assembly of single-molecule sequencing reads

    Hybrid error correction and de novo assembly of single-molecule sequencing reads 混合误差校正和重新组装的单分子测序读取 ...

  7. MECAT: fast mapping,error correction, and de novo assembly for single-molecule sequencing reads

    MECAT: fast mapping,error correction, and de novo assembly for single-molecule sequencing reads MECA ...

  8. Improved long read correction for de novo assembly using an FM-index

    改进了使用FM索引的从头组装的长读校正 摘要 长读测序正在改变基因组研究的前景,特别是从头组装.尽管长读技术固有的高错误率,增加的读长极大地提高了基因组装配的连续性和准确性.然而,这些技术的成本和产量 ...

  9. Efficient Hybrid De Novo Error Correction and Assembly for Long Reads

    Efficient Hybrid De Novo Error Correction and Assembly for Long Reads       长read的高效的混合从头纠错和装配 Abstr ...

最新文章

  1. svn 第一次使用注意事项
  2. 解读:为什么要做特征归一化/标准化?
  3. 爬虫为什么用Chrome?
  4. Geek的入门神器:micropython-能跑python的stm32开发板
  5. 编译安装Centos7.2+Apache2.4.25+PHP7.2.10+Mysql5.6.16
  6. PyTorch中使用指定的GPU
  7. GC算法 垃圾收集器
  8. 频率统计表用c语言_空间矢量脉宽调制建模与仿真(基于C语言的SIMULINK仿真模型 | 基于SVPWM模块的仿真)...
  9. 中缅边境电信网络诈骗活动严重区域微信、支付宝等被封停
  10. 初级学电脑计算机的入门知识,电脑基础知识入门学习(小白学好电脑从哪里开始)...
  11. WRF-ChemV4.0安装
  12. 触屏查看大图(可以缩放)
  13. cadlisp框选打印_在CAD中实现批量打印
  14. 51定时器PWM调节
  15. 内部敌人中文 android,幽浮:内部敌人(含数据包)
  16. OpenJ_Bailian - 2714 求平均年龄
  17. upload.js 文件图片上传
  18. Flash之SM25QH128M、JFM25F32A读写操作FPGA Verilog实现
  19. 台湾云门舞集今年将赴北京、上海等地巡演
  20. 阿里巴巴python招聘_python阿里巴巴招聘网站爬虫

热门文章

  1. donsker定理_中心极限定理和Donsker定理
  2. python有什么用处案例_用实例解释Python中的继承和多态的概念
  3. CVPR2021|基于双边扩充和自适应融合方法的点云语义分割网络
  4. c语言通过域组策略下发软件,windows 2008 server 域环境通过组策略下发计划任务(示例代码)...
  5. SpringMVC 多视图配置
  6. RDKit | 基于RDKit从分子中提取3D药效团特征
  7. RDKit | 分子处理入门
  8. spell_picture第三版终于摆脱了命令行的操作
  9. java和c 的rsa加密算法_RSA算法签名技术Java与C++统一(加密解密结果一样)
  10. 福建农林大学朱方捷组招聘讲师/副教授/助理——生信分析方向