HALC:用于长读取错误纠正的高吞吐量算法
背景:
第三代PacBio SMRT长读取可以有效地解决第二代测序技术的读长问题,但包含大约15%的测序错误。已经设计了几种纠错算法以有效地将错误率降低到1%,但是它们丢弃了大量未校正的碱基,因此导致低吞吐量。这种碱基损失可能会限制下游组件的完整性和分析的准确性。
结果:
在这里,我们介绍HALC,一种用于长读取错误纠正的高吞吐量算法。 HALC将长读数与来自相同物种的短读取重叠群对齐,具有相对较低的同一性要求,使得长读取区域可以与至少一个重叠区域对齐,包括其真正的基因组区域在重叠群中与其充分相似的重复序列(类似的基于重复的比对方法)。然后构建重叠图,并且对于每个长读取,引用其他长读数“比对以找到最准确的比对并用比对的重叠区域校正它(基于长读取支持的验证方法) 。
即使在重复序列中没有真实基因组区域的一些长读取区域用它们的重复进行校正,这种方法使得可以用初始不足的短读取进一步细化这些长读取区域并校正其间的未校正区域。
在我们对大肠杆菌,拟南芥和Maylandia斑马数据集的性能测试中,HALC能够比现有算法获得高出6.7-41.1%的吞吐量,同时保持相当的准确度。
因此,HALC校正的长读数可导致比现有算法长11.4-60.7%的组装重叠群。
结论:HALC软件可以从以下网站免费下载:https://github.com/lanl001/halc。
X科研网 http://www.xkeyan.com/Journal/J1045/28381259.html
转载于:https://www.cnblogs.com/wangprince2017/p/10858838.html
HALC:用于长读取错误纠正的高吞吐量算法相关推荐
- 混合和可扩展的纠错算法,用于长读的插入缺失和替换错误
混合和可扩展的纠错算法,用于长读的插入缺失和替换错误 Arghya Kusum Das, 萨彦·高斯瓦米( Sayan Goswami) 李基成& 承钟公园 BMC基因组学 卷 20,产品编号 ...
- java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊!
简单的需求 临近下班,小明忙完了今天的任务,正准备下班回家. 一条消息闪烁了起来. "最近发现公众号的拼写检查功能不错,帮助用户发现错别字,体验不错.给我们系统也做一个." 看着这 ...
- linux 硬盘错误,linux – 硬盘读取错误……停止?
我的故事很简单.我有一台轻型服务器,运行Arch Linux,它将大部分数据存储在由两个SATA驱动器组成的RAID-1上.它大约4个月没有任何问题.然后,我突然开始在其中一个驱动器上读取错误.总是, ...
- 用于长延迟多径衰落环境下的强化UF-OFDM
增强的UF-OFDM 用于长延迟多径衰落环境 Hiroto Kuriki,Keiichi Mizutani,Takeshi Matsumura和Hiroshi Harada 京都大学信息学研究科,日本 ...
- 【时序】Informer:用于长序列预测的高效 Transformer 论文笔记
论文名称:Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting 论文下载:https://a ...
- Agv、Rgv 车辆控制调度系统开发第八篇-错误纠正
Agv.Rgv 车辆控制调度系统开发第八篇-错误纠正 前言 开始写博客到现在也有一年多了,这一年多分析了调度的很多东西,我也全网搜索过,网上真正分享调度知识的基本没有,虽然我也没有把核心的代码展示出来 ...
- struts2 拦截器_Struts2 execAndWait拦截器示例,用于长时间运行的动作
struts2 拦截器 Sometimes we have long running actions where user will have to wait for final result. In ...
- win服务器物理内存占用高,win10系统长时间使用物理内存过高的解决方法
很多小伙伴都遇到过win10系统长时间使用物理内存过高的困惑吧,一些朋友看过网上零散的win10系统长时间使用物理内存过高的处理方法,并没有完完全全明白win10系统长时间使用物理内存过高是如何解决的 ...
- python 文件读取错误之FileNotFoundError: [Errno 2] No such file or directory:,顺便学习斜杠/和反斜杠\的用法
python 文件读取错误之FileNotFoundError: [Errno 2] No such file or directory:,顺便学习斜杠/和反斜杠\的用法: 最近学习文件读取和中文分词 ...
最新文章
- 商品评论html,商品评论列表.html
- 改变程序员的一本书 | 每日趣闻
- Token Bucket原理
- JSP中Request属性范围
- 95-190-730-源码-WindowFunction-窗口操作符侧的窗口函数(内部函数)
- 数据结构 判断数组元素是否互不相同
- FreeRTOS 软件定时器使用
- Scikit-learn:scikit-learn快速教程及实例
- S变化广义s变化和时频域特征-matlab
- access vba代码全部丢失_Access2016由于无法读取数据库中所含的VBA工程,因此无法打开此数据库。只有先删除VBA工程,然后才能打开数据库...
- 让你更好使用 Typescript 的11个技巧
- 第1篇 初识IPP(Integrated Performance Primitives)
- 虚拟机中可移动设备灰色 usb无法连接到客户机
- srand()和rand()函数详解
- 安卓gpio操作示例
- java日期与时间戳相互转换大全
- ROS2_foxy教程总结(自用)
- Windows10安装MG2580打印机
- 46、linux开发笔记(主线更新)
- L298N 驱动电机与单片机的线路连接图
热门文章
- (Java笔记)IO流的六类16种流方式
- 微信服务号自定义服务器配置及验证
- 惠普台式机400-321cn win8换win7操作步骤
- 使用UIImagePickerController从IPhone照片库或照相机获取图像
- ipython是_关于 IPython 的简介
- (超详细)超炫酷的ViewPager框架——MaterialViewPager使用方法详解
- 手动输入10个数字进行排序——选择排序
- FeedingFrenzy大鱼吃小鱼
- 微信域名检测拦截及其原理
- 在linux系统中 每个进程都有4GB,在Linux中,考虑到32位体系结构,将为每个进程提供4GB的虚拟地址空间...