Hybrid de novo tandem repeat detection using short and long reads 使用短读和长读的混合从头到尾串联重复检测
背景
串联重复序列作为基因组重排研究的热点之一,对遗传疾病的遗传背景有着重要的影响。许多用于参考序列串联重复检测的方法获得了高质量的结果。但是,在de novo上下文中,没有可用的参考序列,串联重复检测仍然是一个难题。用第二代测序方法获得的短序列长度不足以跨越包含长重复的区域。这种长度限制是通过第三代测序平台(如太平洋生物科学技术公司)获得的长读来解决的。尽管如此,读取长度的增加伴随着明显的错误率的增加。当前长读研究的主要目标是处理高达16%的高错误率。
方法
在这篇论文中,我们提出了MixTaR,这是第一个串联重复检测的从头开始的方法,它结合了高质量的短读和大长度的长读。我们的混合算法使用一组短读来进行基于de Bruijn图的串联重复模式检测。然后使用长读验证这些模式,并使用局部贪婪程序集构造串联重复序列。结果混合焦油测试与模拟和实际读数从复杂的生物体。为了完整地分析它对错误的鲁棒性,我们使用不同错误率的短读和长读。然后根据检测到的串联重复的数量及其模式的长度对结果进行分析。
结论
该方法具有较高的精度和灵敏度。MixTaR的假阳性率很低,即使是高度错误的读取,它也能够检测出精确的串联重复,模式长度在显著的间隔内变化。
Hybrid de novo tandem repeat detection using short and long reads 使用短读和长读的混合从头到尾串联重复检测相关推荐
- Efficient Hybrid De Novo Error Correction and Assembly for Long Reads
Efficient Hybrid De Novo Error Correction and Assembly for Long Reads 长read的高效的混合从头纠错和装配 Abstr ...
- CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读
CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通过映射短读来纠正长读 Motivation: 第二代测序技术为测序基因 ...
- LoRDEC:hybrid correction of long reads 长读的混合校正
LoRDEC是2014年在法国蒙彼利埃大学的CNRS与赫尔辛基大学(芬兰)的Leena Salmela合作开发的一种生物信息学软件. LoRDEC处理来自第二代和第三代高通量测序仪的数据.这些数据称为 ...
- Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads
Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads 混合和非混合方法对nanopore ...
- Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome
Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome 牛津纳 ...
- Hybrid error correction and de novo assembly of single-molecule sequencing reads
Hybrid error correction and de novo assembly of single-molecule sequencing reads 混合误差校正和重新组装的单分子测序读取 ...
- 一文搞定细菌基因组De Novo测序分析
本文转自基因的生物信息学分析,链接 https://mp.weixin.qq.com/s/xWOlv5WVJ7LwTuRQDXmGzg 以一个细菌的测序数据为例子,介绍细菌基因组测序分析流程.本次实验 ...
- de novo转录组 流程_AI-De Novo分子设计
de novo转录组 流程 大海捞针 (Needle in a Haystack) On average, it takes ten years and costs $2.6 billion doll ...
- Tools and Strategies for Long-Read Sequencing and De Novo Assembly of Plant Genomes
Tools and Strategies for Long-Read Sequencing and De Novo Assembly of Plant Genomes 用于植物基因组长读测序和从头组装 ...
最新文章
- 发送IP和MAC地址的方法
- Python学习笔记:虚拟环境和包
- 跟燕十八学习PHP-第十九天-热身项目完善
- PostgreSQL学习笔记3之表的继承和分区
- linux重置root密码
- Taro+react开发(73):Taro.createSelectorQuery
- C++继承详解:共有(public)继承,私有(private)继承,保护(protected)继承
- navicat for mysql 用户_Navicat for MySQL 怎么/怎么添加管理用户?Navicat for MySQL 添加管理用户教程_37游游网...
- word2vec相似度计算_干货|文本相似度计算
- php get获取cookie值,golang web开发获取get、post、cookie参数
- NHibernate视频教程
- mysql 5.0 慢日志_MySQL的慢查询日志
- python实现bt下载器_10行 Python代码使用磁力链接批量下载种子
- Qt 弹出对话框选择图片并显示
- 利用FDTD进行超表面的仿真(一)——验证PB相位和转换效率的计算
- Global Illumination_Screen-Space Directional Occlusion(SSDO)
- 关于MySQL联合索引和优化军规
- iReport制作报表
- 计算机桌面图片唐诗,自动唐诗宋词桌面壁纸
- Android安装node js,如何在安卓手机上安装nodejs
热门文章
- catkin_make后输出:No module named ‘catkin_pkg‘
- 李飞飞团队最新论文:基于anchor关键点的类别级物体6D位姿跟踪
- Keras中神经网络可视化模块keras.utils.vis_util 的安装
- GaussianView5对分子结构.gjf文件的解读
- 用Selenium 爬虫下载文件,解除Chrome 下载警告 (Keep or Discard),设置下载目录的方法
- NetLogo入门(一)——熟悉操作界面
- linux进程操作命令,linux常用进程命令
- Microbiome:芝麻菜中肠杆菌科主导核心微生物组并贡献抗生素抗性组(简单套路16S+meta+培养组发高分文章)
- 扩增子分析解读4去嵌合体,非细菌序列,生成代表性序列和OTU表
- pandas使用dropna函数删除dataframe中全是缺失值的数据列(drop columns with all missing values in dataframe)