使用RaGOO将基因组提升至染色体水平
![](/assets/blank.gif)
将染色体从contig/scaffold水平提升到chromosome水平是组装的最终目标。我们通常使用遗传图谱,光学图谱,HiC这些技术提供的信息将contig进行排序连接。
如果你组装的物种刚好有一个近源物种甚至说是同一物种,那其实我们可以直接将我们的contig比对到该基因组上,根据其提供的位置信息,将我们的contig/scaffold提高到染色体水平。RaGOO就是其中一款软件,相对于其他同类型的工具,它有以下优势
- 不错的性能(感谢minimap2)
- contig完整的排序和方向调整
- GFF lift-over
- 结构变异检测,整合了Assemblytics
- 对于每个contig都计算可信得分
RaGOO使用minimap2将contig和reference进行比对,过滤低于1k的alignment,之后根据contig的覆盖度将contig聚类到最接近的染色体上,最后根据contig在染色体上的相对位置信息进行排序合并。
RaGOO基于Python3以及预先安装的minimap2。 我们需要从Github上克隆该项目进行安装
git clone https://github.com/malonge/RaGOO.git
cd RaGOO
python setup.py install
它的使用非常简单,就两个输入文件,contig和reference的FASTA文件
ragoo.py contigs.fasta reference.fasta
一些可供修改的参数:
- e: 用于忽略reference一些序列
- -gff: 将之前contig注释的GFF文件调整为当前版本
- -b: 打断chimeric contig
- -R: 提供额外的fastq/fasta序列辅助纠正错误组装
- -T: 对应-R参数提供序列的类型, sr表示short read, corr表示纠错后的long reads
- -t: 线程数
- -g: 两个contig之间的gap大小
- -s: 分析结构变异
- -i: 最低得分用于将contig分组,默认是0.2
- -j: 哪些contig序列需要忽略
- -C: 将无法锚定的contig单独成行,而非合并成一个Chr0
几个建议: 默认线程是3,可以按照自己的需求进行提高。 如果对组装没有信心,可以加上-b -R -T
参数用来纠正潜在的错误。我强烈推荐加上-C
, 不然你会以为Chr0
也是一个染色体。
可能的输出文件如下
ragoo_output/
├── ctg_alignments: 错误纠正结果
├── groupings : 分组结果
├── orderings : 排序结果
├── pm_alns : 结构变异分析结果
└── ragoo.fasta : 你需要的输出文件
在ragoo.fasta中,默认参数下Chr0_RaGOO
表示contig.fasta的序列无法在reference.fa中定位,直接前后相连成一个序列。
个人主观评价: RaGOO使用容易,运行效率也很高,还能够分析结构变异。根据它的文章,有些时候表现还优于HiC组装结果,以后的一些基因组项目建议用上它。
![](/assets/blank.gif)
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1829-6
使用RaGOO将基因组提升至染色体水平相关推荐
- 3d-DNA的使用及juicebox调整挂载到染色体水平 | HiC辅助基因组组装(二)
定义 之前的文章中有介绍过,HiC常用的几款软件的原理内容.可以点击链接访问了解一下 在这里不做赘述. 软件安装 3d-DNA $ git clone https://hub.fastgit.org/ ...
- 使用ALLMAPS进行辅助组装得到准染色体水平基因组
使用ALLMAPS进行辅助组装 简介 在从头组装过程中,确定基因组的scaffolds/contig的顺序和朝向是重建染色体非常关键的一步.这一步可以由多种辅助组装策略完成:例如遗传图谱, Hi-C, ...
- JGG|李素华/张兴坦/李超团队在染色体水平组装马铃薯甲虫两套单倍型基因组...
点击蓝字,关注我们 作为最重要的非谷物粮食作物,马铃薯常年面临环境中各种生物胁迫,马铃薯甲虫(Leptinotarsa decemlineata Say)就是其中之一.马铃薯甲虫起源于美国和墨西哥,属 ...
- 测序故事:从框架图到染色体水平组装(一)
自然界中的微生物包括细菌.真菌.病毒.藻类等,他们无处不在,却与人类的生产生活密不可分,无论是疾病研究.还是环境污染,再到农业生产或食品发酵--看上去人类生存的各个方面都与微生物的存在与研究有着千丝万 ...
- SAP QM 通过控制图 (Control Chart) 的实现提升企业质量管理水平
SAP QM 通过控制图 (Control Chart) 的实现提升企业质量管理水平 企业日常质量活动中主要划分为QA(Quality Assurance 质量管理)以及QC(Quality Chec ...
- 【AutoML白皮书】:感知、认知、决策算法布局提升企业决策水平.pdf(附下载链接)...
大家好,我是文文(微信号:sscbg2020),今天给大家分享第四范式和Gartner于2021年1月份联合发布的白皮书<AutoML成就指数级增长:感知.认知.决策算法布局提升企业决策水平.p ...
- au回声_回声按钮如何将Amazon Alexa技能提升到新水平
au回声 by Terren Peterson 由Terren Peterson 回声按钮如何将Amazon Alexa技能提升到新水平 (How Echo Buttons take Amazon A ...
- 提升AI智能化水平,打造智慧新体验
内容来源:华为开发者大会2021 HMS Core 6 AI技术论坛,主题演讲<提升AI智能化水平,打造智慧新体验>. 演讲嘉宾:沈波,华为消费者AI与智慧全场景ML Kit产品总监 今天 ...
- 支小蜜智慧食堂刷脸支付系统,全面提升食堂管理水平
传统的学校食堂就餐高峰排队选餐.服务人员确定消费金额都非常耗时,随着支小蜜智慧食堂刷脸支付系统的新模式越来越成熟,会给更多的学校食堂带来好处.科技发展带给社会的进步是全方位的,网络的迅速崛起以及向各行 ...
最新文章
- Python,OpenCV图像金字塔cv2.pyrUp(), cv2.pyrDown()
- 洛谷【P2257】YY的GCD
- taskkill无法终止进程 拒绝访问_进程的基本概念
- atitit.jQuery Validate验证框架详解与ati Validate 设计新特性
- Python使用Pillow(PIL)库实现验证码图片
- CentOS 6.5上安装Python 2.7.9
- NodeJS Stream 五:双工流
- Python错误:'tuple' object is not callable
- 图论及其应用:第三次作业
- 【软件应用】数学公式插件TeXsword应用教程
- base64加密后字符串自动换行问题
- Oracle12C日志出现error=904怎样解决
- Java的位运算符详解实例——与()、非(~)、或(|)、异或(^)
- ocm认证年薪多少_年薪 100 万在 IT 行业中,属于什么水平 ?
- 一位码农的人生自述(四十九)------大二学年自我总结
- AS179-92LF pHEMT GaAs FET单刀双掷(SPDT)开关SKYWORKS
- High Performance Visual Tracking with Siamese Region Proposal Network全文翻译
- 音乐推荐系统搭建试验
- 云桌面系统功能参数(备忘)
- hive任务卡在个别reduce的问题分析
热门文章
- 在线办公软件测试题,办公软件知识测试题 应用软件和办公基础知识测试题.doc...
- 64位计算机连接网络打印机驱动程序,写 64 位打印机驱动程序
- HDU 4417 Super Mario(线段树)
- 软件著作权和软件专利的不同之处是什么
- leetcode-most-consistent-ways-of-dealing-with-the-series-of-stock-problems
- 淘宝补充订单个人经验、建议
- 输入年输出属相编程c语言,妙趣横生的C语言.ppt
- 难懂的操作系统--PV操作
- JEECG3.3.0配置旦米和创云短信
- 专用计算机房 设消火栓吗,你知道施工现场临时消防设施有哪些,又是怎么设置的吗?...