将染色体从contig/scaffold水平提升到chromosome水平是组装的最终目标。我们通常使用遗传图谱,光学图谱,HiC这些技术提供的信息将contig进行排序连接。

如果你组装的物种刚好有一个近源物种甚至说是同一物种,那其实我们可以直接将我们的contig比对到该基因组上,根据其提供的位置信息,将我们的contig/scaffold提高到染色体水平。RaGOO就是其中一款软件,相对于其他同类型的工具,它有以下优势

  • 不错的性能(感谢minimap2)
  • contig完整的排序和方向调整
  • GFF lift-over
  • 结构变异检测,整合了Assemblytics
  • 对于每个contig都计算可信得分

RaGOO使用minimap2将contig和reference进行比对,过滤低于1k的alignment,之后根据contig的覆盖度将contig聚类到最接近的染色体上,最后根据contig在染色体上的相对位置信息进行排序合并。

RaGOO基于Python3以及预先安装的minimap2。 我们需要从Github上克隆该项目进行安装

git clone https://github.com/malonge/RaGOO.git
cd RaGOO
python setup.py install

它的使用非常简单,就两个输入文件,contig和reference的FASTA文件

ragoo.py contigs.fasta reference.fasta

一些可供修改的参数:

  • e: 用于忽略reference一些序列
  • -gff: 将之前contig注释的GFF文件调整为当前版本
  • -b: 打断chimeric contig
  • -R: 提供额外的fastq/fasta序列辅助纠正错误组装
  • -T: 对应-R参数提供序列的类型, sr表示short read, corr表示纠错后的long reads
  • -t: 线程数
  • -g: 两个contig之间的gap大小
  • -s: 分析结构变异
  • -i: 最低得分用于将contig分组,默认是0.2
  • -j: 哪些contig序列需要忽略
  • -C: 将无法锚定的contig单独成行,而非合并成一个Chr0

几个建议: 默认线程是3,可以按照自己的需求进行提高。 如果对组装没有信心,可以加上-b -R -T参数用来纠正潜在的错误。我强烈推荐加上-C, 不然你会以为Chr0也是一个染色体。

可能的输出文件如下

ragoo_output/
├── ctg_alignments: 错误纠正结果
├── groupings     : 分组结果
├── orderings     : 排序结果
├── pm_alns       : 结构变异分析结果
└── ragoo.fasta   : 你需要的输出文件

在ragoo.fasta中,默认参数下Chr0_RaGOO表示contig.fasta的序列无法在reference.fa中定位,直接前后相连成一个序列。

个人主观评价: RaGOO使用容易,运行效率也很高,还能够分析结构变异。根据它的文章,有些时候表现还优于HiC组装结果,以后的一些基因组项目建议用上它。

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1829-6

使用RaGOO将基因组提升至染色体水平相关推荐

  1. 3d-DNA的使用及juicebox调整挂载到染色体水平 | HiC辅助基因组组装(二)

    定义 之前的文章中有介绍过,HiC常用的几款软件的原理内容.可以点击链接访问了解一下 在这里不做赘述. 软件安装 3d-DNA $ git clone https://hub.fastgit.org/ ...

  2. 使用ALLMAPS进行辅助组装得到准染色体水平基因组

    使用ALLMAPS进行辅助组装 简介 在从头组装过程中,确定基因组的scaffolds/contig的顺序和朝向是重建染色体非常关键的一步.这一步可以由多种辅助组装策略完成:例如遗传图谱, Hi-C, ...

  3. JGG|李素华/张兴坦/李超团队在染色体水平组装马铃薯甲虫两套单倍型基因组...

    点击蓝字,关注我们 作为最重要的非谷物粮食作物,马铃薯常年面临环境中各种生物胁迫,马铃薯甲虫(Leptinotarsa decemlineata Say)就是其中之一.马铃薯甲虫起源于美国和墨西哥,属 ...

  4. 测序故事:从框架图到染色体水平组装(一)

    自然界中的微生物包括细菌.真菌.病毒.藻类等,他们无处不在,却与人类的生产生活密不可分,无论是疾病研究.还是环境污染,再到农业生产或食品发酵--看上去人类生存的各个方面都与微生物的存在与研究有着千丝万 ...

  5. SAP QM 通过控制图 (Control Chart) 的实现提升企业质量管理水平

    SAP QM 通过控制图 (Control Chart) 的实现提升企业质量管理水平 企业日常质量活动中主要划分为QA(Quality Assurance 质量管理)以及QC(Quality Chec ...

  6. 【AutoML白皮书】:感知、认知、决策算法布局提升企业决策水平.pdf(附下载链接)...

    大家好,我是文文(微信号:sscbg2020),今天给大家分享第四范式和Gartner于2021年1月份联合发布的白皮书<AutoML成就指数级增长:感知.认知.决策算法布局提升企业决策水平.p ...

  7. au回声_回声按钮如何将Amazon Alexa技能提升到新水平

    au回声 by Terren Peterson 由Terren Peterson 回声按钮如何将Amazon Alexa技能提升到新水平 (How Echo Buttons take Amazon A ...

  8. 提升AI智能化水平,打造智慧新体验

    内容来源:华为开发者大会2021 HMS Core 6 AI技术论坛,主题演讲<提升AI智能化水平,打造智慧新体验>. 演讲嘉宾:沈波,华为消费者AI与智慧全场景ML Kit产品总监 今天 ...

  9. 支小蜜智慧食堂刷脸支付系统,全面提升食堂管理水平

    传统的学校食堂就餐高峰排队选餐.服务人员确定消费金额都非常耗时,随着支小蜜智慧食堂刷脸支付系统的新模式越来越成熟,会给更多的学校食堂带来好处.科技发展带给社会的进步是全方位的,网络的迅速崛起以及向各行 ...

最新文章

  1. Python,OpenCV图像金字塔cv2.pyrUp(), cv2.pyrDown()
  2. 洛谷【P2257】YY的GCD
  3. taskkill无法终止进程 拒绝访问_进程的基本概念
  4. atitit.jQuery Validate验证框架详解与ati Validate 设计新特性
  5. Python使用Pillow(PIL)库实现验证码图片
  6. CentOS 6.5上安装Python 2.7.9
  7. NodeJS Stream 五:双工流
  8. Python错误:'tuple' object is not callable
  9. 图论及其应用:第三次作业
  10. 【软件应用】数学公式插件TeXsword应用教程
  11. base64加密后字符串自动换行问题
  12. Oracle12C日志出现error=904怎样解决
  13. Java的位运算符详解实例——与()、非(~)、或(|)、异或(^)
  14. ocm认证年薪多少_年薪 100 万在 IT 行业中,属于什么水平 ?
  15. 一位码农的人生自述(四十九)------大二学年自我总结
  16. AS179-92LF pHEMT GaAs FET单刀双掷(SPDT)开关SKYWORKS
  17. High Performance Visual Tracking with Siamese Region Proposal Network全文翻译
  18. 音乐推荐系统搭建试验
  19. 云桌面系统功能参数(备忘)
  20. hive任务卡在个别reduce的问题分析

热门文章

  1. 在线办公软件测试题,办公软件知识测试题 应用软件和办公基础知识测试题.doc...
  2. 64位计算机连接网络打印机驱动程序,写 64 位打印机驱动程序
  3. HDU 4417 Super Mario(线段树)
  4. 软件著作权和软件专利的不同之处是什么
  5. leetcode-most-consistent-ways-of-dealing-with-the-series-of-stock-problems
  6. 淘宝补充订单个人经验、建议
  7. 输入年输出属相编程c语言,妙趣横生的C语言.ppt
  8. 难懂的操作系统--PV操作
  9. JEECG3.3.0配置旦米和创云短信
  10. 专用计算机房 设消火栓吗,你知道施工现场临时消防设施有哪些,又是怎么设置的吗?...