quast 的结果怎么看

The assembly algorithms that have been developed so far intend to provide better assemblies evaluated under different criteria. Hence, depending on the specific scenario the assembly process might produce better results if we use the most appropriate assembler. Even though contiguous genomes may not be produced, segments from the reference genomes can be obtained using existing assembly methods. Therefore, the need to evaluate the quality of assemblies exists. These evaluations help researchers to pick different assemblers for different scenarios.

到目前为止已开发的组装算法旨在提供在不同标准下评估的更好的组装。 因此,根据具体情况,如果使用最合适的汇编程序,则汇编过程可能会产生更好的结果。 即使可能不会产生连续的基因组,也可以使用现有的组装方法从参考基因组中获得片段。 因此,存在评估装配质量的需求。 这些评估有助于研究人员针对不同的情况选择不同的组装商。

How can we know whether the assemblies we obtain from reads using currently available assemblers are correct or not? In this article, we will see how to determine the quality of assemblies using QUAST, which is one of the most famous assessment tools available for genome assemblies. Let’s get started.

我们如何知道我们使用当前可用的汇编程序读取的汇编程序是否正确? 在本文中,我们将看到如何使用QUAST来确定装配的质量, QUAST是可用于基因组装配的最著名的评估工具之一。 让我们开始吧。

什么是QUAST? (What is QUAST?)

QUAST stands for QUality Assessment Tool. QUAST can evaluate assemblies using reference genomes, as well as without reference genomes. QUAST produces detailed reports, tables and plots which show the different aspects of assemblies.

QUAST代表质量评估工具。 QUAST可以使用参考基因​​组以及不使用参考基因​​组来评估装配。 QUAST生成详细的报告,表格和图解,以显示装配的不同方面。

下载QUAST (Download QUAST)

You can go to the official website of QUAST and click on the DOWNLOAD button.

您可以访问QUAST的官方网站,然后单击“ 下载”按钮。

You will be directed to a SOURCEFORGE download page from where you can download the latest version (quast-5.0.2 when I was writing this article) of QUAST. The pre-compiled binaries will be downloaded and you can run it straight away after extracting.

您将被引导到SOURCEFORGE下载页面,从该页面可以下载QUAST的最新版本(我写本文时为quast-5.0.2 )。 预编译的二进制文件将被下载,提取后您可以立即运行它。

tar -xf quast-5.0.2.tar.gzcd quast-5.0.2quast.py

You can see the following after executing quast.py or python quast.py.

执行quast.pypython quast.py之后,您可以看到以下python quast.py

QUAST: Quality Assessment Tool for Genome AssembliesVersion: 5.0.2Usage: python quast.py [options] <files_with_contigs>Options:-o  --output-dir  <dirname>       Directory to store all result files [default: quast_results/results_<datetime>]-r                <filename>      Reference genome file-g  --features [type:]<filename>  File with genomic feature coordinates in the reference (GFF, BED, NCBI or TXT)                                  Optional 'type' can be specified for extracting only a specific feature type from GFF-m  --min-contig  <int>           Lower threshold for contig length [default: 500]-t  --threads     <int>           Maximum number of threads [default: 25% of CPUs]These are basic options. To see the full list, use --helpOnline QUAST manual is available at http://quast.sf.net/manual

Once you have ensured that QUAST is running correctly, we can start to assess some assemblies.

一旦您确保QUAST正确运行,我们就可以开始评估一些程序集。

获取示例程序集 (Obtaining an Example Assembly)

We will be using the example dataset used in the Flye assembler. The example dataset consists of reads of an E. coli genome (Escherichia coli str. K-12 substr. MG1655 with NCBI accession number CP009685). The reads consist of PacBio reads.

我们将使用Flye汇编器中使用的示例数据集 。 该示例数据集由大肠杆菌基因组( 大肠杆菌序列K-12,子级MG1655,NCBI登录号CP009685 )的读段组成。 读取包括PacBio读取。

You can download the dataset with reads using the following command.

您可以使用以下命令下载读取的数据集。

wget https://zenodo.org/record/1172816/files/E.coli_PacBio_40x.fasta

Let’s assemble this dataset using the Flye assembler.

让我们使用Flye汇编器汇编此数据集。

flye --pacbio-raw E.coli_PacBio_40x.fasta --out-dir my_assembly --threads 8

Now we have an example assembly. The contigs of the final assembly can be found in the file assembly.fasta. Let’s see how good the quality of the assembly is.

现在我们有一个示例程序集。 最终程序集的重叠群可以在文件assembly.fasta找到。 让我们看看装配的质量如何。

使用QUAST (Using QUAST)

You can run QUAST by providing the contigs file containing the final assembly and the reference genome.

您可以通过提供包含最终装配和参考基因组的重叠群文件来运行QUAST。

quast.py 

Now you can view the final report from the report.html file in the output folder.

现在,您可以从输出文件夹中的report.html文件中查看最终报告。

You can also compare multiple assemblies (assemly1.fasta and assembly2.fasta) as shown. You can specify labels for each assembly as well.

您还可以比较多个程序集( assemly1.fastaassembly2.fasta ),如图所示。 您也可以为每个装配指定标签。

quast.py assemly1.fasta assembly2.fasta -l label1,label2 -r ref.fasta -o quastResult

QUAST report for two assemblies
两个程序集的QUAST报告

You can note the following common evaluation measures that are used to assess the quality of genomes.

您可以注意到以下用于评估基因组质量的常见评估方法。

  • Genome fraction基因组分数
  • Largest alignment最大对齐
  • NGA50NGA50
  • LGA50LGA50
  • Number of misassemblies组装数量
  • Number of contigs重叠群数

QUAST provides sample explanations for each of these measures. You can hover over each measure and a popup message will be shown with the explanation.

QUAST提供了每种措施的样本说明。 您可以将鼠标悬停在每个小节上,并显示一条弹出消息和说明。

You can also assess your assembly without providing any reference genomes.

您也可以在不提供任何参考基因组的情况下评估装配。

quast.py 

Your result will contain details of the statistics without any references such as,

您的结果将包含统计信息的详细信息,而无需任何参考,例如,

  • Number of contigs重叠群数
  • Largest contig最大重叠群
  • Total length总长度
  • N50N50
  • L50L50
QUAST report for Flye assembly of E. coli dataset without reference
没有参考的大肠杆菌数据集Flye装配的QUAST报告

Icarus Contig浏览器 (Icarus Contig Browser)

Icarus is a tool available within QUAST which can visualise assemblies for analytical purposes.

Icarus是QUAST中提供的工具,可以可视化程序集以进行分析。

Icarus contig browser
Icarus contig浏览器

You can view how well your assembly aligns with the reference genome.

您可以查看装配体与参考基因组的对齐程度。

MetaQUAST:用于元基因组学大会的QUAST (MetaQUAST: QUAST for Metagenomics Assemblies)

QUAST provides a version named MetaQUAST, that allows us to assess metagenomics assemblies. You can provide multiple assemblies and compare them at once. Moreover, you can provide multiple reference genomes as well.

QUAST提供了一个名为MetaQUAST的版本,它使我们能够评估宏基因组学程序集。 您可以提供多个程序集并一次比较它们。 此外,您还可以提供多个参考基因组。

You can run MetaQUAST as follows.

您可以按以下方式运行MetaQUAST。

metaquast.py meta.contigs1.fasta meta.contigs2.fasta -l label1,label2 -R References/ -t 8 -o metaquastResult

Similar to QUAST, you can provide labels for each assembly so that they will be displayed in the final report. Moreover, you can provide a single folder containing all the reference genomes for the assessment.

与QUAST相似,您可以为每个部件提供标签,以便它们将显示在最终报告中。 此外,您可以提供一个包含所有参考基因组的文件夹,用于评估。

MetaQUAST report for three assemblies with multiple references
具有多个引用的三个程序集的MetaQUAST报告

最后的想法 (Final Thoughts)

Hope you found this article useful and informative as a starting point towards using quality assessment tools for genome assemblies. Feel free to use these tools for your projects and research work as they are freely available.

希望您发现这篇文章对将质量评估工具用于基因组装配的起点是有用的,并且是有益的。 您可以免费使用这些工具来进行项目和研究工作。

Cheers, and stay safe!

干杯,保持安全!

You can read my previous articles related to bioinformatics and DNA analysis.

您可以阅读我以前有关生物信息学和DNA分析的文章。

翻译自: https://medium.com/computational-biology/assessing-the-quality-of-genome-assemblies-using-quast-94fec3f8cb70

quast 的结果怎么看


http://www.taodudu.cc/news/show-2524315.html

相关文章:

  • LVM与磁盘配额
  • K8S资源quota配置引起的问题
  • 基于 ClickHouse OLAP 的生态:构建基于 ClickHouse 计算存储为核心的“批流一体”数仓体系...
  • Android应用内存管理机制
  • linux内核 quota,Linux系统磁盘配额(quota)
  • Ubuntu服务器用户磁盘空间quota分配
  • Greenplum 6 磁盘配额管理工具“Diskquota”
  • oracle创建用户'表空间配额,牛刀小试:Oracle 用户表空间配额(quota )控制之随心所欲...
  • 定时任务调度框架Quartz
  • linux磁盘管理——quota磁盘配额GPT分区
  • TiDB学习笔记(七)-数据库系统优化
  • mysql用户配额_Oracle 用户对表空间配额quota说明
  • 容器学习笔记之CPU Cgroup
  • 配置linux磁盘配额前,Linux磁盘配额Quota配置详解
  • 前台获取model中的值,json数据,json字符串,双引号变为 ‘ quto;‘
  • Linux——系统磁盘管理与文件系统
  • linux quota原理,[转载]linux下quota实现
  • ceph 运维操作 - POOL
  • Linux内核-CFS调度下带宽控制(Bandwidth Control)
  • Linux 磁盘管理 高级篇 -- quota,RAID,LVM
  • quato的使用
  • 数值分析实验(四)之方程求根的数值方法
  • 数值方法
  • (三)描述统计学:数值方法
  • 解决执行hive语句时出现虚拟内存不够的问题
  • vue3+vant Failed to resolve import “E:/code3/jianmu-user-yd/node_modules/vant/lib/vant/es/icon/style
  • Qt中出现 exited with code 3错误的其中之一原因
  • Code3Kingdom - Tech Support
  • SLAM学习笔记(Code3)----Eigen库中的Geometry
  • 强化学习#code3

quast 的结果怎么看_使用quast评估基因组装配的质量相关推荐

  1. sip 时序图_时序图怎么看_教你如何看懂时序图 - 什么是时序图_时序图怎么看_教你如何看懂时序图...

    时序图怎么看_教你如何看懂时序图 操作时序永远使用是任何一片IC芯片的最主要的内容.一个芯片的所有使用细节都会在它的官方器件手册上包含.所以使用一个器件事情,要充分做好的第一件事就是要把它的器件手册上 ...

  2. python123判断火车票座位号分布图_火车票座位号怎么看_火车票座位号分布图

    火车票座位号怎么看是坐在哪里的?相信很多网友们不清楚,下面愚蠢的地球人为你带来这一问题的答案.相信在看完本篇文章之后,火车票座位号怎么看是坐在哪里的?一定不会再成为你的问题了. 火车票座位号怎么看_火 ...

  3. 腾讯视频下载后为什么还需联网看_腾讯视频如何下载离线视频

    今天播放器家园网分享一下腾讯视频下载后为什么还需联网看_腾讯视频如何下载离线视频,希望可以帮助大家.腾讯视频有很多小功能是其他播放器没有的,大家可以下载后慢慢探索一下,小编非常喜欢的一个功能就是看电视 ...

  4. 随心测试_软测基础_004职责与质量

    接上篇续,依据_软测基础体系:<依据不同的测试对象,选取适合的方法,按照设计的流程完成测试工作,检验整个过程是否达到测试的目的>."学以致用",实践于工作职责 常见面试 ...

  5. ip地址合不合法怎么看_到底醇基燃料合不合法呢?

    什么是醇基燃料?醇基燃料合不合法?投资醇基燃料或者自己用有没得回报呢? 新能源环保燃料油配方_醇基燃料厂家加盟-四川新源素科技有限公司​www.xysu.net 什么是醇基燃料 醇基液体燃料主要是以甲 ...

  6. python基础教程怎么看_八、给小白看的第一篇Python基础教程

    本文是第一篇,一共四篇打下Python基础 「@Author:Runsen」 「@Date:Writern By 2019/04/15 and supplied By 2020/3/31」 「@公众号 ...

  7. Python中正则表达式用法 重点格式以这个为准_首看_各种问题

    20210811 https://www.jb51.net/article/101258.htm 一.惰性模式的概念: 此模式和贪婪模式恰好相反,它尽可能少的匹配字符以满足正则表达式即可,例如: va ...

  8. amos看拟合度在哪里看_小程序开发公司哪里强?看这几点

    如今小程序开发已不罕见,越来越多的线下商家需要布局线上渠道,小程序是一个非常好的选择.但是,对于不懂任何技术.也没有自身技术团队的小白而言,若想拥有自己的小程序,就需要找靠谱的微信小程序开发公司,但是 ...

  9. er图主码外码怎么看_霸屏了!因为这个老师,广科er纷纷表示要转专业了

    今天广科er的朋友圈被霸屏了!!!科科发现原来同学们在疯狂刷屏的是这位有着"神仙颜值"的帅气老师!据了解,这位老师名叫陈磊 本科毕业于湖南科技学院的英语专业 研究生毕业于华侨大学的 ...

  10. q函数表格怎么看_会计表格函数玩不会?超实用会计表格函数公式大全,财务人都在用...

    Excel函数公式可以说是用的比较方便的,很多会计人员都喜欢用函数公式来进行处理日常财务表格.但是很多新手会计人员都会时不时地吐槽:会计表格所涉及到的Excel函数公式记不住不会用呀,还经常会加班到很 ...

最新文章

  1. MySQL语言的算法_MySQL知识整理
  2. 领航的公开课 有空可以看看
  3. MSN即将退役,即时通讯开放平台成趋势
  4. EditPlus自定义模板
  5. Hadoop集群安装部署_分布式集群安装_01
  6. C++的C4305和C4800的编译警告
  7. paip.tree 生成目录树到txt后的折叠查看
  8. 通达信 移动平均算法_通达信擒龙攻防战法主图指标公式
  9. 解决WINDOWS2008上不识别EMULEX COE 11102万兆卡的问题
  10. hp服务器增加raid卡,HP服务器增加硬盘实施方案
  11. Oracle PeopleSoft 登录,peoplesoft不能登录DB解决方法
  12. 基于动态时间规整算法(DTW)的语音识别技术研究-含Matlab代码
  13. 简明GISer Python学习指南
  14. arduino dht11 传感器实现
  15. Pandas数据视图 — groupby 和 pivot
  16. c语言:赋值运算符与赋值表达式
  17. 分享下剪辑师必须知道的13个剪辑技巧!
  18. 土豆网前任CTO开无人便利店,半年达500家
  19. Android屏幕锁定详解(一)
  20. [Python]PDF文件与图片转换(PyMuPDF)及转PPT

热门文章

  1. urllib实现请求发送(python3)
  2. dnf 台服服务器pvf修改器,求教怎么用pvf修改器自制装备
  3. WordPress使用domain/wp-json/api/v1/test 无法到接口可能的原因
  4. php自定义建站系统,PbootCMS(开源免费PHP建站系统) V2.0.9 官方版
  5. 【GAN】三、DCGAN论文详解
  6. AOP之基于AspectJ注解总结与案例
  7. Atitit q2016 q0 doc list on home ntpc.docx
  8. EPICS Archiver Appliance在Debian11下安装文档
  9. mac小白怎么下载网页视频?
  10. 2023华南农业大学计算机考研信息汇总