Canu

Canu是基于OLC算法,具有长reads的自纠错和组装功能,是应用最为广泛的三代组装软件(速度相对较慢)。

Canu相关使用方法来啦!!!

一、Canu的安装
方法一:conda安装

conda install -c bioconda canu

方法二:GitHub上去下载逐步安装
https://github.com/marbl/canu/releases

二、运行流程
Canu分三个阶段进行组装运作:
· 修正 (Corret)
· 修剪 (Trim)
· 组装 (Assemble)

修正阶段将会提高reads中碱基的准确性。修剪阶段将reads修剪到,看起来像高质量序列,并删除可疑的区域,例如剩余的SMRTbell的adpaters。组装阶段将reads排序为contigs,生成对应的共有序列(consensus suquences) 并创建可能的共有序列互相相连的路径。

三、Canu参数说明
Canu对pacbio和nanopore原始数据的组装分为三个步骤:纠错,修整和组装。每一步经历以下几个步骤:
1.加载read到read数据库(seqStore)
2.进行k-mer计数
3.计算overlap,加载到数据库(OvlStore)
4.根据overlap进行纠错/修剪/组装

常用参数说明:
-pacbio-raw pacbio CLR 原始数据
-nanopore-raw nanopore 原始数据
-pacbio-hifi pacbio-hifi reads进行组装
rawErrorRate:未纠错read之间允许的最大差异碱基数,默认 PacBio reads为0.300, Nanopore reads为0.500
correctedErrorRate:纠错后read之间允许的最大差异碱基数,默认PacBio reads为0.045, Nanopore reads为0.144
corOutCoverage:用于纠错的数据最小coverage,默认是40xmin
ReadLength:使用长度大于该阈值的reads,默认为1000min
OverlapLength:最小overlap的长度,默认为500
maxThreads:设置运行的最大线程数

四、使用
来源不同的数据使用不同代码:

#For PacBio:
canu -p ecoli -d ecoli-pacbio genome Size=4.8m -pacbio-raw pacbio.fastq
#For Nanopore:
canu -p ecoli -d ecoli-oxford genome Size=4.8m -nanopore-raw oxford.fasta
#Assembling PacBio HiFi with HiCanu:
canu -p asm -d ecoli_hifi genome Size=4.8m -pacbio-hifi ecoli.fastq
#Trio Binning Assembly:
canu -p asm -d ecoliTrio genomeSize=5m \-haplotype K12 K12.parental.fasta \-haplotype O157 O157.parental.fasta \-pacbio-raw F1.fasta

END

图图云平台-永久免费绘图工具
https://www.cloudtutu.com/

Canu|三代组装软件相关推荐

  1. canu三代组装软件安装

    官方推荐流程: 1. 下载canu-2.2.tar.xz(官方推荐不下source code) 1.1 curl命令下载 curl -L https://github.com/marbl/canu/r ...

  2. 三代组装软件canu学习笔记

    三代组装软件canu学习笔记 (2017-08-07 14:17:43) 转载▼   分类: 三代 1:这个组装软件起源于PBcR包含在Celera Assembler中(http://wgs-ass ...

  3. 三代组装软件Canu使用

    Canu简介 Canu是Celera的继任者,能用于组装PacBio和Nanopore两家公司得到的测序结果. Canu分为三个步骤,纠错,修整和组装,每一步都差不多是如下几个步骤: 加载read到r ...

  4. nextpolish安装_希望组自主三代组装软件NextDenovo最新版本全球学术开源!

    图1. NextDenovo V2.0-beta.1上线Github 测序中国2019年10月18日消息,希望组面向全球释放三代测序数据高效纠错.组装软件NextDenovo最新版本V2.0-beta ...

  5. 三代组装软件miniasm笔记

    我们用来练手的文章发表在 Nature Communication ,"High contiguity Arabidopsis thaliana genome assembly with a ...

  6. 三代数据组装软件canu

    三代拼接工具canu.canu这款软件来自于经典的 Celera Assembler.celera最早用于人类全基因组计划,后来随着二代测序数据的普及,这种基于overlap的方法逐渐被基于kmer的 ...

  7. NBT:宏基因组二、三代混合组装软件OPERA-MS

    文章目录 宏基因组二.三代测序混合组装软件OPERA-MS 热心肠日报 摘要 主要结果 图1. OPERA-MS工作流程图 图2. 宏基因组数据混合组装基因组评测 图3. 组装虚拟肠道微生物组 图4. ...

  8. Nature方法 | 三代长读长宏基因组组装软件metaFlye

                    简介                  标题:metaFlye:基于重复图的可拓展长序列宏基因组序列组装 metaFlye: scalable long-read me ...

  9. 三代测序数据超快组装软件--大牛Li heng 力作

    三代测序数据超快组装软件--大牛Li heng 力作 (2017-06-19 16:53:46) 转载▼   分类: 三代 1:软件链接:https://github.com/lh3/miniasm ...

最新文章

  1. 3年5000家,苏宁小店如何立足“中国第一O2O社区小店”?
  2. 海峡两岸消防专家论坛台湾举行
  3. 表贴电阻尺寸与什么有关_为什么电阻的长度与电阻的大小有关系
  4. u盘数据恢复的原理_日臻薄技 | 电脑回收站数据恢复的三个方法
  5. yolo v4 python_YOLOv4: Darknet 如何于 Ubuntu 编译,及使用 Python 接口
  6. 框架 go_Colly - 优雅极速的Go语言爬虫框架
  7. 专题七:MATLAB符号计算
  8. NXP- 5744P-MATLAB安装教程
  9. linux下qt实现vlc视频播放器,Qt编写视频播放器(vlc内核)
  10. 如何创建属于自己的域名邮箱
  11. 智能合约实现简单投票系统
  12. 课表插件timetable
  13. Swiper实现手风琴式的图片展示
  14. unity urp 棉麻织物渲染
  15. 【数字图像处理之(一)】数字图像处理与相关领域概述
  16. 2007年12月全球十大搜索引擎
  17. Java 环境JDK下载、安装以及环境变量配置详细图解
  18. PotPlayer播放列表另存为
  19. android获取外放设备,Android 监听耳机外放设备
  20. c++控制台工程,窗口最小化

热门文章

  1. 浅谈程序员的“内卷化”
  2. Redis为什么变慢了?一文讲透如何排查Redis性能问题 | 万字长文
  3. 3w字带你揭开WebSocket的神秘面纱~
  4. 某女程序员吐槽:和男友准备结婚买房,男友家出首付,双方一起还贷款,男友却不在房产证上加她的名字!...
  5. 【图文讲解】TCP为啥要3次握手和4次挥手?握两次手不行吗?
  6. 图解ZooKeeper!小学生也能看懂!
  7. Google 出品的 Java 编码规范,权威又科学,强烈推荐
  8. OKR 怎么突然火起来了?
  9. 多项目管理,研发管理,敏捷开发软件
  10. 批处理-批量拉取git代码