对于植物等真核生物基因组来说,重复序列, 多倍体,高杂合度等特征在利用二代数据进行组装的时候都会有很大的问题;

利用二代数据组装出来的基因组,大多达不到完成图的水准,通常只是覆盖到编码蛋白的基因区域,还是会有很多的区域覆盖不到,而这些区域正是发挥调控功能的非编码基因区域,近年来,非编码功能的研究越来越多,如果拼接出来的基因组上缺少这部分序列,无法进行后续的研究;

而且由于测序读长的限制和拼接算法的原因,对于重复序列,GC异常区域,会存在组装错误,甚至组装不出来;

三代测序,其长读长无GC偏好性等特点,降级了基因组组装时的难度,可以组装出在二代数据中很难组装出来的重复序列GC异常序列,非常适合做基因组的组装;

研究人员利用PacbBio RSII 测序平台对复活草进行测序,使用了32个SMRT cells, 测序深度72X

最终组装出来的结果包含650条contigs, 覆盖度为99%(估计的基因组大小为245Mb, contig的总长度为244Mb),conig的N50长度为2.4M,

同时还组装出来完整的叶绿体基因组,大小为125,324 bp, 其中有大约25kb为重复序列,

分析使用的是HGAP的组装流程,参数如下:

The Oropetium genome was assembled using the
RS_HGAP_Assembly.3 protocol for assembly and Quiver for genome polishing in SMRT Analysis v2.3.012. This consisted of a three-step process involving
(1) generation of preassembled reads with improved consensus accuracy;
(2) assembly of the genome through overlap consensus accuracy using Celera; and
(3) one round of genome polishing with Quiver.

For HGAP, the following parameters were used:
PreAssembler Filter v1 (
minimum sub-read length= 3,000 bp,
minimum polymerase read quality = 0.80,
minimum polymerase read length= 3,000bp
);
PreAssembler v2 (
minimum seed length= 16,000 bp,
numberof seed read chunks= 6,
alignment candidates per chunk= 10,
total alignment candidates= 24,
min coverage for correction= 6
);

AssembleUnitig v1 (
target genome coverage= 30,
overlap error rate= 0.06,
minimum overlap= 40 bp,
overlap k-mer= 14
);

BLASR v1 mapping of reads for genome polishing with Quiver (
max divergence percentage= 30,
minimum anchor size= 12).

A second round of genome polishing was performed using Quiver (SMRT Analysis v2.3.0) to
further improve the site-specific consensus accuracy of the assembly.
The following Quiver parameters were used for genome polishing:
filtering (
minimum sub-read length= 3,000 bp,
minimum polymerase read quality= 0.80,
minimum polymerase read length= 3,000 bp);

mapping (
maximum divergence percentage= 30,
minimum anchor size= 12).

Default parameters were otherwise employed for both HGAP assembly and Quiver protocols

Pacbio 纯三代组装复活草基因组相关推荐

  1. 一种PacBio测序数据组装得到的基因组序列的纠错方法技术 (专利技术)

    一种PacBio测序数据组装得到的基因组序列的纠错方法技术 技术编号:17008244阅读:83留言:0更新日期:2018-01-11 04:20 本发明专利技术提供一种PacBio测序数据组装后序列 ...

  2. 一种PacBio测序数据组装得到的基因组序列的纠错方法

    技术领域 本发明涉及生物信息技术领域,更具体的说,它涉及一种PacBio测序数据组装得到的基因组序列的纠错方法. 背景技术 PacBio是一家测序仪公司,提供第三代测序技术测序平台,他们的测序仪产生的 ...

  3. MECAT:PC组装人的基因组

    MECAT:PC组装人的基因组 MECAT 测序技术 组装简史 今天给大家推荐一款牛叉的三代组装软件,号称资源浪费少,绿色又环保,而且在个人笔记本上毫无压力的软件--MECAT. 看到这个题目,大多数 ...

  4. 原核生物基因组三代数据(pacbio/nanopore)组装

    动物随随便便几个G,植物动不动十多个G,而细菌基因组一般就几M,基因组结构简单,没有重复序列杂合度这些组装障碍.我现在很多文章细菌基因组开始用三代测序组装了,还有些文章是二代结合三代测序???纳税人的 ...

  5. 「三代组装」Pacbio组装后如何用自身数据进行polish(更新版)

    之前那我由于需要对PacBio的组装结果进行polish,于是写了「三代组装」Pacbio组装后如何用自身数据进行polish.最近发现自己又有了需求,于是重新回顾了我之前写的这篇文章,但是在实践的时 ...

  6. MPB:深大李猛组-基于PacBio SMRT三代测序的红树林沉积物真菌群落的研究

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

  7. 三代测序之微生物基因组 de novo 测序

    三代测序之微生物基因组 de novo 测序 2016-05-20    编辑:诺禾致源 微生物基因组 de novo 测序 产品优势 • 单分子,长序列,完美跨越细菌全部重复单元 • 真菌 20Kb ...

  8. 三代组装软件canu学习笔记

    三代组装软件canu学习笔记 (2017-08-07 14:17:43) 转载▼   分类: 三代 1:这个组装软件起源于PBcR包含在Celera Assembler中(http://wgs-ass ...

  9. nextpolish安装_希望组自主三代组装软件NextDenovo最新版本全球学术开源!

    图1. NextDenovo V2.0-beta.1上线Github 测序中国2019年10月18日消息,希望组面向全球释放三代测序数据高效纠错.组装软件NextDenovo最新版本V2.0-beta ...

最新文章

  1. Python创建二维数组(关于list的一个小坑)
  2. 延长线段ab到c的画法有几种_终于有人把趋势线的正确画法和错误画法讲透彻了,字字精华,原来大多数人都画错了...
  3. D/A与A/D转换器
  4. 如何做好技术 Team Leader
  5. boost::hana::suffix用法的测试程序
  6. Kudu - 一个融合低延迟写入和高性能分析的存储系统
  7. canal 历史数据如何处理_MySQL日志解析工具Canal的使用
  8. JavaScript学习笔记:数组
  9. 我的YUV播放器MFC小笔记:添加删除自定义分辨率
  10. 西门子s7 计算机通讯,PLC与计算机通讯连接
  11. 《中国人工智能学会通讯》——9.2 误差的本质
  12. HDU1829【种类并查集】
  13. apex乱码_[请教]apex安装简体中文语言包的步骤
  14. 心理学第二周学习笔记:心理学的历史和流派
  15. unity-shader-头发渲染-各向异性
  16. 哈尔滨计算机毛校长国二,【实验视角】静待紫冰花开 知行合一 且行且知 ——记哈尔滨市实验学校校长王媛参加第二届中国阳明心学高峰论坛...
  17. FileZilla 下载
  18. python控制鼠标移动
  19. 电压(电流)运算放大器为什么要增大(减小)输入阻抗?
  20. 清华大学数据挖掘课程幕课习题(第一章)

热门文章

  1. python中if else语句用法_讲解Python中if语句的嵌套用法
  2. AI部署:聊一聊深度学习中的模型权重
  3. 厚积薄发的90后:读博前三年零文章,后期发力产出11篇一作,现任985高校博导...
  4. 目标检测中Anchor的本质分析
  5. CenterNet-TensorRT 3D Detection
  6. 一文览尽ToF深度相机技术
  7. INQ渐进量化方法详解
  8. Science | 初步的SARS-CoV-2蛋白酶抑制剂在小鼠中显示功效
  9. R语言绘制环形树状图
  10. MPB:湖南师大尹佳组-​乳酸菌对酸和胆碱盐的耐受能力