动植物基因组非常复杂,基因组大小、杂合度、GC含量、倍性等都会影响着基因组组装的难度和结果。特别是目前动植物基因组大多采用二倍体或多倍体材料直接进行测序组装,对于复杂基因组如高杂合、大基因组等,组装的难度很高

同时,二倍体或多倍体组装的结果混杂了双亲等位基因组的嵌合序列,可能会引入错误的基因注释信息。此时如果能进行单倍体基因组组装,不仅能降低组装难度,还能获得一套染色体组的序列。

什么是单倍体基因组?

二倍体拥有两套染色体组,对有性繁殖的物种来说,一套染色体组来源于母亲,另一套来源于父亲。下图展示了果蝇的染色体组,果蝇有4对共8条染色体,每一组中包括3条常染色体和1条性染色体。在生殖细胞形成过程中,经过减数分裂染色体的数目减半,获得的就是一套染色体组也叫单倍体。

图1 果蝇染色体组示意图

相比高杂合物种(如常年自交不亲和、远缘杂交),一些杂合度和重复序列都占比较低的物种,其单倍体基因组组装的难度会低很多。高杂合物种基因组组装难度大,而且获得的嵌合基因组对后续这些物种的重测序、进化、基因功能等方面的研究都会产生不利影响。

如何构建单倍体基因组?

动植物可以采用单倍体生殖细胞测序来构建单倍体基因组,随着单细胞测序的发展,利用动物的配子进行测序组装是比较容易实现的。但是,从植物配子中分离和扩增DNA的一些挑战限制了这种方法在植物上的应用,如何才能有效解决呢?以下3个案例展示了单倍体基因组组装的技术升级之路,也提供了组装思路:

案例1:构建BAC文库,利用barcoding方法构建单倍体基因组

2019年10月,南京农业大学利用单花粉原生质体分离的新方法与单细胞DNA扩增技术相结合,利用12个花粉单细胞对所构建的3.8万条细菌人工染色体(Bacterial Artificial Chromosome,BAC)通过barcoding方法进行单倍型分型,并成功组装了两套单倍体基因组。通过这种方法鉴定出了原参考基因组中8.12%的由于杂合引起的嵌合组装基因。

图2 利用barcoding方法进行单倍体定相的原理图

然而Barcoding方法需要构建BAC文库,比较耗时耗力。随着长读长测序技术的发展,现在可以保证读长准确度兼具,基于此,下述案例中利用长读长测序构建单倍体基因组成为可能。

案例2:短读长+长读长测序组装结合遗传图谱实现马铃薯单倍体基因组组装

2020年9月,中国农科院基因组所在Nature Genetics 在线发表杂合二倍体马铃薯的单倍体基因组组装结果。研究人员采用了短读长测序和长读长测序结合的方法进行了二倍体马铃薯RH89-039-16的基因组组装。研究同时测序了RH的自交分离群体构建遗传连锁图谱,利用遗传图谱成功将同源片段区分成两套单体型。最后在Hi-C数据的辅助下,组装片段被锚定在染色体上,成功实现了染色体级别的单体型组装。

对基因组的两套单体型序列进行比较分析发现,二倍体马铃薯内存在等位基因表达差异甲基化差异。而且Haplotype-resolved识别有害突变,特别是在互斥的紧密相连的基因,为分子选择和/或基因组编辑技术有效清除突变负担提供方便。

图3 多平台联合组装获得二倍体马铃薯的单体型基因组

表1 马铃薯三个组装结果比较

案例3:PacBio HiFi测序组装苹果单倍体基因组

2020年11月,美国康奈尔大学与USDA-ARS植物遗传资源研究中心合作在Nature Genetics上发布了苹果的单倍体基因组。研究利用623-780X不同梯度文库(450/800bp/2-4K/5-7K/8-10K)短读长测序和10X Genomics测序,37-81X PacBio HiFi测序组装获得了栽培苹果(Malus domesticacv. Gala)及其两个主要的祖先种野生苹果(M. sieversii和 M. sylvestris)的单倍体基因组(Phased diploid genome)。

图4 基因组组装、纠错和定相流程

现代栽培苹果(Malus domesticaBorkh.) 从不同的野生祖先种杂交并通过无性繁殖的方式繁衍形成,因此苹果基因组高度杂合,这对早期苹果基因组的组装是一个重大的挑战。本研究的单倍体基因组获得了高准确度高连续性的组装片段,得到目前最高质量的苹果参考基因组。基于单倍体基因组,鉴定到广泛的基因组变异位点和栽培苹果中的杂交重组区域,同时为高分辨率的等位基因特异性表达(allele-specific expression, ASE)分析提供了极大的帮助。

表2 苹果基因组组装结果统计

从上述案例可以看出,为了获得单倍体基因组的phasing信息,有时需要借助BAC文库或遗传图谱,这些过程比较耗时耗力。而今随着长读长测序技术的发展,构建单倍体基因组的过程可以进一步简化。

文献链接:

1.https://genome.cshlp.org/content/29/11/1889

2.https://www.nature.com/articles/s41588-020-0699-x

3.https://www.nature.com/articles/s41588-020-00723-9

基因组组装的那些困扰,用单倍体基因组一一破解!相关推荐

  1. 基因组组装程序linux,使用 SPAdes 进行基因组组装

    1. SPAdes 简介 BayesHammer: 用于 Illumina reads 的修正 IonHammer: 用于 IonTorrent 数据的修正 SPAdes: 用于基因组组装:K 值是软 ...

  2. 单倍型基因组组装方法

    1. 什么是单倍型? image 同源染色体:同源染色体,一个来自母本,一个来自于父本. 单倍型:单倍体基因型的简称.遗传学上指在单条染色体上一系列遗传变异位点的组合. 2. 单倍型组装的意义? 目前 ...

  3. 使用Falcon对三代测序进行基因组组装

    Falcon是PacBio公司开发的用于自家SMRT产出数据的基因组组装工具.Falcon分为三个部分: HGAP:PacBio最先开发的工具,用于组装细菌基因组,名字缩写自Hierarchical ...

  4. HiFi全基因组测序技术与实例|HiFi基因组组装软件推荐

    HIFI技术的简介 HiFi reads(High fidelity reads) 是Sequel II 三代测序平台推出的兼顾长读长和高准确度的测序序列,一般采用CCS(Circular Conse ...

  5. Nature子刊:宏基因组组装基因组实现谱系解析

    宏基因组组装基因组实现谱系解析 MAGs achieve lineage resolution Nature Microbiology [IF: 17.745] DOI:https://doi.org ...

  6. NBT:牛瘤胃微生物组的4941个宏基因组组装基因组(MAG)

    牛瘤胃微生物组的参考基因组集 用于瘤胃微生物组生物学和酶发现的4,941个瘤胃宏基因组组装基因组集 Compendium of 4,941 rumen metagenome-assembled gen ...

  7. Nature方法 | 三代长读长宏基因组组装软件metaFlye

                    简介                  标题:metaFlye:基于重复图的可拓展长序列宏基因组序列组装 metaFlye: scalable long-read me ...

  8. IDBA-UD:组装非均匀覆盖度的宏基因组和单细胞数据

    文章目录 IDBA-UD:用于深度非常不均匀的单细胞和宏基因组测序数据的组装软件 热心肠日报 摘要 动机 Motivation 结果 Results 可用性 Availability 方法 图1. I ...

  9. NC:MetaSort通过降低微生物群落复杂度以突破宏基因组组装难题

    点评:目前本领域研究最大的问题是缺少大量细菌基因组作为参考宏基因组序列.这一问题严重限制了研究的准确度和进一步功能研究.而目前的研究还主要集中在扩增子和宏基因组数据的宏观描述上,即使发布了大量宏基因组 ...

最新文章

  1. python工作太难找-Python工作难找吗?
  2. MyBatis笔记——EhCache二级缓存
  3. endnote初始化数据库支持_5 个免费的在线 SQL 数据库环境,比Navicat 香
  4. 我的技术家园,吸取精神食粮的天堂
  5. AppleScript
  6. Win10+Torch1.9+CUDA11.1成功配置YOLOX预测环境
  7. wdr5600 虚拟服务器,TP-Link WDR5600路由器端口映射设置教程
  8. cocos2d-js 开发常用方法
  9. C# 自己绘制报表,GDI你会用吗?
  10. 按钮按一下画个直线_直线导轨数控车床概念和作用
  11. php兼容net的md5,解决c# md5与php md5加密不一致的问题(md5(unicode))
  12. 如何搭建一个自己的网站-项目篇
  13. oracle启动pmon,oracle 11g pmon工作内容系列三
  14. akuna capital oa
  15. python编程实践(3):python+selenium实现12306抢票脚本
  16. 自定义Launcher桌面图标无法加载的问题
  17. 每日一个CSS——模拟键盘
  18. Windows 10错误在打开特定路径时导致BSOD崩溃
  19. 一些关于吸血鬼的词汇
  20. Android:ViewPager详解(异步网络加载图片,带图片缓存,并带导航小圆点)

热门文章

  1. NLP汉语自然语言处理原理与实践
  2. 计算机书籍-Exploring Cloud Computing免费电子书
  3. 浅谈单图像三维重建算法
  4. Surface Shading in Tiger Book
  5. pytorch遇见RuntimeError: CUDA out of memory的解决
  6. RDKit |基于集成学习(Ensemble learning)预测溶解度
  7. Tensorflow |(4)名称域、图 和会话
  8. 代码居中对齐_一篇文章带你了解CSS对齐方式
  9. c语言中point的用法_C/C++中 *和amp;的爱恨情仇
  10. 朱永官等综述土壤生态学研究前沿