Nature Plants|植物基因组测序20年回顾与展望:三代HiFi基因组时代
2021年11月29日,美国密歇根州立大学在《Nature Plants》期刊在线发表题为“Representation and participation across 20 years of plant genomesequencing”综述,系统阐述了在过去的20年间,对陆地植物基因组学组装质量、已测序物种的分类和地理分布的评估。
在过去的 20 年中,陆地植物(胚胎植物)基因组测序技术的提高,组装质量有了显著提高。自从拟南芥的基因组(陆地植物的第一个基因组)于2001年发表以来,数百个植物基因组已被测序、组装,并在GenBank和其他基因组数据存储库上公开发布。截至2021年1月,已有798种陆地植物物种基因组公开发布。
陆地植物基因组组装的数量和质量迅速增加,尤其是与三代长读长测序显著相关。总体而言,74%的陆地植物基因组组装是在过去3年中产生的(图1)。Contig N50近年来也显着增加,从2010年的99.5±48.1 kb增加到3,395.2±735.42 20kb。
图1 798已公开发布的陆生植物物种基因组装配。
点的颜色代表测序技术类型,大小为使用频次。随着长读长测序技术的出现,物种基因组连续性得到改善,每年产生的基因组组装数量显著增加。
在已有的137种陆生植物目中,超过一半(76)缺乏代表性的物种基因组。如下图2,没有代表性基因组的目以灰色显示。
图2 陆地植物目水平公开发布的基因组以及质量评估比较
为了量化相对于其他物种是否存在对经济上重要的植物进行测序的偏见,作者将物种分为六类:
(1)驯化物种(domesticated):经过广泛人工选择的植物;
(2)栽培种(cultivated):供人类使用但未经大量人工选择的植物;
(3)天然商品(naturalcommodity):少栽培收获的植物;
(4)野性种(feral):经济上不重要但仍受人类选择影响的植物;
(5)野生种(wild):发生在野外,未受人类直接影响的植物;
(6)野生近缘种(wild relatives):与驯化、栽培作物有近亲关系或祖先的野生植物。
基于这些分类,目前已有基因组包含135个驯化种、127个栽培种、120天然商品和12 野性种。剩余的404个基因组来自野生物种,其中77 种是农作物的野生近缘种(图3)。野生植物(~350,000)远多于驯化物种 (~1,200-2,000),这表明野生植物具有巨大潜力的未开发的基因组信息库。
图3 798个植物基因组组装提交机构的地理分布。
圆的大小代表每个国家地区产生的物种基因组数量,颜色代表已测序的驯化、栽培、野性、天然商品、野生和野生相关物种的相对比例。
陆地植物基因组测序主要由中国(235个)、美国(212个)和欧洲国家(168个)主导,约77%的基因组组装归因于这三个区域之一(图4)。
图4 物种起源和地理分布
驯化植物(n = 135)原产地与基因组组装地区
由于植物基因组庞大而复杂和不同程度的倍性,是植物基因组组装一直存在的历史难点。然而,测序技术的进步,例如三代的长读长测序,特别是HiFi测序,新的组装算法,以及大项目团队投入,是未来植物基因组测序迅速发展的依据。
Nature Plants|植物基因组测序20年回顾与展望:三代HiFi基因组时代相关推荐
- 中国医学影像人工智能20年回顾和展望
点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 转载自:中国图象图形学报 点击进入-> CV 微信技术交流群 中国图象图形学报 在过去20年里,医学影 ...
- 学习全基因组测序数据分析1:测序技术
本文转载自微信公众号解螺旋的矿工,作者为黄树嘉,已获得授权.黄树嘉写了WGS系列的文章,堪称教科书级别的生物信息学习材料.虽然本平台只关注宏基因组领域,但此系列文章知识体系完善.干货满满,是值得每位专 ...
- 易基因 | 宏基因组测序带给了我们什么?
关于宏基因组测序: 直接对提取的全宏基因组DNA建立随机小片段文库,能够获取更多的序列信息.通过组装.ORFs预测与注释,通过各种大型公共数据库进行相应注释,高精度解析微生物群落结构与功能,包括特色的 ...
- 从零开始完整学习全基因组测序数据分析:第1节 测序技术
欢迎订阅我们的微信公众号:基因学苑 本文转载自微信公众号解螺旋矿工,作者为黄树嘉,已获得授权.黄树嘉写了WGS系列的文章,堪称教材级别的生物信息学习材料.我们将陆续转载给大家.大家也可以关注公众号解螺 ...
- 个人基因组测序将进入千美元费用时代
个人基因组测序将进入千美元费用时代 admin 2015年8月11日 未分类 评论 13 查看 花1000 美元就能为个人基因组测序,这是10多年来许多基因组测序公司奋斗的目标.现在,美国 Illum ...
- Genome Sequencing and Assembly by Long Reads in Plants植物基因组的长读测序与组装
Genome Sequencing and Assembly by Long Reads in Plants 植物基因组的长读测序与组装 Abstract: Plant genomes generat ...
- Nature Plants:根系微生物可以远程提高植物应对地上部环境胁迫的能力
近日,德国马普植物育种所Stéphane Hacquard课题组研究人员首次发现植物根系微生物可以通过根系微生物--根系--植物地上部轴线拯救了植物在光照不足情况下的生长.该发现证明了植物根系微生物除 ...
- Nature:拟南芥微生物组功能研究2细菌基因组测序和分析
本网对Markdown排版支持较差,请跳转植物微生物组公众号阅读 背景介绍 Bai, Y., et al. (2015). "Functional overlap of the Arabid ...
- Nature:1000种植物的测序揭示10亿年来的进化
来源:生物通 千种植物转录组计划(1,000 Plants Project,1KP)是由加拿大科学家在2008年11月发起的,召集了将近200名植物学家对1,100多种植物的基因进行测序和分析.如今, ...
最新文章
- 【Qt】Qt再学习(二):Bars Example(Q3DBars)
- R语言可视化包ggplot2改变图例(legend)的标题(title)实战
- 线程同步锁 java_java多线程同步之重入锁,详细解析
- 从用户需求看互联网基础设施服务商www.shzhenai.com
- Chapter 1:Introduction
- python之发送HTML内容的邮件
- 特斯拉:已在中国建立数据中心,以实现数据存储本地化
- python并发处理list数据_python并发编程之多进程2--------数据共享及进程池和回调函数...
- 阿里云 nginx php mysql_阿里云 Ubuntu + Nginx + PHP + MySQL
- Java实现复制文件
- 【TensorFlow-windows】学习笔记七——生成对抗网络
- $.ajax返回的JSON无法执行success只进行error的解决方法
- ASP.NET 数据绑定常用代码及其性能分析
- 快速开发框架V0.001(免费、100%开源)
- Http之客户端请求服务器,服务器响应客户端。通过Handler在主线程中读取数据
- 高等数学(第七版)同济大学 习题7-3 个人解答
- 常见的几种推荐系统算法
- img标签图片自适应的样式
- HP 惠普笔记本电脑 禁用触摸板 在插入鼠标后
- 软件测试的定义是什么?
热门文章
- codewars4 Credit Card Mask
- 92课程作业,hive自定义IMFRecordReader,切分^^尖尖头及| 分割符
- Java — Thread Signaling
- 温度数据采集模块简介
- 对过去进行时的一点理解
- 我是如何一步步被Asch征服的
- windows系统端口被占用
- 二级联动之两种方法实现
- edit中网格线 ultra_ultra edit:Ultra Edit实行列模式编辑教程
- 计算机管理系统在护理管理中的应用,信息管理系统在护理管理中的应用_39健康网...