ISME | 通过长读长宏基因组测序揭示南极土壤未培养细菌的生物合成潜力
关注我们
一起探索微生物领域的奥妙
摘要
日趋严重的抗生素抗性问题使得研究者们将目光转移到可能是新的抗生素来源的未培养细菌上。扩增子测序与短读测序分析表明宏基因组中存在多样化的生物合成基因簇(BGC)。本文通过长读长测序从南极土壤中发现千余个BGC,证明了未被研究过的谱系中的生物合成潜力。
中文标题:通过长读长宏基因组测序揭示南极土壤未培养细菌的生物合成潜力
英文标题:Biosynthetic potential of uncultured Antarctic soil bacteria revealed through long-read metagenomic sequencing
期刊:The ISME Journal
第一作者:Valentin Waschulin
通讯作者:Valentin Waschulin
作者单位:School of Life Sciences, University of Warwick, Coventry, UK
正文内容
到目前为止,宏基因组学研究表明地球上未培养的细菌具有非常高的多样性,其中包含约97.9%的细菌OTU是未被完整测序的。研究者目前可以通过对宏基因组中编码特化代谢物多样性进行描述并加以利用,对宏基因组文库的筛选也可以选出包括新的抗生素在内的化合物。对宏基因组组装基因组(Metagenome-assembled genome, MAG)中生物合成基因组(Biosynthetic gene cluster, BGC)的挖掘与分析可以获得对更多微生物天然产物的认识,为生成新的且有用的化合物提供了可能,这或许是开发新抗生素合成途径的重要一步。已有研究证明全长BGCs可以通过长读长宏基因组测序获取,另外PCR克隆可以扩增BGC的异源表达。针对BGC的鉴定、比较、与已知化合物的联系等分析都已经有相关工具被设计出来,BGC数据库也已经建立。
本研究的研究对象选取在南极洲,由于其地理与环境的特殊性,南极微生物的多样性还未被深入研究。本研究利用长读长鸟枪测序,结合基因组挖掘与基于分箱(bin)或重叠群(contig)的分类学鉴定分析了火星绿洲(Mars Oasis,位于南极南部海域)上采集的土壤中的生物合成潜力,回收了超过1,400个高度多样化且多为全长的BGCs。
图1 A) 采样点为南极“火星绿洲”;B) 长读长序列与重叠群的分类信息;C) 分箱后的bins以及鉴定为BGCs的重叠群的分类信息。
测序策略
长读长测序:牛津纳米孔测序(Oxford Nanopore)MinION(序列数约930万条,总碱基约44.4Gb,N50约9.4Kb)
短读长测序:Illumina HiSeq 150bp双端测序(序列数约1.87亿条,总碱基约28Gb)
主要结果
1.高度多样化全长BGC的回收
在本研究中,共鉴定出1417个BGCs,其中564个(39.8%)位于重叠群的头尾端,因此可能是不完整的,其他853个(60.2%)则是全长的BGCs。所有BGCs中最丰富的种类是萜类化合物(terpenes,27.2%),其次是NRPS(非核糖体多肽合成酶,15.7%)和细菌素(bacteriocins,10.1%)。
2.长读长与GTDB对于环境BGCs鉴定的提升
利用GTDB蛋白数据库替代NCBI-nr蛋白库能够将含BGC的重叠群的分类鉴定(目水平)从36.8%提升至71.8%。然而,GTDB蛋白数据库相比之下要小得多,它在较细的分类水平上的代表序列较少,因此本研究仅选用了纲水平和目水平进行了分类。
BiosyntheticSPAdes能够从短读组装重叠群中识别NRPS与PKS,利用该方法从28Gb短读数据中预测了228个NRPS/PKS BGC,其中96.7%非全长。另外,BiosyntheticSPAdes方法预测的BGCs大多数都能通过blastn比对到长读长预测的少部分BGCs上,也就是说短读测序中也有很多BGCs能够组装,只不过这种组装更碎片化。然而,由于这种碎片化,大量BGCs的完整性、边界以及潜在的修饰基因无法预测,因此其分类鉴定更难,实用性相对更低。
3.产生特化代谢物的门中的高度分化BGCs
本研究中,BGCs中有超过60%来自放线菌门(Actinobacteriota)、变形菌门(Proteobacteria)与拟杆菌门(Bacteroidota)。属于酸杆菌门(Acidobacteriota)与疣微菌门(Verrucomicrobiota)的BGCs占总BGCs的20%。未发现古菌中的BGCs。
利用BiG-SLiCE query mode对1417个BGCs进行分析,计算其与由约120万个已知BGCs组成的预计算的GCFs(Gene Cluster Families,基因簇家族)的距离d。其中,845个BGCs距离超过900,55个离群值距离超过了1800。每个门中距离差距都很大,这表明每个门都含有与已知BGCs近源或远源的BGCs。
图2B BiG-SLiCE门水平距离,黑色虚线d=900,灰色虚线d=1800
对于某一个纲来说,其距离因不同种类的BGCs也会表现出差异。如拟杆菌门中距离值高的主要来源于NRPS类BGCs(图2C)与萜类化合物BGCs(图2E)。
图2C-H BiG-SLiCE门水平距离(按不同BGC类别)
4.放线菌门与变形菌门中未培养与未探索的纲、目显示出巨大的生物合成潜力
放线菌门中的放线菌纲(Actinobacteria)、酸微菌纲(Acidimicrobiia)与嗜热油菌纲(Thermoleophilia)包含了大量的BGCs,且这些纲中还有相当一部分BGC未被归入下一分类层级,可以认为未培养的放线菌中存在有大量的未被认知的多样性,其中含有大量BGCs。
变形菌门中未被培养的营甲烷目UBA7966被认为是一类特化的代谢物生产者。该目下鉴定出96个BGCs,其中包括有萜类化合物、细菌素、磷酸盐、NRPS类等,此外该目的覆盖度很高,说明其丰度较高;其重叠群总长度长,表明存在多个基因组。
参考文献:
Waschulin, V., Borsetto, C., James, R. et al. Biosynthetic potential of uncultured Antarctic soil bacteria revealed through long-read metagenomic sequencing. ISME J (2021). https://doi.org/10.1038/s41396-021-01052-3
原文链接:
https://www.nature.com/articles/s41396-021-01052-3
中国科学院生态环境研究中心
环境生物技术重点实验室
邓晔 研究员课题组发布
编译:彭玺
公众号:微生态笔记
微信号 : mem_denglab
● 扫码关注我们
点击下方“阅读原文”可查看文章全文
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
科研经验:云笔记 云协作 公众号
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文
ISME | 通过长读长宏基因组测序揭示南极土壤未培养细菌的生物合成潜力相关推荐
- 环境宏基因组测序揭示微生物与哮喘/鼻炎发病的城乡差异规律
近期,派森诺与华南农业大学.复旦大学合作,再次在<Microbiome>发表论文,结合人群健康数据和自我管理问卷调查,对中国城市和乡村学校的教室环境中的微生物组进行了比较分析,研究了室内环 ...
- 易基因 - 组学前沿:癌症组织和血液的宏基因组测序揭示了细菌、病毒和癌症之间的新联系|文献科普
易点评 癌症可能是由于宿主组织被细菌和病毒感染所诱发的.而这类致癌过程背后的机制主要有两类:一类是病毒将自身遗传物质整合到宿主基因组中从而导致致癌病毒蛋白的表达,而另一类则是细菌所导致的慢性炎症引发的 ...
- Nature:基于宏基因组测序构建人类肠道微生物组参考基因集
文章目录 基于宏基因组测序构建人类肠道微生物组参考基因集 文章影响 作者简介 热心肠日报 摘要 正文 宏基因组测序肠道微生物组 图1. 人类肠道微生物组的覆盖度 人类肠道微生物组的基因集 图2. 预测 ...
- iMeta | 大连海洋大学傅松哲和根特大学杨倩开发宏基因组测序和流式细胞术相结合的工作流程...
点击蓝字 关注我们 宏基因组测序结合流式细胞术为城市污水中细菌病原体的微生物风险评估提供了新的框架 原文链接DOI: https://doi.org/10.1002/imt2.77 COMMENTAR ...
- Nature方法 | 三代长读长宏基因组组装软件metaFlye
简介 标题:metaFlye:基于重复图的可拓展长序列宏基因组序列组装 metaFlye: scalable long-read me ...
- NBT:主流高通量测序仪在人/细菌/宏基因组测序评测结果发布,华大智造表现优异...
导读 高通量DNA测序技术(DNA-seq)是临床和基础生物医学研究的重要手段之一.作为一种常规的技术方法,DNA-seq在多个领域均有广泛应用,例如个体基因分型和变异鉴定,种群和物种水平的基因组特征 ...
- EID:宏基因组测序在新发腹泻病毒鉴定中的应用
宏基因组测序在新发腹泻病毒鉴定中的应用 撰文:李杰 常熟理工学院生物与食品工程学院 责编:刘永鑫 中科院遗传发育所 写在前面 发现和鉴定新病毒以及确定新病毒与疾病的关系是预防.诊断和治疗新发病毒性传染 ...
- 高分文章精选 | 纳米孔宏基因组测序的表现
在宏基因组测序中,纳米孔长读长可从复杂多样的宏基因组学样本中组装完整的闭环细菌基因组和质粒,提供无偏倚.免PCR扩增的基因组序列.已有越来越多的科学家使用纳米孔长读长来区分近缘物种,解析具有挑战性的重 ...
- databasemetadata获取表注释_宏基因组测序中短序列的注释
宏基因组中短序列的注释是理解测序微生物群落潜在功能的重要步骤之一.单纯利用局部匹配的注释容易混淆那些蛋白同源性且局部序列非常相似的序列,进而不能真实准确反映复杂蛋白质家族中多变的结构和功能域. 今天我 ...
最新文章
- python3.9.0 print_关于 Python 3.9,那些你不知道的事
- 反正我不信!马斯克谈元宇宙:没人愿意把屏幕贴脸上
- python cgi nginx_nginx uwsgi和cgi python脚本
- 斐波那契数列——递归算法
- C++静态库与动态库(简介)
- redhat 6.2安装telnet服务
- [深入学习C#]匿名函数、委托和Lambda表达式
- Linux开启和关闭防火墙的方法
- 网络设备巨头优倍快的客户数据遭泄露
- 如果Google统治世界[组图]
- .NET面试基础知识
- 【修正补发】Scratch2exe-ch将sb2文件转换为exe文件
- 驾考你准备好了吗 之 交通标志、标线篇
- 常见HTTP错误码模拟
- 软件测试之验收测试三要点
- python实现批量提取指定文件夹下同类型文件
- Python绘制图像(Matplotlib)(Ⅵ)
- Scrapy(二)翻页功能
- Regulator子系统
- 生物信息学还是跨专业计算机,生物统计学与生物信息学的区别
热门文章
- 网曝某互联网大厂给员工电脑安装插件,基本等于全程监控!网友:就是监控你们划水!...
- 线上发生死锁异常了,该怎么办
- 真香!20张图揭开「队列」的迷雾,一目了然
- Redis+Nginx+设计模式+Spring全家桶+Dubbo阿里P8技术精选文档
- 如何快速融入团队并成为团队核心?(九)
- 案例 | 杭州佰勤医疗器械:智办事助力企业组织数字化转型
- 企业一般会用哪些软件来提高员工的工作效率?
- 在家远程办公,如何才能让员工高效工作?
- 【硅谷牛仔】Instagram CEO--凯文·希斯特罗姆--从销售到科技独角兽公司CEO
- solidwork2019/2020安装后出现无法获得许可证