如何判断基因组的重复区域_利用宏基因组数据组装巨病毒基因组的优势与限制...
科学实验往往来自人们的奇思妙想,今天给大家分享一个有趣的研究,作者将已知巨病毒颗粒掺入到废水样品中,再尝试通过宏基因组从数据中恢复巨病毒基因组,从而判断此方式对于巨病毒研究的可靠性和有效性。测试结果到底如何?一起往下看吧!
Advantages and Limits of Metagenomic Assembly and Binning of a Giant Virus
利用宏基因组数据组装巨病毒基因组的优势与限制
作者:Frederik Schulz 等
期刊:mSystems
时间:2020.06.23
影响因子:6.519
一、文章摘要
基因组和宏基因组的发展使科研人员可以从环境样本中得到成千上万种未经培养的细菌和古菌的基因序列,迅速扩展了对微生物多样性的认识。宏基因组最近也被证明可用于评估环境病毒的组成和多样性。巨病毒(NCLDV)的基因组大小可高达数百万碱基,并广泛存在于海洋和陆地的生态系统之中,目前已有研究报道通过宏基因组从环境中成功获得病毒基因组。说明宏基因组用于病毒基因组研究具有潜在的价值,有助于对病毒生态学和进化史等方面的深入了解。
作者通过将已知巨病毒颗粒掺入到废水样品中,通过采取宏基因组的方式尝试是否能从数据中恢复巨病毒基因组,从而判断此方式对于巨病毒研究的可靠性和有效性。
二、研究结果
作者将最近分离得到基因组大小为1.595Mb的Fadolivirus分别按照0病毒颗粒/mL(无)、103病毒颗粒/mL(低)、105病毒颗粒/mL(中)和107病毒颗粒/mL(高)掺入到废水样品中,并对每个废水样品提取得到的DNA进行宏基因组测序,使用metaSPAdes对数据进行组装然后使用MetaBAT 2进行binning分析,共获得115个MAG,基于CheckM的分类学将105个MAG注释为细菌,1个MAG注释为古菌(图1.a)。通过比对发现注释为古菌的MAG与Fadolivirus基因组的相似度超过99.7%,可以确认成功检测到外源添加的Fadolivirus。该病毒MAG仅在高浓度病毒颗粒样本中被检测到,为了测试其他常用binning方法作者采用了MetaBAT 2-dc、MaxBin2、CONCOCT和DAS_Tool对宏基因组组装结果进行分析,发现获得与Fadolivirus基因组达到相似度98.3%~99.7%的MAG(表1)。
表1.不同binning工具的分析结果统计
与Fadolivirus的基因组相似度最高的MAG是由MetaBAT 2分析获得,大小为1.623Mb,相似度达到99.7%,共有12条contigs,N50为481kb。在该病毒MAG中缺少了Fadolivirus基因组中约为5kb的序列,但存在一个在Fadolivirus基因组中没有的contig,此外,作者发现在该病毒MAG的8条contigs末端存在高度重复序列(图1.b)。
为了检测外源加入的Fadolivirus的检出限,作者将所有样本的宏基因组数据比对到Fadolivirus的基因组中,发现在高浓度病毒颗粒样本中比对到Fadolivirus基因组的数据量是中浓度病毒颗粒样本的68倍,与低浓度病毒颗粒样本相比数据量更是高出了4194倍,在没有外源加入病毒颗粒的样本中并没有数据可比对上Fadolivirus基因组(图2.a)。
同时作者对NCLDV的衣壳蛋白(MCP)进行分析以确认能否从宏基因组数据中获得更多的病毒相关信息。从宏基因组数据鉴定得到的MCP与Fadolivirus基因组注释的MCP以及从NCBI的Nr数据库收录的MCP进行比对发现每个样本仅有1-6个MCP,而且这些MCP的reads覆盖度很低(图2.b)。Fadolivirus的MCP仅在高浓度病毒颗粒和中浓度病毒颗粒样本中发现,且仅能从高浓度病毒颗粒样本中获得较为完整的MCP,在中浓度病毒颗粒样本中获得了12条属于Fadolivirus MCP的contigs。
三、总结
本研究突出了宏基因组中提取巨病毒基因组的可能性和局限性,例如需要足够的数据量、覆盖度和有效的分析工具。本研究中的测试数据在目前和未来对未培养的巨病毒基因组研究十分重要,有助于扩展对巨病毒遗传多样性的认识和推断他们与宿主的相互作用。
您可能还喜欢:
美格基因:快速准确的微生物来源追溯工具FEASTzhuanlan.zhihu.com
美格基因:产品升级|美格基因重磅推出微生物组+代谢组联合分析解决方案zhuanlan.zhihu.com
如何判断基因组的重复区域_利用宏基因组数据组装巨病毒基因组的优势与限制...相关推荐
- 如何判断基因组的重复区域_人类参考基因组GRCh37 VS GRCh38
人类基因组包括22条常染色体(1-22),2条性染色体(X,Y)和线粒体DNA(mtDNA).高通量测序的reads比对至参考基因组是后续数据分析的基础.因此,参考基因组的质量是至关重要的.目前,广泛 ...
- 如何判断基因组的重复区域_Nat Comm. | 15万人类基因组中多核苷酸变异(MNV)的起源及功能研究...
前沿生物大数据分析(93) 撰文:存在一棵树 IF=11.878 推荐度:⭐⭐⭐⭐⭐ 亮点:通过基因组聚合数据库(gnomAD)对125,748个外显子组数据和15,708个全基因组测序数据的MNV变 ...
- code block怎样导入整个文件夹_利用ArcGis导入数据之四(dxf——Geomap、CAD、CorelDraw)...
利用ArcGis导入数据之四(dxf--Geomap.CAD.CorelDraw) 一.应用目标 在油气行业,地质方面Geomap应用相当广泛,建设方面也有CAD,作图方面CorelDraw应用也多, ...
- python判断数组中是否存在重复元素_利用python查看数组中的所有元素是否相同
不知道大家有没有过这种经历,就是想要判断两个数组运算后得到的新数组中的各个元素值是否相同.这里给出一种使用np.unique()的方法,代码如下:cbc免费资源网 import numpy as np ...
- java 重复代码优化_利用注解 + 反射消除重复代码(Java项目)
1. 案例分析 1.1 案例场景 假设银行提供了一些 API 接口,对参数的序列化有点特殊,不使用 JSON,而是需要我们把参数依次拼在一起构成一个大字符串 按照银行提供的API文档顺序,将所有的参数 ...
- matlab手动抠取圆形区域_利用Photoshop通道工具扣取人物头发教程-PS抠图
本文原创作者小申羊,北京科技大学冶金专业研究生.平面设计爱好者!作者从自身学习角度总结分析,教程非常详细,非常适合新手学习! 本次扣图教程主要使用钢笔工具沿女孩的边缘区域绘制路径:然后借助通道.画笔工 ...
- python怎么重复程序_利用Python程序完成ABAQUS中的一些重复性操作
对于建立过大型的ABAQUS分析模型的同学们,肯定会面对繁琐的重复性建模过程.比如对上百个点施加集中力,比如建立几百个耦合约束.这些重复性操作,如果使用cae操作的话,不仅费时,而且极其容易出错. 利 ...
- opencv 手选roi区域_利用opencv进行眼动检测
- python判断邮箱格式是否正确_利用Python正则表达式模块,对邮箱帐号格式正确性校验(以QQ邮箱为例)...
''' 非纯数字邮箱(@qq.com,@foxmail.com)?? a.1 您的邮箱帐号应该由a-z的英文字母(不区分大小写)开头: a.2 可由英文字母.0-9的数字(但不能使用全数字).点.减号 ...
最新文章
- ES6数组的解构赋值( 中)
- 二进制包 mysql_二进制包;mysql
- leetcode算法题--唯一元素的和
- JSP JSTL标签库基本使用
- 【数据结构-查找】4.五千字干活长文带你搞懂——B树和B+树
- python无需修改是什么特性_用户编写的python程序无需修改就可以在不同的平台运行,是python的什么特征...
- 6.set ff=unix;设置Linux中文件中每行后又尖括号的情况
- 读excel文件至DataTable
- NASA公布“门户计划”,在月球轨道建立空间站进一步探索月球
- P4310-绝世好题【位运算,dp】
- 做企业网站为什么要服务器呢,企业为什么要建站?
- 01.神经网络和深度学习 W3.浅层神经网络
- Linux程序接口实验:取进程标志及用户信息
- 海洋工作室——网站建设专家:人生3万天 转载
- 女生转行成为程序员的顾虑和优势
- app 登录成功后 保存登录账号 密码 以及读取
- 在Ubuntu 18.04上安装man中文帮助手册的方法手记
- Nvidia PhysX 学习文档7:Geometry
- 杭州 职称 计算机免试,浙职称评审政策调整外语计算机免考年限有变动
- php5.3 pear,php-5.3 下安装pear 和 pecl
热门文章
- 中国移民去哪儿 新京报
- 比亚迪汉家族3月热销12359辆 汉EV单车销量破万
- 特斯拉涨价:Model 3价格上调1万元 Model Y上调2.1万
- 蓝色起源成功完成“新谢泼德号”飞船第17次发射
- “持续亏钱”的NIO Power反而让蔚来更具竞争优势
- 淘宝发布年度十大同款:钟南山哑铃、奥特曼变身器、嫦娥五号暖宝宝入选
- 马斯克:特斯拉汽车产量今年有望达到50万辆
- iPhone 12 Pro系列终于不怕弯了!
- 孙正义辞任阿里董事 阿里:软银仍有权提名一名董事进董事会
- iPhone 12系列详细屏幕参数前瞻:首批只有三星、LG屏幕 均为OLED面板