文章目录

  • 基于多宏基因组样本的细菌生物动态定量和比较
    • 摘要
    • 正文
      • 图1.DEMIC的计算流程
      • 图2.基于三个物种测序数据集的效果评估
      • 图3.基于5个属45个相关物种的模拟数据评估DEMIC
    • 热心肠总结
    • Reference
    • 猜你喜欢
    • 写在后面

基于多宏基因组样本的细菌生物动态定量和比较

Quantifying and comparing bacterial growth dynamics in multiple metagenomic samples

Nature Methods, [26.919], Article, 2018-11-12

原文链接: https://www.nature.com/articles/s41592-018-0182-0

第一作者:Yuan Gao

通讯作者:Hongzhe Li

主要单位:宾西法尼亚大学,Perelman医学院,流行病与生统系

摘要

准确定量没有完整序列的微生物生长动态是具有生物学意义的,但在宏基因组计算中存在挑战。我们提出了微生物群体动态估计软件DEMIC(https://sourceforge.net/projects/demic/DEMIC),可以基于多个宏基因组样本的重复的contigs和覆盖度的值准确比较细菌的生长速度。本软件在不同测序量样本和多个直实或人工模拟样本中表现稳定。

正文

图1.DEMIC的计算流程

a. 基于分箱(binning)算法鉴定的重叠群(contig)组,基因组的位置、潜在的污染(图中不同颜色)是未知的;
b. 采用滑窗法计算重叠群的覆盖度(coverage,也称测序深度sequencing depth);
c. 采用线性混合效应模型(linear mixed-effects models, LMM)对GC偏好进行迭代校正,使用PCA距离进行污染重叠群过滤;
d. 结合样本和重叠群集,基于有意义的样本估计生长速度。虚线表示不同样本中重叠群覆盖度对数转换的线性回归,可以从重复来源推断相对距离;
e. 方法应用于每个重叠群组(bin)。NA代表无法估计物种生长率的样本。

图2.基于三个物种测序数据集的效果评估

a,b 在36个E. faecalis(a)数据集和50个 C. rodentium数据集(b)相关估计DEMIC和iRep的PTR值。阴影表示99%的置信区间。
c,d,评估DEMIC和iRep在重叠群组中的污染率©和完整度(d)。基于L. gasseri, E. faecalis, C. rodentium (每个样本n= 10)估计样本大小和叠连群组的完整性和污染率。绘制评估的相关性图,箱线图展示中位数、第1和3分位数。

图3.基于5个属45个相关物种的模拟数据评估DEMIC

a, 模拟PTR的估计数;
b, PTR与DEMIC估计41个叠连群簇相关;
c, 基于不同ANI物种组评估iRep和DEMIC结果(样本数1917,按ANI值划分为66-74,74-82和82-90三种相似各度)。双尾Mann–Whitney U-tests, *P< 0.05, **P< 0.01, ***P< 0.001. b,c 箱线图展示中位数、第1,3分位数。
d, 基于41个物种的DEMIC和iREP估计的皮尔森相关系数。子图展示两种方法相应的PTR大于0.9。

热心肠总结

① 在宏基因组中准确定量没有完整序列的微生物生长动态具有重要意义但充满挑战;

② DEMIC 基于多样本宏基因组中重叠群和覆盖度的值,通过评估重叠群相对于复制原点的间距,准确比较样品间细菌生长速率的差异;

③ DEMIC 在不同样本大小和组装质量的模拟和真实数据中表现良好,好于既有的 iRep 方法,与 PTRC 方法相当(但该方法仅适用于有完整基因组的物种);

④ DEMIC 使用 Perl 和 R 语言开发,以命令行模式运行,通过 GPL 协议发布。

Reference

软件主页 https://sourceforge.net/projects/demic/files/

猜你喜欢

  • 10000+: 菌群分析
    宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑
  • 系列教程:微生物组入门 Biostar 微生物组 宏基因组
  • 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
  • 一文读懂:宏基因组 寄生虫益处 进化树
  • 必备技能:提问 搜索 Endnote
  • 文献阅读 热心肠 SemanticScholar Geenmedical
  • 扩增子分析:图表解读 分析流程 统计绘图
  • 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
  • 在线工具:16S预测培养基 生信绘图
  • 科研经验:云笔记 云协作 公众号
  • 编程模板: Shell R Perl
  • 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2600+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

Nature Method:DEMIC——使用宏基因组数据预测细菌的生长速率相关推荐

  1. Bioinformatics BIB|港城大孙燕妮组用于识别和分析宏基因组数据中噬菌体序列的网站...

    PhaBOX: 用于识别和分析宏基因组数据中噬菌体序列的网站 PhaBOX: a server for identifying and characterizing phage contigs in ...

  2. 宏基因组数据提交GSA指南

    GSA简介 GSA是Genome Sequence Archive的缩写,即基因组序列存档,由中科院基因组所主办. 网址:http://gsa.big.ac.cn/ 之前介绍过NCBI提交测序数据,- ...

  3. 宏基因组数据提交GSA实操手册—发表文章前必备技能

    文章目录 GSA简介 开始前准备:注册/登陆 新建BioProject 数据上传 批量提交样本信息 01 提交者信息 02 基本信息 03 样本类型 04 样本属性 05 元数据信息 实验样品信息 测 ...

  4. 三天实现独立分析宏基因组数据(有参、无参和分箱等)

    在广大粉丝的期待下,<生信宝典>联合<宏基因组>在2019年11月1-3日,北京鼓楼推出<宏基因组分析>专题培训第六期,为大家提供一条走进生信大门的捷径.为同行提供 ...

  5. iMeta | 华中科大宁康组综述宏基因组数据用于蛋白质三维结构预测的方法论

    点击蓝字 关注我们 Review:用于蛋白质结构预测的宏基因组定量分析 https://doi.org/10.1002/imt2.9 2022/3/6 ● 2022年3月6日,华中科大宁康组在iMet ...

  6. 如何判断基因组的重复区域_利用宏基因组数据组装巨病毒基因组的优势与限制...

    科学实验往往来自人们的奇思妙想,今天给大家分享一个有趣的研究,作者将已知巨病毒颗粒掺入到废水样品中,再尝试通过宏基因组从数据中恢复巨病毒基因组,从而判断此方式对于巨病毒研究的可靠性和有效性.测试结果到 ...

  7. 使用Kaiju无组装计算宏基因组数据物种注释相对丰度

    关于Kaiju Kaiju是一款直接通过宏基因组数据Read获得物种注释信息并计算读数与相对丰度的软件.它的主要方法是将Read核酸序列翻译为蛋白序列然后在相应的数据库中进行精确比对,确认物种分类信息 ...

  8. MDL4Microbiome:通过多模态深度学习提升宏基因组数据疾病预测的准确性

    来源 国家基因库大数据平台 在过去的几十年里,先进的宏基因组测序技术使得对人类微生物组的研究能够发现细菌组成与功能.疾病之间的病理关系.然而相关分析工具在诊断和治疗方面的应用仍需提高其准确性.近日,& ...

  9. Nature子刊:改进宏基因组的分箱和组装的新方法

    要点 尽管在宏基因组学分类方面有新进展,但是从宏基因组学数据重建微生物物种仍然具有挑战性.来自Nature Biotechnology 的一项最新研究开发了用于宏基因组分箱(VAMB)的变体自动编码器 ...

最新文章

  1. 2017-1-25总结 主框架设计
  2. python恶搞小程序-有趣的python小程序
  3. 输入输出(Input and Output)
  4. 11(maven+SSH)网上商城项目实战之Freemarker 页面静态化
  5. Unity AssetBundles and Resources指引 (三) AssetBundle基础
  6. EAI企业应用集成场景及解决方案
  7. java微调器_java-更改微调器标题栏样式
  8. 微信公众平台小程序(应用号)开始内测了
  9. Cisco Guard BGP流量牵引配置
  10. macOS 如何设置壁纸
  11. poj2096(概率dp)
  12. 2019银保监计算机类真题,2019中国银保监会招聘考试全真模拟卷(计算机类)
  13. Android 上 Https 双向通信— 深入理解KeyManager 和 TrustManagers
  14. 九城加设网游防沉迷 3千名玩家声称罢玩魔兽
  15. matlab吃cpu还是显卡_如何配置一台适合跑MATLAB的电脑
  16. 新锐任务宝推广渠道推荐
  17. Android中级面筋:开发2年的程序员如何短期突击面试?跟着这几步去准备,大厂也不远了
  18. 博应用测评软件ofo小黄车和摩拜单车哪个更好骑
  19. ybt1003:对齐输出
  20. 获取全国地铁线站口数据(Python+百度API)

热门文章

  1. 不用“背”单词,一个方法从普通二本到哥伦比亚大学:我是如何做到的?
  2. RabbitMQ 可靠消息传输实战--云平台技术栈12
  3. 最新发布| Jira官宣中国区本地部署特殊政策,公布Data Center价格
  4. 从根因入手,更有效率,效果也更好
  5. 创建一个好的Sprint Backlog 的8个小贴士
  6. Ubuntu开机自启动 读取.bashrc
  7. 霍尔传感器与直流无刷电机换相
  8. C++ main函数中参数argc和argv
  9. DATEIF实例说明3
  10. lambda表达式(详)