宏基因组扩增子2分析流程:中文首发,史上最详系,零基础自学
本网内容首发“宏基因组”公众号,更佳阅读体验、更多相关文章,欢迎点我跳转至公众号阅读
写在前面
之前发布的《扩增子图表解读》系列,相信关注过我的朋友大部分都看过了(链接直达7月文章目录)。这些内容的最初是写本实验室的学生们学习的材料,加速大家对同行文章的解读能力。
《扩增子分析解读》系列文章介绍
扩增子分析是目前宏基因组研究中最常用的技术,由于微生物组受环境影响大,实验间重复较差,更需要更多的实验重复和分析技术来保证结果的准确性、可重复性。
本系统文章叫分析解读,即有详细的扩增子分析流程代码,又有本人对使用参数、备选参数意义的解读,可以让大部分人零基础学习并理解数据分析过程,并可亲自实践在自己的课题上,获得更好、更合理的实验结果。
本文采用目前最主流的扩增子测序数据类型HiSeq2500 PE250类型数据为例,结合目前主流方法QIIME+USearch优点组合定制的分析流程。本课程中所需的测试数据,可以在公众号后台回复“扩增子”获取最新链接。
学习前必读
- 测序数据:百度云链接经常被和谐,只有公众号后台回复才能获取最新下载链接。。
- 本课程代码的运行,至少需要Linux平台+安装QIIME1.9.1,我之前发布过QIIME1.9.1安装的三种方法如下:
- 虚拟机安装:适合在Windows上学习,但分析效率低。
- Docker安装:Linux上最简单的安装方法,需要管理员帮忙并给你开通部分权限。
- 管理员直接安装:直接安装QIIME1.9.1相关的上百个程序和包,不同环境依赖关系不同,需要极丰富经验,建议管理员安装。
以上三种方法均可点击链接有详细教程,总有一款适合你。
- 本套流程主要依赖QIIME1.9.1。之前发布的QIIME2不是QIIME的升级版,而是完全独立的分析系统,两者没有任何通用的地方,而且现在还不成熟,明年才有稳定版。请读者千万别混淆。不要再犯用QIIME2系统运行本教程扩增子分析流程解读,无法找到相关程序的错误。
- 其它不在QIIME流程中的相关软件,我在教程里提供简单的安装方法,使用前仔细阅读教程操作即可。
扩增子分析流程目录
先看一下扩增子分析的整体流程,从下向上逐层分析。
扩增子分析流程,主要包手下面7部分,共21小节。
- 1质控,实验设计,双端序列合并
查看原始数据的质量,编写合格的实验设计用于分析,双端序列合并为单端的扩增子序列; - 2提取barcode,质控及样品拆分,切除扩增引物
将Barcode序列从序列中拆除,筛选高质量的测序结果并标记文库中每条序列中的样品来源,最后切除扩增时使用的引物; - 3格式转换,去冗余,聚类
转换QIIME生成fasta格式为Usearch要求格式;使用Usearch对序列去冗余并筛选高丰度,极大降低下游计算量和去除噪音;最后使用用Usearch聚类生成OTU,默认会组内自动去除大量嵌合体; - 4去嵌合体,非细菌序列,生成代表性序列和OTU表
本讲详细讲了嵌合体的概念,并使用参考数据库去除嵌合体;学习基于参数数据库筛选细菌序列,这些都是可选的操作,根据实际情况决定是否需要,最终生成高质量的OTU序列作为参考序列; - 5物种注释,OTU表操作
这部分采于不同数据库进行细菌或真菌注释;同时根据实际情况,对OTU表进一步按样品、丰度、物种等条件筛选; - 6进化树,Alpha,Beta多样性
将OTU多序列比对生成进化树,为依赖进化关系的计算方法提供输入文件;再进行多种Alpha和Beta多样性的计算; - 7物种分类统计,筛选进化树和其它
对物种进行分类统计,筛选高丰度结果用于进化树展示,和其它用于R统计分析的结果生成。
作者之声
以上流程,是本人基于多篇高水平文章的解读、同类流程分析流程帮助的阅读和自己理解的产物,不足之处,还请大家多留言讨论或指正。
具体的分析步骤的使用,最重要的是相关项目经验,其次是对课题科学问题的深入理解。自己能想清楚,自然知道如何分析更合理。
大家不要迷信流程一次可以分析出想要的结果,好的结果一般都是经过不断思考,不断优化和改进分析参数和方法得出的。发表前修改流程重新计算30次不算多。
这部分大家学会了,可以基于以上流程生成的文本信息。采用R语言进一步统计分析,并绘图各种出版级的图片。我将会从下周起开始发布,第一季扩增子绘图有8种常用图型的绘图,及相关的统计方法,与扩增子图表解读的顺序相对应哦!
希望本课程对大家有帮助!!!
本系列课程
优秀的作品都有三部分曲,如骇客帝国、教父、指环王等。
扩增子系列课程也分为三部曲:
第一部《扩增子图表解读》:就是本文中的内容,加速大家对同行文章的解读能力。
第二部《扩增子分析流程》:学习数据分析的基本思路和流程。
第三部《扩增子统计绘图》:即是对结果进行可视和统计检验,达到出版级的图表结果。
猜你喜欢
- 热文:1高分文章 2不可或缺的人 3图表规范
- 一文读懂:1微生物组 2寄生虫益处 3进化树
- 必备技能:1提问 2搜索 3Endnote
- 文献阅读 1热心肠 2SemanticScholar 3geenmedical
- 扩增子分析:1图表解读 2分析流程 3统计绘图 4功能预测
- 科研经验:1云笔记 2云协作 3公众号
- 系列教程:1Biostar 2微生物组 3宏基因组
- 生物科普 1肠道细菌 2人体上的生命 3生命大跃进 4细胞的暗战 5人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外100+ PI,1000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA
宏基因组扩增子2分析流程:中文首发,史上最详系,零基础自学相关推荐
- 宏基因组扩增子最新分析流程QIIME2:官方中文帮助文档
本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或"宏基因组"公众号阅读: 注:文为蓝色字均为文章链接,可点击直达 写在前面 **声明:本文为QIIME2官方帮助文 ...
- 宏基因组扩增子3统计绘图:中文首发,最详系,零基础(箱线图、散点图、热图、曼哈顿图、火山图、韦恩图、三元图、网络图)
本网内容首发"宏基因组"公众号,更佳阅读体验.更多相关文章,欢迎点我跳转至公众号阅读 注:文为蓝色字均为文章链接,可点击直达 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指 ...
- 史上最简SLAM零基础解读(7) - Jacobian matrix(雅可比矩阵) → 理论分析与应用详解(Bundle Adjustment)
本人讲解关于slam一系列文章汇总链接:史上最全slam从零开始 文末正下方中心提供了本人联系方式,点击本人照片即可显示WX→官方认证{\color{blue}{文末正下方中心}提供了本人 \co ...
- 青年生命科学论坛报告:扩增子和宏基因组数据分析与可视化流程—刘永鑫(北京210606)...
感谢中科院动物所青促会组织的第三届青年生命科学论坛的邀请,参加本次大会,并和微生物所王军老师共同负责了<微生物组>专题的召集工作.感谢11位微生物组专题报告人的辛苦准备和分享. 现将本次1 ...
- Nature Methods:宏基因组物种组成分析工具MetaPhlAn2
文章目录 宏基因组物种组成分析工具MetaPhlAn2 导读 主要结果 图1:MetaPhlAn2可以准确地重建鸟枪法宏基因组的分类组成 Reference 扩展阅读 猜你喜欢 写在后面 宏基因组物种 ...
- ggtree美颜进化树-宏基因组扩增子
上周四转载了微生态的<一文读懂进化树>,五天阅读人数已经2500+,而且有还多人留言求美化教程,今天将发放福利第一弹,Y叔创建的R包--ggtree,进化树美化神器. 软件原文G Yu, ...
- Nature综述:鸟枪法宏基因组-从取样到数据分析——2万字带你系统入门宏基因组实验和分析
文章目录 NBT:鸟枪法宏基因组-从取样到数据分析 热心肠日报 摘要 正文 图1. 宏基因组分析流程概述 附图1. 用于规划宏基因组学研究的示例工作流程 附框1. 实验设计中的问题和解决方案 鸟枪法宏 ...
- Nautre综述:鸟枪法宏基因组-从取样到数据分析(1)2万字带你系统入门宏基因组实验和分析...
NBT:鸟枪法宏基因组-从取样到数据分析 Shotgun metagenomics, from sampling to analysis Nature Biotechnology [IF:31.864 ...
- Nautre综述:鸟枪法宏基因组-从取样到数据分析(2)2万字带你系统入门宏基因组实验和分析...
宏基因组拼接 Metagenome assembly 已经公开了许多用于从序列读长库中重建微生物群落组成的方法.选择"最佳"是一项艰巨的任务,主要取决于研究的目的. 宏基因组从头/ ...
最新文章
- bzoj29894170数列——二进制分组+主席树
- golang函数——可以为类型(包括内置数据类型)定义函数,类似类方法,同时支持多返回值...
- 二叉树的建立和递归遍历
- Appium环境搭建简介
- 构建之法4、17章观后感
- Machine Schedule
- 每一个工程师都要学的安全测试,老板再也不用担心服务器被黑
- 同步和异步, 阻塞和非阻塞, Reactor和Proactor
- P2485-[SDOI2011]计算器【BSGS,exgcd,快速幂】
- win10安装RabbitMQ
- LeetCode-----斐波那契数列
- 小白都能理解的FTRL
- php中paynotify,PayNotifyValidator.php
- spss数据预处理步骤_5个步骤,用SPSS进行数据分析
- 用yum下载安装gcc
- 线性代数笔记【特征值】
- Spring-Boot实现HTTP大文件断点续传分片下载-大视频分段渐进式播放
- 数字IC后端真的不如前端设计和验证吗?
- iphone怎么连接itunes相关解锁教程
- 针对儿子买的将近一万的笔记本电脑