个人1年多16s/ITS扩增子分析中积累的点点滴滴,此文适合新人了解相关零散知识,也适合有分析经验的人交流与讨论。

以下分析的经验,是以测序数据类型为Illumina HiSeq 2500产出的双端250数据类型(PE250)为基础。

  1. 扩增测序技术选择:推荐使用PE250,性价比超高;
  2. 原始数据使用fastqc质量评估,会发现数据右端末端质量较差,这是测序仪原理导致,我们在双端合并时还会利用另一端高质量序列进行校正,此处不必过分担心;
  3. 双端序列合并方法qiime中有fastq-join和seqprep可选,不必太纠结,原理非常简单事,亲测两者差别不大,用默认fastq-join较快;
  4. extract_barcodes.py提取barcode的种类很多,记得只有左端用barcode_single_end,其它全用barcode_paired_stitched,接头长度如实填写即可。
  5. split_libraries_fastq.py中过滤质量-q选20,即准确度99%; –max_barcode_errors选项是否允许barcode错配不用纠结,一般的barcode调也不支持。
  6. cutadapt去除引物需要-g/-a分两次去除,一次同时去会有很多无法去掉;
  7. 聚类OTU前先使用usearch -derep_fulllength先去冗余,不然QIIME慢到想哭;
  8. 聚类OTU推荐usearch -cluster_otus,直接高效的去除了嵌合体;
  9. 依据参考数据库去除嵌合体,推荐使用usearch -uchime_ref和RDP_gold数据库
  10. align_seqs.py和filter_fasta.py配合去除非细菌序列;
  11. biom的convert, add-metadata要学用,不仅需要格式转换,还需加添加注释信息;
  12. assign_taxonomy.py的方法有uclust, blast, rdp等,我比较感觉rdp方法注释的最全面;
  13. 多序列比对使用clustalo方便多线程快速比对;
  14. make_phylogeny.py默认使用fasttree建树极快;
  15. alpha_diversity.py计算前需要使用single_rarefaction.py进行重抽样,推荐数据量1万-3万;
  16. alpha_diversity.py常用的多样性种类,包括shannon,chao1,observed_otus,PD_whole_tree,最后一种还需要树方件;
  17. normalize_table.py将OTU-table进行CSS方法标准化,再进行beta多样性分析结果更好;
  18. beta_diversity.py常用方法有bray_curtis,weighted_unifrac,unweighted_unifrac,根据结果再选方法;

16s扩增子分析注意事项和经验总结Tips相关推荐

  1. 2019微生物组——16S扩增子分析专题培训第四期

    文章目录 课程简介 课程大纲 一.生信基础知识和技巧 二.图表解读和绘制 三.扩增子基础和分析流程 四.可重复计算和统计绘图 五.功能预测和机器学习 六.网络和环境因子分析 往期精彩回顾 主讲教师 助 ...

  2. PICRUSt:预测宏基因组功能—16S扩增子分析锦上添花

    写在前面 16S分析能获得的信息比较有限,一般找到差异OTU,就很难再深入分析了. 如何把差异OTU与细菌自身的基因组功能建立联系呢?很多人在这方面做出了努力. PICRUSt就是让16S扩增子分析锦 ...

  3. 16S扩增子分析专题课01背景介绍

    整理一下我近期报告的PPT.文稿和视频,分享给大家,希望对同行有所帮助. 本节课程视频共分3部分. https://v.qq.com/x/page/t3015tp7d5u.html Part 1. 2 ...

  4. 16S扩增子分析专题研讨论会——背景介绍

    整理一下我近期报告的PPT.文稿和视频,分享给大家,希望对同行有所帮助. 本节课程视频共分3部分. https://v.qq.com/x/page/t3015tp7d5u.html Part 1. 2 ...

  5. clustMD r语言_使用vsearch,usearch和R语言进行16s扩增子分析

    以下教程中vsearch和usearch部分的操作在虚拟机中的ubuntu18系统下进行. 1. 示例数据的下载 czh@ubuntu:~/Desktop$ curl -O https://Astro ...

  6. PICRUSt:16S预测宏基因组-扩增子分析锦上添花

    写在前面 16S分析能获得的信息比较有限,一般找到差异OTU,就很难再深入分析了. 如何把差异OTU与细菌自身的基因组功能建立联系呢?很多人在这方面做出了努力. PICRUSt就是让16S扩增子分析锦 ...

  7. 《零基础免费学扩增子分析》视频课(含ppt及相应代码),无需转发,直接获取...

    扩增子测序是一种二代靶向测序技术,它使用PCR技术来生成称为扩增子的DNA序列.它简单.快速.应用广泛.扩增子测序可以有效地识别微生物高可变区并有效获取微生物物种的信息. 扩增子测序包括16S rDN ...

  8. 中文扩增子分析视频教程推荐

    在腾讯视频-教育频道,基因学院发布了一套比较详细的中文16S扩增子分析视频教程. 本套课程共分为50节,目前发布到第34节. 第一节:课程介绍 https://v.qq.com/x/page/e050 ...

  9. PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组、新增KEGG层级

    PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组.新增KEGG层级 更新时间:2021年7月8日 PICRUSt推出了近8年,引用5000余次. 现推出PICRUSt2,202年再次霸 ...

最新文章

  1. Spring 4 MVC+Hibernate 4+MySQL+Maven使用注解集成实例
  2. 2011年的总结:Fans同学的成败得失
  3. 字符转换属性text-tranform改变大小写
  4. 知识表示与融入技术前沿进展及应用
  5. 连载:阿里巴巴大数据实践—实时技术
  6. 数据服务器性能测算依据,如何对服务器性能计算的公式参考(tpmc-tpcc).pdf
  7. Java 9进入第一轮问题修复阶段
  8. lombok 生成代码_使用Project Lombok减少Java应用程序中的样板代码
  9. lisp编程 滑动轴承的auto_基于Visual Lisp的滑动轴承设计
  10. SQL SERVER CHAR ( integer_expression )各版本返回值差异的案例
  11. redis的zset类型(有序集合)
  12. 0编译器详解_C++ typeid关键字详解
  13. red_hat_enterprise_linux
  14. 公司数字化建设规划方案
  15. FGSM论文阅读笔记
  16. 《机器学习实战:基于Scikit--Learn、Keras和TensorFlow(第2版)》学习笔记——前言
  17. AutoCAD2007 快捷键介绍和线形设置
  18. 全国主要省会城市和地区手机离线地图数据文件下载地址
  19. 2022苹果开发者账号续费问题
  20. Python+Selenium练习篇13-设置浏览器下载文件默认地址

热门文章

  1. Java 性能调优的 11 个实用技巧
  2. 2021 年中国敏捷行业现状调查全面启动
  3. 从搞笑到高效,构建敏捷团队的基础原则
  4. 日事清【员工绩效】功能活动上线!
  5. 分享这篇耗子叔的-《请玉伯一起来聊一聊“所向无敌的土方法”》
  6. ROS kinetic安装、Kinect2驱动安装和配置
  7. 操作系统结构-外核结构
  8. 根据前序、中序序列重建一棵二叉树的代码实现
  9. 链表中倒数第k个节点 1
  10. Java算法(两数之和)