混合双端、V3-V4区域测序,

00.RawData已经进行了样本拆分、barcode去除和引物切除。每个样本文件夹里有5个文件,第一个extendedfrags.fastq文件是拼接后的序列,raw_1fq.gz和raw_2.fq.gz是未去barcode和引物的双端序列;最后两文件是去掉引物和barcode后的原始数据。

extendedFrags.fastq文件是由flash软件合并双端序列(即reads拼接)所得。

处理过程:

1. 导入数据

1)创建文件列表seq-list.tsv文件(必须用绝对路径)

sample-id    absolute-filepath
A1  $PWD/data/A1_16S.fastq
A2  $PWD/data/A2_16S.fastq
A3  $PWD/data/A3_16S.fastq

2)导入数据

qiime tools import \
--type 'SampleData[SequencesWithQuality]' \
--input-path seq-list.tsv \
--output-path seqs.qza \
--input-format SingleEndFastqManifestPhred33V2

2. 按测序碱基质量过滤序列,得到Clean Data

qiime quality-filter q-score \
--i-demux seqs.qza \
--o-filtered-sequences demux-filtered.qza \
--o-filter-stats demux-filter-stats.qza###Saved SampleData[SequencesWithQuality] to: demux-filtered.qza
###Saved QualityFilterStats to: demux-filter-stats.qza

3.质量控制和生成特征表(使用deblurvsearch)

1)deblur降噪16S(自带去嵌合体功能)

deblur在denoising时需要输入整齐一样长度的序列,所以需要trim成相同的长度。

deblur的开发者们建议设置一个质量分数开始迅速下降的长度。(recommend setting this value to a length where the median quality score begins to drop too low)

qiime deblur denoise-16S \
--i-demultiplexed-seqs demux-filtered.qza \
--p-trim-length 120 \
--o-representative-sequences new-seqs.qza \
--o-table new-table.qza \
--p-sample-stats \
--o-stats deblur-stats.qza###Saved FeatureTable[Frequency] to: new-table.qza
###Saved FeatureData[Sequence] to: new-seqs.qza
###Saved DeblurStats to: deblur-stats.qza

2)Vsearch

qiime vsearch dereplicate-sequences \
--i-sequences demux-filtered.qza \
--o-dereplicated-table new-table.qza \
--o-dereplicated-sequences new-seqs.qza###Saved FeatureTable[Frequency] to: new-table.qza
###Saved FeatureData[Sequence] to: new-seqs.qza

4. 生成OTU

1) close referenced

#将参考数据库rep_set/97_otus.fasta转成qza格式
qiime tools import \
--input-path  rep_set/97_otus.fasta \
--output-path 97_otus.qza \
--type 'FeatureData[Sequence]'#Imported rep_set/97_otus.fasta as DNASequencesDirectoryFormat to 97_otus.qzaqiime vsearch cluster-features-closed-reference \--i-table new-table.qza \--i-sequences new-seqs.qza \--i-reference-sequences 97_otus.qza \--p-perc-identity 0.97 \--o-clustered-table table-cr-97.qza \--o-clustered-sequences seqs-cr-97.qza \--o-unmatched-sequences unmatched-cr-97.qza#Saved FeatureTable[Frequency] to: table-cr-97.qza
#Saved FeatureData[Sequence] to: seqs-cr-97.qza
#Saved FeatureData[Sequence] to: unmatched-cr-97.qza

2) denovo

qiime vsearch cluster-features-de-novo \--i-table new-table.qza \--i-sequences new-seqs.qza \--p-perc-identity 0.99 \--o-clustered-table table-dn-99.qza \--o-clustered-sequences rep-seqs-dn-99.qza

3) open referenced

qiime vsearch cluster-features-open-reference \--i-table new-table.qza \--i-sequences new-seqs.qza \--i-reference-sequences 97_otus.qza \--p-perc-identity 0.97 \--o-clustered-table table-or-97.qza \--o-clustered-sequences rep-seqs-or-97.qza \--o-new-reference-sequences new-ref-seqs-or-97.qza

注:使用vsearch合并样本

创建文件列表seq-list.tsv文件

sample-id   forward-absolute-filepath   reverse-absolute-filepathA1  $PWD/data/A1_16S_R1.fastq   $PWD/data/A1_16S_R2.fastqA2  $PWD/data/A2_16S_R1.fastq   $PWD/data/A2_16S_R2.fastqA3  $PWD/data/A3_16S_R1.fastq   $PWD/data/A3_16S_R2.fastq

合并:

qiime vsearch join-pairs \--i-demultiplexed-seqs primer-trimmed-demux.qza \--p-threads  4 \--o-joined-sequences demux-joined.qza
#查看合并结果
qiime demux summarize \--i-data demux-joined.qza \--o-visualization demux-joined.qzv

利用qiime2分析微生物组16S rRNA数据小结相关推荐

  1. fastq质量值_微生物组16S rRNA数据分析小结:从fastq测序数据到OTU table

    推荐阅读 1.ggplot2绘制曼哈顿图示例2.phyloseq | 用 R 分析微生物组数据及可视化3.R语言PCA分析教程 | Principal Component Methods in R4. ...

  2. QIIME2 分析微生物组测序数据

    #启动qiime2 source activate qiime2-2020.2 #创建工作目录并进入工作目录 wd=/mnt/d/Ju/ mkdir -p ${wd} cd ${wd} (一)自建库数 ...

  3. Nature综述:Rob Knight带你分析微生物组数据(2020版)

    文章目录 微生物组分析最佳实践 导读 摘要Abstract 背景介绍Introduction 实验设计Experimental design 图1. 微生物组实验设计中的注意事项 知识点1. 优秀工作 ...

  4. Nature综述:Rob Knight带你分析微生物组数据

    微生物组分析最佳实践 Best practices for analysing microbiomes Impact Factor:34.648 https://doi.org/10.1038/s41 ...

  5. Nature Methods:Rob Knight发布Striped UniFrac算法轻松分析微生物组大数据

    Striped UniFrac微生物组大尺度分析算法 Striped UniFrac: enabling microbiome analysis at unprecedented scale Natu ...

  6. 宏转录组方法_综述:分析微生物组的最佳做法

    本文讨论了微生物组学研究的各个阶段,从设计实验到收集和储存样本,到最后序列数据的图形展示等,有助于研究人员考虑实验和分析中遇到的各种影响因素,指导我们更好地进行微生物组学研究. 分析微生物组的最佳做法 ...

  7. Microbiome:在人工肠道中建立动态线性模型指导设计和分析微生物组研究

    文章目录 在人工肠道中建立动态线性模型指导设计和分析微生物组研究 导读 摘要 主要结果 图1. 技术变异掩盖了微生物动态的模型 图2. 10个最高丰度细菌科随时间变化 图3. 生物和技术变异的结构和幅 ...

  8. Nature Method :Rob Knight发布Striped UniFrac算法轻松分析微生物组大数据

    文章目录 Striped UniFrac微生物组大尺度分析算法 简介 导读 正文 图1. 算法描述和性能评估结果 如何使用 猜你喜欢 写在后面 Striped UniFrac微生物组大尺度分析算法 S ...

  9. 2019微生物组——16S扩增子分析专题培训第四期

    文章目录 课程简介 课程大纲 一.生信基础知识和技巧 二.图表解读和绘制 三.扩增子基础和分析流程 四.可重复计算和统计绘图 五.功能预测和机器学习 六.网络和环境因子分析 往期精彩回顾 主讲教师 助 ...

  10. iMeta教程 | 使用PMS分析微生物组(图文+视频)

    点击蓝字 关注我们 利用Parallel-Meta Suite在多平台下进行交互式微生物组分析 https://doi.org/10.1002/imt2.1 2022/3/6 ● 2022年3月6日, ...

最新文章

  1. 當前主流防拷光碟的備份
  2. 百度翻译接口测试(2)
  3. 【python自动化办公02】word操作-word转pdf
  4. 什么是WebService??
  5. 微服务框架开发(二)—扩展spring schema
  6. 【Git】PyCharm项目关联Git的解决方案
  7. SQLite Tutorial 3 : Working with important SqLite Queries (SELECT, INSERT, DELETE, UPDATE,WHERE...)
  8. ERROR: Could not install packages due to an EnvironmentError: [Errno 13] 权限不够的解决办法
  9. 苹果5s现在还能用吗_苹果ios稳定企业签名,现在苹果企业签名还是最稳定的苹果签名吗...
  10. 关于TP遇到的问题点和解决办法
  11. python 归纳 (十八)_队列Queue在多线程中使用(二)
  12. 数据库系统异常排查之思路
  13. 【优化调度】基于matlab求解共享储能电站工业用户日前经济调度优化问题【含Matlab源码 1103期】
  14. MIPI 打怪升级之DSI篇
  15. Java基础(二)public、private、protected修饰的方法
  16. 中国科学院计算机研究所上级单位,陈援非(中国科学院计算技术研究所高工)_百度百科...
  17. 有哪些值得一读的理财启蒙书
  18. NB-IOT开发|nbiot开发教程《三》AT指令类模组驱动-STM32实现AT指令状态机
  19. xposed、frida、以及平头哥框架三者区别
  20. 冬日舞会服务器维护中,冬日舞会

热门文章

  1. python读取word指定内容_Python操作word
  2. Python图像处理应用之绘制log函数图像
  3. 射影几何----极点极线割线共点四点调和定理
  4. Andriod 第三方 ROM
  5. java繁体_Java-汉字繁体拼音转换
  6. 第十五章 友元、异常和其他
  7. Linux运维工程师发展
  8. echarts饼图自动动画_echarts实时旋转饼图效果特效
  9. 【XJTUSE计算机图形学】第三章 几何造型技术(3)——B样条曲线与曲面
  10. sklearn.neighbors