利用qiime2分析微生物组16S rRNA数据小结

混合双端、V3-V4区域测序，

00.RawData已经进行了样本拆分、barcode去除和引物切除。每个样本文件夹里有5个文件，第一个extendedfrags.fastq文件是拼接后的序列，raw_1fq.gz和raw_2.fq.gz是未去barcode和引物的双端序列；最后两文件是去掉引物和barcode后的原始数据。

extendedFrags.fastq文件是由flash软件合并双端序列（即reads拼接）所得。

处理过程：

1. 导入数据

1）创建文件列表seq-list.tsv文件（必须用绝对路径）

sample-id    absolute-filepath
A1  $PWD/data/A1_16S.fastq
A2  $PWD/data/A2_16S.fastq
A3  $PWD/data/A3_16S.fastq

2）导入数据

qiime tools import \
--type 'SampleData[SequencesWithQuality]' \
--input-path seq-list.tsv \
--output-path seqs.qza \
--input-format SingleEndFastqManifestPhred33V2

2. 按测序碱基质量过滤序列，得到Clean Data

qiime quality-filter q-score \
--i-demux seqs.qza \
--o-filtered-sequences demux-filtered.qza \
--o-filter-stats demux-filter-stats.qza###Saved SampleData[SequencesWithQuality] to: demux-filtered.qza
###Saved QualityFilterStats to: demux-filter-stats.qza

3.质量控制和生成特征表（使用deblur或vsearch）

1）deblur降噪16S（自带去嵌合体功能）

deblur在denoising时需要输入整齐一样长度的序列，所以需要trim成相同的长度。

deblur的开发者们建议设置一个质量分数开始迅速下降的长度。（recommend setting this value to a length where the median quality score begins to drop too low）

qiime deblur denoise-16S \
--i-demultiplexed-seqs demux-filtered.qza \
--p-trim-length 120 \
--o-representative-sequences new-seqs.qza \
--o-table new-table.qza \
--p-sample-stats \
--o-stats deblur-stats.qza###Saved FeatureTable[Frequency] to: new-table.qza
###Saved FeatureData[Sequence] to: new-seqs.qza
###Saved DeblurStats to: deblur-stats.qza

2）Vsearch

qiime vsearch dereplicate-sequences \
--i-sequences demux-filtered.qza \
--o-dereplicated-table new-table.qza \
--o-dereplicated-sequences new-seqs.qza###Saved FeatureTable[Frequency] to: new-table.qza
###Saved FeatureData[Sequence] to: new-seqs.qza

4. 生成OTU

1) close referenced

#将参考数据库rep_set/97_otus.fasta转成qza格式
qiime tools import \
--input-path  rep_set/97_otus.fasta \
--output-path 97_otus.qza \
--type 'FeatureData[Sequence]'#Imported rep_set/97_otus.fasta as DNASequencesDirectoryFormat to 97_otus.qzaqiime vsearch cluster-features-closed-reference \--i-table new-table.qza \--i-sequences new-seqs.qza \--i-reference-sequences 97_otus.qza \--p-perc-identity 0.97 \--o-clustered-table table-cr-97.qza \--o-clustered-sequences seqs-cr-97.qza \--o-unmatched-sequences unmatched-cr-97.qza#Saved FeatureTable[Frequency] to: table-cr-97.qza
#Saved FeatureData[Sequence] to: seqs-cr-97.qza
#Saved FeatureData[Sequence] to: unmatched-cr-97.qza

2) denovo

qiime vsearch cluster-features-de-novo \--i-table new-table.qza \--i-sequences new-seqs.qza \--p-perc-identity 0.99 \--o-clustered-table table-dn-99.qza \--o-clustered-sequences rep-seqs-dn-99.qza

3) open referenced

qiime vsearch cluster-features-open-reference \--i-table new-table.qza \--i-sequences new-seqs.qza \--i-reference-sequences 97_otus.qza \--p-perc-identity 0.97 \--o-clustered-table table-or-97.qza \--o-clustered-sequences rep-seqs-or-97.qza \--o-new-reference-sequences new-ref-seqs-or-97.qza

注：使用vsearch合并样本

创建文件列表seq-list.tsv文件

sample-id   forward-absolute-filepath   reverse-absolute-filepathA1  $PWD/data/A1_16S_R1.fastq   $PWD/data/A1_16S_R2.fastqA2  $PWD/data/A2_16S_R1.fastq   $PWD/data/A2_16S_R2.fastqA3  $PWD/data/A3_16S_R1.fastq   $PWD/data/A3_16S_R2.fastq

合并：

qiime vsearch join-pairs \--i-demultiplexed-seqs primer-trimmed-demux.qza \--p-threads  4 \--o-joined-sequences demux-joined.qza
#查看合并结果
qiime demux summarize \--i-data demux-joined.qza \--o-visualization demux-joined.qzv

利用qiime2分析微生物组16S rRNA数据小结相关推荐

fastq质量值_微生物组16S rRNA数据分析小结：从fastq测序数据到OTU table
推荐阅读 1.ggplot2绘制曼哈顿图示例2.phyloseq | 用 R 分析微生物组数据及可视化3.R语言PCA分析教程 | Principal Component Methods in R4. ...
QIIME2 分析微生物组测序数据
#启动qiime2 source activate qiime2-2020.2 #创建工作目录并进入工作目录 wd=/mnt/d/Ju/ mkdir -p ${wd} cd ${wd} (一)自建库数 ...
Nature综述：Rob Knight带你分析微生物组数据(2020版)
文章目录微生物组分析最佳实践导读摘要Abstract 背景介绍Introduction 实验设计Experimental design 图1. 微生物组实验设计中的注意事项知识点1. 优秀工作 ...
Nature综述：Rob Knight带你分析微生物组数据
微生物组分析最佳实践 Best practices for analysing microbiomes Impact Factor:34.648 https://doi.org/10.1038/s41 ...
Nature Methods：Rob Knight发布Striped UniFrac算法轻松分析微生物组大数据
Striped UniFrac微生物组大尺度分析算法 Striped UniFrac: enabling microbiome analysis at unprecedented scale Natu ...
宏转录组方法_综述:分析微生物组的最佳做法
本文讨论了微生物组学研究的各个阶段,从设计实验到收集和储存样本,到最后序列数据的图形展示等,有助于研究人员考虑实验和分析中遇到的各种影响因素,指导我们更好地进行微生物组学研究. 分析微生物组的最佳做法 ...
Microbiome：在人工肠道中建立动态线性模型指导设计和分析微生物组研究
文章目录在人工肠道中建立动态线性模型指导设计和分析微生物组研究导读摘要主要结果图1. 技术变异掩盖了微生物动态的模型图2. 10个最高丰度细菌科随时间变化图3. 生物和技术变异的结构和幅 ...
Nature Method ：Rob Knight发布Striped UniFrac算法轻松分析微生物组大数据
文章目录 Striped UniFrac微生物组大尺度分析算法简介导读正文图1. 算法描述和性能评估结果如何使用猜你喜欢写在后面 Striped UniFrac微生物组大尺度分析算法 S ...
2019微生物组——16S扩增子分析专题培训第四期
文章目录课程简介课程大纲一.生信基础知识和技巧二.图表解读和绘制三.扩增子基础和分析流程四.可重复计算和统计绘图五.功能预测和机器学习六.网络和环境因子分析往期精彩回顾主讲教师助 ...
iMeta教程 | 使用PMS分析微生物组(图文+视频)
点击蓝字关注我们利用Parallel-Meta Suite在多平台下进行交互式微生物组分析 https://doi.org/10.1002/imt2.1 2022/3/6 ● 2022年3月6日, ...

利用qiime2分析微生物组16S rRNA数据小结

利用qiime2分析微生物组16S rRNA数据小结相关推荐

最新文章

热门文章