利用qiime2分析微生物组16S rRNA数据小结
混合双端、V3-V4区域测序,
00.RawData已经进行了样本拆分、barcode去除和引物切除。每个样本文件夹里有5个文件,第一个extendedfrags.fastq文件是拼接后的序列,raw_1fq.gz和raw_2.fq.gz是未去barcode和引物的双端序列;最后两文件是去掉引物和barcode后的原始数据。
extendedFrags.fastq文件是由flash软件合并双端序列(即reads拼接)所得。
处理过程:
1. 导入数据
1)创建文件列表seq-list.tsv文件(必须用绝对路径)
sample-id absolute-filepath
A1 $PWD/data/A1_16S.fastq
A2 $PWD/data/A2_16S.fastq
A3 $PWD/data/A3_16S.fastq
2)导入数据
qiime tools import \
--type 'SampleData[SequencesWithQuality]' \
--input-path seq-list.tsv \
--output-path seqs.qza \
--input-format SingleEndFastqManifestPhred33V2
2. 按测序碱基质量过滤序列,得到Clean Data
qiime quality-filter q-score \
--i-demux seqs.qza \
--o-filtered-sequences demux-filtered.qza \
--o-filter-stats demux-filter-stats.qza###Saved SampleData[SequencesWithQuality] to: demux-filtered.qza
###Saved QualityFilterStats to: demux-filter-stats.qza
3.质量控制和生成特征表(使用deblur或vsearch)
1)deblur降噪16S(自带去嵌合体功能)
deblur在denoising时需要输入整齐一样长度的序列,所以需要trim成相同的长度。
deblur的开发者们建议设置一个质量分数开始迅速下降的长度。(recommend setting this value to a length where the median quality score begins to drop too low)
qiime deblur denoise-16S \
--i-demultiplexed-seqs demux-filtered.qza \
--p-trim-length 120 \
--o-representative-sequences new-seqs.qza \
--o-table new-table.qza \
--p-sample-stats \
--o-stats deblur-stats.qza###Saved FeatureTable[Frequency] to: new-table.qza
###Saved FeatureData[Sequence] to: new-seqs.qza
###Saved DeblurStats to: deblur-stats.qza
2)Vsearch
qiime vsearch dereplicate-sequences \
--i-sequences demux-filtered.qza \
--o-dereplicated-table new-table.qza \
--o-dereplicated-sequences new-seqs.qza###Saved FeatureTable[Frequency] to: new-table.qza
###Saved FeatureData[Sequence] to: new-seqs.qza
4. 生成OTU
1) close referenced
#将参考数据库rep_set/97_otus.fasta转成qza格式
qiime tools import \
--input-path rep_set/97_otus.fasta \
--output-path 97_otus.qza \
--type 'FeatureData[Sequence]'#Imported rep_set/97_otus.fasta as DNASequencesDirectoryFormat to 97_otus.qzaqiime vsearch cluster-features-closed-reference \--i-table new-table.qza \--i-sequences new-seqs.qza \--i-reference-sequences 97_otus.qza \--p-perc-identity 0.97 \--o-clustered-table table-cr-97.qza \--o-clustered-sequences seqs-cr-97.qza \--o-unmatched-sequences unmatched-cr-97.qza#Saved FeatureTable[Frequency] to: table-cr-97.qza
#Saved FeatureData[Sequence] to: seqs-cr-97.qza
#Saved FeatureData[Sequence] to: unmatched-cr-97.qza
2) denovo
qiime vsearch cluster-features-de-novo \--i-table new-table.qza \--i-sequences new-seqs.qza \--p-perc-identity 0.99 \--o-clustered-table table-dn-99.qza \--o-clustered-sequences rep-seqs-dn-99.qza
3) open referenced
qiime vsearch cluster-features-open-reference \--i-table new-table.qza \--i-sequences new-seqs.qza \--i-reference-sequences 97_otus.qza \--p-perc-identity 0.97 \--o-clustered-table table-or-97.qza \--o-clustered-sequences rep-seqs-or-97.qza \--o-new-reference-sequences new-ref-seqs-or-97.qza
注:使用vsearch合并样本
创建文件列表seq-list.tsv文件
sample-id forward-absolute-filepath reverse-absolute-filepathA1 $PWD/data/A1_16S_R1.fastq $PWD/data/A1_16S_R2.fastqA2 $PWD/data/A2_16S_R1.fastq $PWD/data/A2_16S_R2.fastqA3 $PWD/data/A3_16S_R1.fastq $PWD/data/A3_16S_R2.fastq
合并:
qiime vsearch join-pairs \--i-demultiplexed-seqs primer-trimmed-demux.qza \--p-threads 4 \--o-joined-sequences demux-joined.qza
#查看合并结果
qiime demux summarize \--i-data demux-joined.qza \--o-visualization demux-joined.qzv
利用qiime2分析微生物组16S rRNA数据小结相关推荐
- fastq质量值_微生物组16S rRNA数据分析小结:从fastq测序数据到OTU table
推荐阅读 1.ggplot2绘制曼哈顿图示例2.phyloseq | 用 R 分析微生物组数据及可视化3.R语言PCA分析教程 | Principal Component Methods in R4. ...
- QIIME2 分析微生物组测序数据
#启动qiime2 source activate qiime2-2020.2 #创建工作目录并进入工作目录 wd=/mnt/d/Ju/ mkdir -p ${wd} cd ${wd} (一)自建库数 ...
- Nature综述:Rob Knight带你分析微生物组数据(2020版)
文章目录 微生物组分析最佳实践 导读 摘要Abstract 背景介绍Introduction 实验设计Experimental design 图1. 微生物组实验设计中的注意事项 知识点1. 优秀工作 ...
- Nature综述:Rob Knight带你分析微生物组数据
微生物组分析最佳实践 Best practices for analysing microbiomes Impact Factor:34.648 https://doi.org/10.1038/s41 ...
- Nature Methods:Rob Knight发布Striped UniFrac算法轻松分析微生物组大数据
Striped UniFrac微生物组大尺度分析算法 Striped UniFrac: enabling microbiome analysis at unprecedented scale Natu ...
- 宏转录组方法_综述:分析微生物组的最佳做法
本文讨论了微生物组学研究的各个阶段,从设计实验到收集和储存样本,到最后序列数据的图形展示等,有助于研究人员考虑实验和分析中遇到的各种影响因素,指导我们更好地进行微生物组学研究. 分析微生物组的最佳做法 ...
- Microbiome:在人工肠道中建立动态线性模型指导设计和分析微生物组研究
文章目录 在人工肠道中建立动态线性模型指导设计和分析微生物组研究 导读 摘要 主要结果 图1. 技术变异掩盖了微生物动态的模型 图2. 10个最高丰度细菌科随时间变化 图3. 生物和技术变异的结构和幅 ...
- Nature Method :Rob Knight发布Striped UniFrac算法轻松分析微生物组大数据
文章目录 Striped UniFrac微生物组大尺度分析算法 简介 导读 正文 图1. 算法描述和性能评估结果 如何使用 猜你喜欢 写在后面 Striped UniFrac微生物组大尺度分析算法 S ...
- 2019微生物组——16S扩增子分析专题培训第四期
文章目录 课程简介 课程大纲 一.生信基础知识和技巧 二.图表解读和绘制 三.扩增子基础和分析流程 四.可重复计算和统计绘图 五.功能预测和机器学习 六.网络和环境因子分析 往期精彩回顾 主讲教师 助 ...
- iMeta教程 | 使用PMS分析微生物组(图文+视频)
点击蓝字 关注我们 利用Parallel-Meta Suite在多平台下进行交互式微生物组分析 https://doi.org/10.1002/imt2.1 2022/3/6 ● 2022年3月6日, ...
最新文章
- 當前主流防拷光碟的備份
- 百度翻译接口测试(2)
- 【python自动化办公02】word操作-word转pdf
- 什么是WebService??
- 微服务框架开发(二)—扩展spring schema
- 【Git】PyCharm项目关联Git的解决方案
- SQLite Tutorial 3 : Working with important SqLite Queries (SELECT, INSERT, DELETE, UPDATE,WHERE...)
- ERROR: Could not install packages due to an EnvironmentError: [Errno 13] 权限不够的解决办法
- 苹果5s现在还能用吗_苹果ios稳定企业签名,现在苹果企业签名还是最稳定的苹果签名吗...
- 关于TP遇到的问题点和解决办法
- python 归纳 (十八)_队列Queue在多线程中使用(二)
- 数据库系统异常排查之思路
- 【优化调度】基于matlab求解共享储能电站工业用户日前经济调度优化问题【含Matlab源码 1103期】
- MIPI 打怪升级之DSI篇
- Java基础(二)public、private、protected修饰的方法
- 中国科学院计算机研究所上级单位,陈援非(中国科学院计算技术研究所高工)_百度百科...
- 有哪些值得一读的理财启蒙书
- NB-IOT开发|nbiot开发教程《三》AT指令类模组驱动-STM32实现AT指令状态机
- xposed、frida、以及平头哥框架三者区别
- 冬日舞会服务器维护中,冬日舞会