qiime2+biom+qiime1获得16S物种丰度
我们知道,不管是16S等扩增子测序,还是宏基因组,最后最重要的结果,就是物种的丰度情况了,qiime2给出的16S丰度结果是一个计数,对于许多软件来说这是可用的,那么如果我们想获得一个直接的百分比数据应该怎样做呢?
当然,有许多方法可以实现,比如用shell, R, python脚本,或者再简单粗暴点,excel解决,透视表,公式,宏等。自己造轮子总是觉得不怎么踏实,出错咋办。那么,现成的软件有哪些呢,在这里,我抛砖引玉,提出一个曲线救国的方法,使用qiime2的前任qiime1解决,稍微做几步处理即可。如果你有更好的方法,欢迎交流和推荐,我们共同学习的进步!
这里我就从qiime2得出的结果直接开始,参考了生信菜鸟团大神的推文,这个大神的教程以全面著称,推荐学习!
1.导出物种分类信息和置信度
获得taxonomy.tsv,这个文件,其实把qza文件重命名为zip解压,或者qzv可视化文件导出,得到的文件也应该是一样的。
qiime tools export \--input-path taxa/taxonmony.qza --output-path taxa
文件是类似这样一个:
Feature ID | Taxon | Confidence |
---|---|---|
#q2:types | categorical | categorical |
OTU_1 | k__Bacteria; p__Actinobacteria; c__Actinobacteria; o__Actinomycetales; f__; g__; s__ | 0.8316610949745203 |
2.导出 BIOM 表,并加入将物种分类注释信息:
这一步就是处理下表头,让他兼容biom格式。注意,这个sed在mac下命令不能用,暂不确定是什么原因,我是用docker-ubuntu解决的。
#处理表头
sed -i -e '1 s/Feature/#Feature/' -e '1 s/Taxon/taxonomy/' taxa/taxonomy.tsv
#导出otu(feature)表
qiime tools export \--input-path deblur_output/table_final.qza \--output-path table_exported
#添加物种注释信息
biom add-metadata \-i deblur_output_exported/feature-table.biom \-o deblur_output_exported/feature-table_w_tax.biom \--observation-metadata-fp taxa/taxonomy.tsv \--sc-separated taxonomy
#biom转换成txt格式
biom convert \-i deblur_output_exported/feature-table_w_tax.biom \-o deblur_output_exported/feature-table_w_tax.txt \--to-tsv \--header-key taxonomy
3.qiime1获利各级分类结果
其实只需要biom格式就好了,唯一不足的是没有把上几级别的分类去除,比如属级别,还包括门纲目科,还不是usearch那种直接就是这个分类的结果。但是根据我的经验,usearch的物种注释结果可能不如qiime2的分类效果好,所以怎样结合这两个方法是个需要解决的问题。
#结果按门、纲、目、科、属五个级别进行分类汇总,对应结果的L2-L6
summarize_taxa.py -i result/otu_table3.biom -o result/sum_taxa # summary each level percentage
好的,我的分享就到这里,期待大家有更好的解决方案。
qiime2+biom+qiime1获得16S物种丰度相关推荐
- 使用R语言获得16S物种丰度
还是获得16S物种丰度得老问题,最近在一台新机器上安装qiime1,发现有报错,对于这种停止维护的软件,也是正常现象吧,于是想别的办法解决,恰巧最近读R几本R语言的入门书,发现prop.table() ...
- 16S 物种丰度热图学习
### 1. 关于热图的用途(参考http://www.360doc.com/content/17/0729/17/45848444_675155815.shtml) 以RNA-seq为例,热图可以: ...
- 物种丰度排序堆积柱形图及处理间各物种差异分析
物种丰度排序堆积柱形图及处理间各物种丰度非参数检验多组比较的R图形可视化 再美的可视化图形若缺少了统计检验就失去了灵魂而变得华而不实 测试数据及代码链接:https://pan.baidu.com/s ...
- ggplot2版聚类物种丰度堆叠图
文章目录 写在前面 加载依赖关系 导入数据 ggtree绘制聚类树 物种组成数据 整理成facet需要的格式 保证颜色填充独立性 分面组合树和柱图 修改配色 ggtree调整布局 添加样本其他信息 树 ...
- R统计绘图-随机森林分类分析及物种丰度差异检验组合图
此文主要涉及随机森林组间变量重要性和物种丰度差异检验绘图,包含以下几部分内容: 1)随机森林分类: 2)随机森林分类变量重要性绘图: 3)物种丰度差异检验绘图 4)随机森林分类变量重要性及物种丰度差异 ...
- 按照物种丰度对OTU表格进行拆分-丰富和稀有物种识别
稀有物种 (rare taxa, RT),在所有的样本中丰度均低于0.1%: 丰富物种 (abundant taxa, AT),在所有的样本中丰度均高于1%: 中等物种 (moderate taxa, ...
- R堆叠柱状图各成分连线画法:突出展示组间物种丰度变化
作者:朱微金 李陈浩 堆叠柱状图连线画法 提出问题 18年1月29日宏基因组转载了中科院生态中心邓晔组的文章<土壤细菌定量方法结合相对丰度分析揭示种群的真实变化 >.其中的图3基于堆叠柱状 ...
- 相对丰度柱状图matlab,R堆叠柱状图各成分连线画法:突出展示组间物种丰度变化...
作者:朱微金 李陈浩 堆叠柱状图连线画法提出问题 18年1月29日宏基因组转载了中科院生态中心邓晔组的文章<土壤细菌定量方法结合相对丰度分析揭示种群的真实变化 >.其中的图3基于堆叠柱状图 ...
- R统计绘图 | 物种组成冲积图(绝对/相对丰度,ggalluvial)
一.数据准备 数据使用的不同处理土壤样品的微生物组成数据,包含物种丰度,分类单元和样本分组数据.此数据为虚构,可用于练习,请不要作他用. # 1.1 设置工作路径 #knitr::opts_knit$ ...
最新文章
- 面试常问Handler 的问题合集
- Unity-WIKI 之 AnimationToPNG
- SAP调用WSDL报错,求解!
- 使用async,await关键字进行API Access Token的获取
- 混合云发展之路:前景广阔,巨头混战
- 所代币代币_代币网络效应
- PRML-系列一之1.6
- PHP GD压缩图片
- php编译安装swoole模块
- 客户价值模型:RFM
- 重构实例-消息发送-原始代码及准备-1
- CodeForces 596C Wilbur and Points
- 计算机毕业设计Java移动垃圾分类车管理平台(源码+系统+mysql数据库+Lw文档)
- 关于全概率和贝叶斯公式的使用场景说明
- 全奖博士 | 英国利物浦大学可信人工智能组招收博士
- java界面小程序-模拟算卦六爻
- python学费12306_python【练手】12306查票
- 项目中如何修改element-ui的默认样式
- 电瓶车测试速度的软件,EV-TEST测评:电动车充电速率谁更快
- c# 小票机打印二维条码_C# winform 使用rdlc打印小票其中包含动态显示多条形码的解决方法...