USEARCH11新功能——OTU表抽平otutab_rare
http://www.drive5.com/usearch/manual/cmd_otutab_rare.html
稀疏、抽平
otutab_rare 抽样OTU比至某个指定数据量,方便比较Alpha多样性,对于抽平后的OTU表,会自动删除不满足样本量的样品,还会去除全为零的OTUs
使用实战
usearch11 -otutab_rare otutab.txt -sample_size 10000 -output otutab10k.txt
主要三个参数,输入文件,抽平至相同的样本量,输出文件
运行输出结果如下:
00:01 43Mb 100.0% Reading otutab.txt
00:02 43Mb 100.0% Rarefying
Deleted 90 samples size < 10000
Deleted 814 OTUs with size=0 after rarefaction
Deleted 90 samples with size=0 after rarefaction
00:04 48Mb Writing otutab10k.txt ...done.
运行使用了4秒,43Mb内存,有90个样本数据量不到10000,抽平后有814个OTUs为零被删除,同时不满足数据量的90个样品也被删除。
我们统计一下抽样前后的比较
抽样前统计
使用otutab_stats统计OTU表
usearch10 -otutab_stats otutab.txt -output otutab.stat
cat otutab.stat
结果如下:样本测序量最小值为5369,最大值有124817
38748638 Reads (38.7M)1182 Samples4996 OTUs5905272 Counts4339163 Count =0 (73.5%)552758 Count =1 (9.4%)316760 Count >=10 (5.4%)54 OTUs found in all samples (1.1%)370 OTUs found in 90% of samples (7.4%)1145 OTUs found in 50% of samples (22.9%)Sample sizes: min 5369, lo 16013, med 25362, mean 32782.3, hi 45569, max 124817
抽样后统计
usearch10 -otutab_stats otutab10k.txt -output otutab10k.stat
cat otutab10k.stat
看到样品量全部抽平为10000,但样本量和OTU数量都有下降(删减)
10920000 Reads (10.9M)1092 Samples4182 OTUs4566744 Counts3607823 Count =0 (79.0%)433338 Count =1 (9.5%)124757 Count >=10 (2.7%)28 OTUs found in all samples (0.7%)210 OTUs found in 90% of samples (5.0%)649 OTUs found in 50% of samples (15.5%)Sample sizes: min 10000, lo 10000, med 10000, mean 10000.0, hi 10000, max 10000
综上,此种方法与之前QIIME的single_rarefaction.py
命令结果一致。之前usearch10中使用的otutab_norm
方式,不会删除低丰度的样品,会出现低样本抽高,alpha多样性偏低,低于抽平数量的样品稀释取线后期直线的问题。在usearch11中新增的otutab_rare
是对之前不完善结果的补充。
猜你喜欢
- 10000+: 菌群分析
宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑 - 系列教程:微生物组入门 Biostar 微生物组 宏基因组
- 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
- 一文读懂:宏基因组 寄生虫益处 进化树
- 必备技能:提问 搜索 Endnote
- 文献阅读 热心肠 SemanticScholar Geenmedical
- 扩增子分析:图表解读 分析流程 统计绘图
- 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
- 在线工具:16S预测培养基 生信绘图
- 科研经验:云笔记 云协作 公众号
- 编程模板: Shell R Perl
- 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1800+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA
USEARCH11新功能——OTU表抽平otutab_rare相关推荐
- 基于vegan包对otu表抽平——r语言
使用vegan包抽平: 数据准备:准备一个otu表. 输入文件:otu.txt,第一行为样品的名称,第一列为otu名称. #加载r工作目录,如果文件直接放在了默认的工作目录可以忽略该代码 setwd( ...
- USEARCH11新功能简介
USEARCH是继Mothur.QIIME后的第三大流行扩增子分析流程,目前引用11588次.由Robert Edgar大神独立编写.官方网址:http://www.drive5.com/usearc ...
- laxcus的新功能:支持表跨数据库操作
关系数据库的层次结构,是账号.数据库.表,一个账号下可以有多个数据库,每个数据库有多个表,但是不同数据库下的表是不能够互相操作的.例如:"select a.*, b.* from Title ...
- 在线作图|在线做扩增子抽平
扩增子抽平 扩增子抽平工具主要是针对扩增子测序后得到的otu表进行抽平处理,本平台按照样本的最小总丰度进行抽平,过滤一些低丰度的OTU,抽平后得到的OTU表可以用来做alpha多样性分析.beta排序 ...
- USEARCH11发布,新功能简介
USEARCH是继Mothur.QIIME后的第三大流行扩增子分析流程,目前引用7296次.由Robert Edgar大神独立编写.官方网址:http://www.drive5.com/usearch ...
- oracle 子表数据变化时主表也会更新_亿信ABI版本重大更新,新增60余个实用新功能,还有一项黑科技...
今年,亿信ABI横空出世,产品一经推出,前来体验.咨询.购买的客户络绎不绝.老板点赞,客户开心,年终奖感觉又要翻几番. 但是紧接而来的是,广大用户对于产品优化的需求就如同潮水一般涌来-- 为此,我们的 ...
- HTML5新的解析顺序,HTML5新表单新功能解析
HTML5新增了很多属性功能.但是有兼容性问题,因为这些表单功能新增的.我这里做了一个简单的练习,方便参考.如果完全兼容的话,那我们写表单的时候就省了很多代码以及各种判断. HTML5表单新功能解析 ...
- SQL Server 2016的新功能–临时数据表
There are many new features in SQL Server 2016, but the one we will focus on in this post is: SQL Se ...
- 001 spring5框架:java类工程,IOC:实体类表示表关系,AOP,JdbcTemplate模板,事务操作,Spring5 框架新功能:日志,为空注解,函数式风格,juint,Webflux
1. Spring5 框架(Spring5 Framework)介绍 1.1 概念 1.Spring 是轻量级的开源的 JavaEE 框架 2.Spring 可以解决企业应用开发的复杂性 3.Spri ...
最新文章
- UIPickerView
- android适配器Adapter
- 预告 | 旷视天元的前世今生与移动端推理优化@清华专场
- 表现与数据分离;前台MVC
- 函数中的apply,call入门介绍
- 如何测试判断云服务器的稳定性?
- IDEA插件推荐:Material Theme UI(把IDEA变得更加美观)
- C/C++常见面试题整理
- docker 卸载镜像_docker删除所有容器和镜像命令
- 如何避免后台IO高负载造成的长时间JVM GC停顿(转)
- LaTex安装及使用
- 图解TCP/IP详解(史上最全)
- js几种常见的设计模式
- 关于央行新推数字货币的综述
- 陶哲轩实分析:极限定律的本质
- c语言数组转换树存储结构,c语言, 一棵具有n个结点的完全二叉树以数组存储,试写一个非递归 算法实现对 该树的前序遍历。...
- 【BZOJ1001】狼抓兔子
- LaTeX - 黎曼和
- Linux如何退出VI编辑
- KMP、扩展KMP、MANACHER