本节主要讲解如何将元数据与数据导入生物信息分析软件QIIME2,实现数据导入与检查。

本实战教程将使用来自人源化(humanized)小鼠的一组粪便样品,展示16S rRNA基因扩增子数据的“典型”QIIME 2分析。本教程旨在探讨人源化小鼠的遗传背景影响微生物群落的假设。今天,我们先从示例元数据及数据的导入开始介绍。

01元数据(Metadata)

在开始任何分析之前,熟悉元数据很重要。在本研究中,元数据文件包含7列。

即使mouse ID看起来像一个数字,我们也会使用#q2_type指令指定它是分类型数据。整个教程将使用示例元数据。让我们运行我们的第一个QIIME 2命令,来总结和探索元数据。

qiime metadata tabulate
--m-input-file metadata.tsv
--o-visualization metadata.qzv

输出结果文件:metadata.qzv

文件注释:元数据可视化后生成的交互式表格可在网页中查看,也可按任意列排序。

02数据导入QIIME 2(Importing data into QIIME 2)

在QIIME 2中,所有数据都被构造为特定语义类型的对象。

示例样品使用EMP 515f-806r引物扩增,并在Illumina MiSeq上用2x150bp试剂盒测序。使用的引物覆盖的高变区长290bp,因此,对于150bp的读数,我们的序列将略微过短,无法在下游进行配对末端分析。因此,我们将使用单端序列。将序列导入为SampleData [SequencesWithQuality],这是拆分后的单端序列格式。如果想导入双端序列,将指定语义类型SampleData [PairedEndSequencesWithQuality]。

教程将使用样本清单格式(manifest format)导入序列,这是一种在QIIME 2中导入拆分样本数据的通用方法。普通用户常用的下机数据格式为.fastq文件,需要创建一个清单文件,然后使用qiime tools import命令手动输入。清单文件是一个文本文件(.tsv或.txt格式),它将示例标识符映射到fastq.gz或fastq的绝对文件路径,其中包含示例的序列和质量数据。清单文件还指示每个fastq.gz或fastq文件中的读取方向。fastq.gz文件位置的绝对文件路径可以包含环境变量(例如$PWD)。

清单文件内容(单端数据):

使用文件清单导入数据

time qiime tools import
--type"SampleData[SequencesWithQuality]"
--input-format SingleEndFastqManifestPhred33V2
--input-path manifest.tsv
--output-path demux_seqs.qza

命令注释:本教程全篇使用单端数据,用清单文件导入双端数据则使用以下命令。

time qiime tools import --type 'SampleData[SequencesWithQuality]' --input-path manifest.txt --output-path paired-end-demux.qza --input-format PairedEndFastqManifestPhred 3

manifest示例:

使用qiime demux summarize命令检查样本的序列和测序深度(它提供每个样本中序列数及序列质量的信息)

time qiime demux summarize
--i-data demux_seqs.qza
--o-visualization demux_seqs.qzv

输出结果文件:demux_seqs.qzv

上图分为三部分。其中,扩增子一般是混样测序,上部为拆分序列计数统计;中部为样本分布情况,一般根据频率情况选择合适值进行样本过滤;下部分为每个样本的序列量,一般情况下测序深度最小的样本为数据量最少的样本。

交互图分为三部分。其中,上部为每个位置碱基的质量分布交互式箱线图,单端数据只显示forward reads,双端数据则显示forward reads和reverse reads。根据质量图可以判断序列的质量变化情况,在去噪时根据此图选择裁剪位置和长度。一般从质量开始下降部位开始裁剪。样品质量在30以上是比较好的,一般要保证在20以上,低于20要被裁减掉;鼠标悬停在质量交互图上,即可在中部的文字和表格中显示鼠标所在位置碱基质量的详细信息;下部为拆分样本的长度摘要(一般等长测序无差别)。

本文提供分析所需文件与所有输出结果文件,百度网盘下载链接:

https://pan.baidu.com/s/1AkI5nyNhq33oIw8pfVCsEg

提取码:1234

这篇推文对你有帮助吗?喜欢这篇文章吗?喜欢就不要错过呀,关注本知乎号查看更多的环境微生物生信分析相关文章。亦可以用微信扫描下方二维码关注“环微分析”微信公众号,小编在里面载入了更加完善的学习资料供广大生信分析研究者爱好者参考学习,也希望读者们发现错误后予以指出,小编愿与诸君共同进步!!!

学习环境微生物分析,关注“环微分析”公众号,持续更新,开源免费,敬请关注!

转载自原创文章:

QIIME2进阶二_元数据及数据导入QIIME2​

最后,再次感谢你阅读本篇文章,真心希望对你有所帮助。感谢!

QIIME2进阶二_元数据及数据导入QIIME2相关推荐

  1. QIIME2进阶三_用QIIME2实现对数据的质量控制

    本文主要介绍了使用生物信息软件QIIME2中的DADA2与Deblur插件对扩增子基因序列进行质量控制. 本教程将使用来自人源化(humanized)小鼠的一组粪便样品,展示16S rRNA基因扩增子 ...

  2. QIIME2进阶一_用QIIME2解析序列,诠释生命

    本文旨在介绍生物信息学软件QIIME2及其核心组成. 2010年,美国科罗拉多大学的Rob Knight教授(现单位美国加州大学圣地亚哥分校)团队发布QIIME(发音同chime)分析流程.该流程可在 ...

  3. 外部数据导入qiime2软件内部

    外部数据导入qiime2软件 序列.OTU(Feature) Table导入qiime2较为简单,可以按官方推荐方式进行导入.其中,OTU table输入方法如下: biom convert -i t ...

  4. lisp倒入excel数据画图_将excel数据导入CAD画图的方法

    将 EXCEL 的数据导入 CAD 里绘图的方法 这是用 CAD 的 VBA ( cad 里的 lisp 功能也可以实现)的方法.此例是要完成如何在 CAD 中画出如下图 所示的坐标的图形-- 3D ...

  5. excel导入mysql命令行_将Excel数据导入MySql

    今天是全国数学建模比赛,同学选的一个题目需要对一个large的Excel表格进行统计,好哥们儿嘛--便帮助他完成了数据从Excel到MySql的转化.记下具体步骤分享给大家,也免得大家到网上到处乱找了 ...

  6. iview table数据直接导出_(excel表格数据导入导出)iView如何实现excel导入导出

    请问:ERP系统的数据怎么导出Excel和Excel的数据怎么导入ERP? 一般的方法是: 在你找那个数据页面会有数据输出选项--点击 然后到登陆ERP的第一个远程桌面,会有一个资料夹 (各公司的命名 ...

  7. excel mysql数据同步_将 Excel 数据导入 MySql

    能承受上万数据量,速度快,并且使用了事务,不会出现某条数据错误而导致部分数据插入(要是全部成功要是一条都不成功,测试过程中没出现失败),需要的朋友可以参考下 1.NPOI 2.MySql.Data 这 ...

  8. mysql 大文本_超大文本文件数据导入MYSQL

    今天用到一个处理650万的数据导入数据库处理的问题,在网上找了半天,终于在在三灯的博客找到办法,特此转过来以备后用,哈哈! 我执行的命令语句是mysqlimport -uroot -p123456 - ...

  9. mysql外部表不是预期格式_批量Excel数据导入Oracle数据库 导入excel错误:外部表不是预期的格式 解决方案...

    在asp.net网站中导出Excel文件后,再把文件导入到数据库中. 读取Excel文件时,打开连接出错. 错误为:外部表不是预期的格式 解决:检查了一下,导出的Excel是标准文件不是html,没错 ...

最新文章

  1. Python两个字典键同值相加的几种方法
  2. js中 字符串与Unicode 字符值序列的相互转换
  3. php 保存 json,保存PHP中的Array,是用JSON, serialize还是var_export?
  4. python编程从入门到实践课后题答案-《Python编程:从入门到实践》课后习题及答案—第11章...
  5. 后台开发经典书籍--代码整洁之道
  6. 图的存储 邻接矩阵+邻接表+链式前向星
  7. Mysql一些导入导出数据库,添加修改字段命令
  8. java中b的平方表示_第七届蓝桥杯Java B——四平方和
  9. .net framework 2.0 Silent install(.net framework 静默安装)
  10. linux终端背景透明度设置,Ubuntu Terminal标签背景颜色设置
  11. python3.7安装keras教程_Python3.7安装keras和TensorFlow的教程图解
  12. Istio的零停机滚动更新
  13. mysql 从服务器同步设置_mysql主从同步配置
  14. java class private_Java class 中public、protected 、friendly、private的区别
  15. 宠物次元经济专题分析2020
  16. Three.js 基础
  17. htaccess 实现网址缩短
  18. mysql中将多行数据合并成一行数据
  19. 3D点云语义分割认知随便写写(更新中)
  20. Flash游戏开发-RPG地图实现

热门文章

  1. 关闭Linux防火墙
  2. Gradle(古rua都)vs Maven(马文)
  3. scratch——这个电路仿真工具真不错
  4. python数据拟合固定参数_固定某些参数的双峰高斯分布拟合
  5. 数组,向量和矩阵以及空间的维数
  6. android 全景usb 全景,汽车360度全景USB高清数字信号输出系统的制作方法
  7. 小学五年级计算机教学论文,小学五年级数学教学论文
  8. android 麦克风录音输出
  9. 渗透测试常用在线工具汇总
  10. Java飞书三方网站对接