一直以来,看到这本书《Statistical Analysis of Microbiome Data with R》活跃在朋友圈和公众号,既然口碑这么好,当然有必要学习下啦!分享记录一下书中我所认为重要的点。下面是这本书的第二章:

什么是微生物组数据

2.1 测序

16S或者宏基因组测序后,数据使用Qiime或Mothur,比对或者denovo聚类生成OTU表格,注释获得物种分类表,以及相对丰度。

2.2 数据结构

是结构化的进化树,系统发生关系和进化。样本(行)-特征(列)偶发表,特征可以是OTU、基因 、物种分类或者序列变异的表。

2.3 特征

  • 重复、样本、个体、对象、描述或者生态采样点-物种、OTU等丰度矩阵。
  • 过度分散的,这是因为:1)DNA/RNA测序的测序文库大小差别很大;2)变化幅度超过多元回归的预测,如泊松,第11章,我们采用R包来处理这些。

2.4 稀疏多0矩阵

  • 稀疏多0,在一些样本中许多物种分类或OTU都是缺失的。1)样本的0,又称0计数,可能是取样问题;2)结构的0,真0,绝对0,也就是真的没有;3)约等于0,不是真的0,而是低于噪声误差。
  • 0的来源,1)测序假阳性,测序深度的差别;2)一个给定组分,发生率低,测序总深度也低时;3)数据处理时,转换成相对丰度时,比对和标准化的影响。

2.5 挑战

以上的这些数据特点为研究者带来了各种挑战。包含统计学上的挑战,还有:

  • 1)如何组织成进化树;
  • 2)如何减少数据的维度,以及p值过大和n值过小;
  • 3)如何处理罕见物种(OTU);
  • 4)如何对过度分散、稀疏多0矩阵进行建模。例如人的肠道微生物研究就面临类似的问题。

分散性是16S数据处理的一个主要挑战:

  • 对精确参数估计的模型来说是一个难题,甚至是不可能实现的任务。例如,由于太多0的存在,物种(OTU)的分布会很混乱,而且没办法使用标准的模型进行分析。
  • 多0也让非参数模型失效,非参模型主要基于秩或者中位数,所以也没法用。

过多0的解决失败会导致偏好性的参数估计和误导结论。

2.6总结

在本章,我们观察和总结了微生物组数据的特点,我们了解了它们长什么样。微生物组数据是组成性的,高维度的,不明确的,过度分散和多0的。这些特点对数据分析造成很大挑战,让参数和非参模型均失效。

宏基因组笔记(第二章)相关推荐

  1. 深入理解 C 指针阅读笔记 -- 第二章

    Chapter2.h #ifndef __CHAPTER_2_ #define __CHAPTER_2_/*<深入理解C指针>学习笔记 -- 第二章*//*内存泄露的两种形式1.忘记回收内 ...

  2. 《Go语言圣经》学习笔记 第二章 程序结构

    Go语言圣经学习笔记 第二章 程序结构 目录 命名 声明 变量 赋值 类型 包和文件 作用域 注:学习<Go语言圣经>笔记,PDF点击下载,建议看书. Go语言小白学习笔记,几乎是书上的内 ...

  3. Web前端开发笔记——第二章 HTML语言 第四节 超链接标签

    目录 前言 一.超链接标签 (一)链接其它子网页 (二)链接其它站点 (三)虚拟超链接 二.从当前页面链接到指定位置 三.链接的访问情况 四.在新窗口中打开链接 例题 结语 前言 本节介绍超链接标签即 ...

  4. 《计算传播学导论》读书笔记——第二章文本分析简介

    <计算传播学导论>读书笔记--第二章文本分析简介 第一节 文本分析研究现状 常用文本挖掘技术 第二节 文本分析与传播学研究 (一)为什么文本挖掘技术逐渐受到传播学者的关注 (二)不同文本分 ...

  5. Computational Optimal Transport 笔记——第二章(2)

    Computational Optimal Transport 笔记--第二章(2) 符号说明 2. 理论基础 2.3 Kantorovich Relaxation SUM 2.4 Optimal T ...

  6. PhalAPI学习笔记 ——— 第二章接口服务请求

    PhalAPI学习笔记 --- 第二章接口服务请求 前言 接口服务请求 接口服务请求案例 自定义接口路由 开启匹配路由 配置路由规则 nginx apache 服务请求 结束语 前言 公司业务需要转学 ...

  7. 操作系统笔记 第二章

    操作系统笔记 第二章 1.有两个程序:A程序按顺序使用CPU10秒.设备甲5秒.CPU5秒.设备乙10秒.CPU10秒:B程序按顺序使用设备甲10秒.CPU 10秒.CPU5秒.设备乙5秒.CPU 5 ...

  8. JavaSE入门0基础笔记 第二章Java基础语法

    JavaSE入门0基础笔记 第二章Java基础语法 1.运算符 1.1算术运算符 1.1.1运算符和表达式 1.1.2 算术运算符 1.1.3字符的"+"操作 1.1.4 字符串中 ...

  9. 【王道考研】操作系统 笔记 第二章上 进程调度

    本文内容,1.进程和线程 2.进程调度 特此鸣谢王道考研 本文参考王道考研的相关课程 若有侵权请联系,立删 其余笔记链接: [王道考研]操作系统笔记 第一章_才疏学浅743的博客-CSDN博客 [王道 ...

  10. [go学习笔记.第二章] 2.go语言的开发工具以及安装和配置SDK

    一.工具介绍: 1.Visual Studio Code 一个运行于Mac,Windows,和linux上的,默认提供Go语言的语法高亮的IED,可以安装Go语言插件,还可以支持智能提示,编译运行等功 ...

最新文章

  1. 使用pytorch搭建 RNN线性神经网络
  2. 汇编语言之寄存器使用(bx,si,di,bp)
  3. Qt 数据库操作(一)
  4. 刷magisk模块后不能开机_联想启天商用电脑刷BIOS或维修换主板后 开机叫两声处理办法...
  5. ajax ----进度条的原理
  6. 电子计算机的五个部分组成,电子计算机由哪几大部分构成?
  7. SQL注入原理-时间盲注
  8. 如何拿到9家大厂的前端校招offer
  9. linux 强制类型转换,转载 指针强制类型转换
  10. Java删除表格的基本代码,Java 删除 Excel 中的空白行和列
  11. 配色三部曲-创建自己的调色板
  12. php面试题2--php面试题系列
  13. Visio 2016 和 SharePoint Designer 2013 来创建工作流并将其发布到 SharePoint 2016 网站而无需任何代码
  14. mysql锁表查询和解锁操作
  15. PMCAFF | 小饭桌实战沙盘心得:积累不确定性中的确定性优势,一步步走向成功...
  16. linux学习---brk(), sbrk() 用法
  17. Android 中高级面试题:Activity是如何实现LifecycleOwner的?
  18. Java简单四则运算
  19. Camtasia2020视频录制软件的安装及pj顶级屏幕录像视频编辑软件
  20. 制作国界线正确的世界地图 (Shapefile)

热门文章

  1. 用python解决经典羊车门问题
  2. android 调出键盘表情_android 表情,软键盘冲突解决方案(仿微博等SNS应用)
  3. mysql hacing_manjaro 折腾日记
  4. mysql在mye_数据库映射出现重大问题
  5. 企业wms系统安装在云服务器,wms 云服务器 还是本地
  6. HCIA-Intelligent Computing 题目汇总
  7. 京东单品页前端开发那些不得不说的事儿
  8. ffmpeg音频采样率转换
  9. 有理数思维导图,七年级数学思维导图整理
  10. angr分析程序的控制流图CFG