为什么数据质量控制重要呢?

质量控制是生物分析的基本概念之一,用在保证组学测定的数据的重复性和精确性。由于色谱系统与质谱直接与样品接触, 随着分析样品的增多,色谱柱和质谱会逐步的污染,导致信号的漂移。通过重复使用同一个质控样本来跟踪整个数据采集过程的行为, 已经被大多数的分析化学领域专家推荐和使用。质控样本被用于评估整个质谱数据在采集过程中的信号漂移, 这些漂移进一步能够被精确的算法所识别,校正,提高数据的质量。如图1所示,蓝色质控样本点的特征峰信号强度在整个分析过程中能够具有将近6倍差异(最高点-最低点), 通过QC-RFSC算法校正后,信号强度差异被降到了1.5倍以内。完全符合FDA对于生物样本分析的质控要求。

statTarget是一种流线型的工具,具有简单易用的界面,提供组学数据的数据校正(QC-RFSC)和广泛的精确地统计分析。

概述

statTarget一个精简的可以提供图形用户界面,基于质QC样本进行信号校正,可以整合不同批次之间的代谢组学和蛋白质组学数据,并进行全面的统计分析。

statTarget是如何工作的

statTarget包括两方面内容

  • 一个是信号校正(见后面的shiftCor函数)。其包括基于QC样本进行信号校正的集成学习方法。比如:
  1. 基于QC样本的随机森林校正(QC-based random forest correction, QC-RFSC);
  2. 基于QC样本的LOESS(locally weighted scatterplot smoothing)信号校正(QC-based LOESS signal correction, QCRLSC)
  • 第二部分内容是统计分析(详见后面介绍的statAnalysis函数)。提供了较为全面的用于分析组学数据的计算和统计方法,并且为生物标志物的发现提供多种结果。另外还提供了一个statTargetGUI功能,可以交互界面进行上述功能的操作。

statTarget包的功能列表

  • 数据前处理(Data preprocessing):80%的原则,总丰度归一化(sum normalization),概率系数归一化(probabilistic quotient normalization),glog转化(glog transformation),K-近邻算法数据填充[3]、中位数、最小值填充都是针对缺失数据进行填充的方法。
  • 数据描述:比如平均值、中位数、和、四分位数及标准差等
  • 多元统计分析:如PCA, PLSDA, VIP, Random forest, Permutation-based feature selection。
  • 单变量分析:Welch t检验,Shapiro-Wilk normality test(数据正态性检验) and Mann-Whitney test。
  • 生物标记物分析:ROC, Odd ratio(优势比), P值多重校正,箱线图和火山图

statTargetGUI

因为该函数提供了一个交互式界面分析的功能statTargetGUI,所以先看下如何使用

## Examples Code for graphical user interface library(statTarget)statTargetGUI()#For mac PC,  the GUI function 'statTargetGUI()' need the XQuartz instead of X11 support. Download it from https://www.xquartz.org. R 3.3.0 and RGtk2 2.20.31 are recommended for RGtk2 installation.

信号校正

  • 文件准备
    Meta file
    该文件包含样品名称,分组信息,批次和进样顺序。
    1.Class:QC样品此处标为NA
    2.Order:进样顺序
    3.Batch:样本的批次信息
    4.Meta文件和Profile文件的样品名称必须一致

代码实例

## Examples Codelibrary(statTarget)datpath <- system.file('extdata',package = 'statTarget')
samPeno <- paste(datpath,'MTBLS79_sampleList.csv', sep='/')
samFile <- paste(datpath,'MTBLS79.csv', sep='/')
shiftCor(samPeno,samFile, Frule = 0.8, MLmethod = "QCRFSC", QCspan = 0,imputeM = "KNN")

参考:

[1] Luan H., Ji F., Chen Y., Cai Z. (2018) statTarget: A streamlined tool for signal drift correction and interpretations of quantitative mass spectrometry-based omics data. Analytica Chimica Acta. dio: https://doi.org/10.1016/j.aca.2018.08.002
[2] Luan H., Ji F., Chen Y., Cai Z. (2018) Quality control-based signal drift correction and interpretations of metabolomics/proteomics data using random forest regression. bioRxiv 253583; doi: https://doi.org/10.1101/253583
[3] KNN,k-临近算法
[4] statTarget官网

[5] https://www.jianshu.com/p/f2f542032fd2

statTarget-基于QC样本的代谢组学数据校正相关推荐

  1. 火山图 多个样本、_statTarget-基于QC样本的代谢组学数据校正

    导读 质量控制是基于质谱组学数据获得可重复性和准确性结果的必要步骤.重复使用相同的QC样本在MS run order序列中对信号漂移的评估和校正越来越被接受,尤其有利于提高批次间实验数据的质量,sta ...

  2. 基于GC - MS的代谢组学研究揭示:SD大鼠和Wistar大鼠之间存在系统的代谢差异及乙醇灌胃反应差异

    Author: Xianfu Gao,Aihua Zhao,Mingmei Zhou,Jingchao Lin,Yunping Qiu,Mingming Su,Wei Jia 写在前面: 大鼠被誉为精 ...

  3. 生物信息学|MOLI:基于深度神经网络进行多组学数据整合并用于药物反应预测

    本篇推文引自:MOLI: multi-omics late integration with deep neural networks for drug response prediction 摘要 ...

  4. 组学数据上传(五):代谢组学数据

    继扩增子.转录组.蛋白组.基因组数据上传教程发布后,组学数据上传教程最后一弹--代谢组数据上传教程来罗,有需要的一定要点赞加收藏!后续上传数据遇到问题可以私聊小编!接下来我们来了解下代谢组学常用数据库 ...

  5. 非靶代谢组学数据预处理XCMS+IPO

    质谱可以用来测量样品中带电分子(离子)的丰度(即一个特定的质荷比 m/z的离子计数). 但是,当许多离子具有相同或非常相似的 m/z,光凭借质谱是很难或不可能进行区分的.因此,MS 经常与其他分离技术 ...

  6. 代谢组学数据分析及网络药理学研究技术与实践

    一.代谢组学研究技术与实践 1.代谢组学简介及样本的采集与制备关键问题探讨 1.1 代谢组学概述 1.2 代谢组学操作流程 1.3 样本的采集.储存与制备关键问题 2.代谢组学数据采集与预处理,决定数 ...

  7. 【无标题】学习CADD-AMBER--薛定谔--代谢组学及网络药理学知识内容

    CADD专题 CADD-同源建模-蛋白-薛定谔-Amber-代谢组学及网络药理学专题学习 生物分子互作基础 1.生物分子互作用研究方法 1.1蛋白-小分子.蛋白-蛋白相互作用原理 1.2 分子对接研究 ...

  8. 代谢组学数据处理软件——NormalizeMets

    导读 NormalizeMets是一个R语言集成包,主要用于代谢组学研究中数据的归一化.这个包可以用于去除数据中的噪音,如大样本中存在的共性问题--质谱信号偏移.那么除此之外,这个包还可以进行图形的交 ...

  9. 百趣代谢组学分享:从SWATH到MRM:一种新型高覆盖度靶向代谢组学技术

    百趣代谢组学文献分享,SWATHtoMRM: Development of High-Coverage Targeted Metabolomics Method Using SWATH Technol ...

最新文章

  1. Java中如何合并有个具有相同key的Map
  2. fastjson序列化原理详解
  3. 数据库事务转载基础一:oarcle事务
  4. MySQL失效情况(范围查询,字段运算)
  5. python总结函数图像_PIL使用小结(crop和paste函数)
  6. okcoinapi开发代码_比特币程序化交易入门(5):WebSocket API
  7. tomcat(10)安全性
  8. 诗与远方:无题(五十九)
  9. 互联网进入智慧互联时代 CSS将推进行业安全生态建设
  10. 微软再次强调:爱开发 爱 Linux!
  11. flv格式php怎么播放不了,FLV格式视频不能在网页播放的解决办法
  12. 建设银行网银U盾证书更新教程【证书更新】
  13. (七) 立创EDA之PCB设计示例
  14. 4.链表LinkedList
  15. 台式计算机键盘灯打开方式,台式机开机黑屏但键盘指示灯亮的解决方法
  16. 工厂制造业ai人工智能应用_人工智能与金融服务业转型的未来
  17. JINI和java space入门
  18. nn.Parameter
  19. 堆结构(二) - 左倾堆的原理与实现
  20. Xshell、xftp 安装PJ 以及使用

热门文章

  1. 20多岁大专生吐槽:面试39岁同济大学毕业的测试专家,对方却连简单编程题都不会!...
  2. JSBridge 技术原理分析
  3. 腾讯员工上半年人均月薪 7.8 万,网友:别人拿月薪我拿年薪。。。
  4. 面试被问到Redis实现发布与订阅,手摸手教
  5. 书中自有BAT Offer!
  6. 看板与Scrum:哪个更适合你的团队?
  7. 分享15个堪称神器的资源网站,让你万事无忧!
  8. 使用Leangoo共享脑图/思维导图做多级需求管理
  9. 车 局部路径规划与避障
  10. jquery按钮禁用(全)