XCMS | LC/MS and GC/MS Data Analysis
XCMS包的安装及要求
xcms是基于R语言设计的程序包(R package),可以通过Bioconductor进行安装。具体信息请参考https://bioconductor.org/packages/release/bioc/html/xcms.html
安装Bioconductor
安装XCMS
安装数据及其他R包
原始数据转换
xcms支持xml、mzData、mzXML、mzML、netCDF等数据格式,因而在利用xcms进行数据处理之前,需要对于质谱采集的原始数据进行格式转换,一般可使用ProteoWizard等。
利用XCMS进行峰检测及对齐
(Bioconductor上已有xcms数据处理的具体指导,参见https://bioconductor.org/packages/release/bioc/vignettes/xcms/inst/doc/xcms.html) 由于xcms3对xcms中的方法名称进行了调整,对于一致使用xcms进行数据处理的用户来说可能会造成一定的困扰,目前xcms3还继续兼容大多数旧的xcms方法,但随着程序的进一步更新,势必会逐步取代过去的方法,因而,大家还是需要尽快熟悉新的方法的使用。在此,为方便大家理解,本文对同一处理分别使用新旧方法进行演示。
调用R包
数据导入
利用centWave算法进行峰检测
findChromPeaks是xcms中用于进行峰检测的新方法,输入值为'OnDiskMSnExp'对象和峰检测参数对象,CentWaveParam用以创建'CentWaveParam'对象,该对象设置使用'centWave'算法进行峰检测时所需要的参数,其中比较常用的参数如下:
* ppm -- 峰检测时MS1的m/z tolerance,以ppm为单位
* peakwidth -- 长度为2的向量,设置峰检测时峰宽范围,事实上该参数对应的每个峰可以跨越多少个质谱检测的scan,而非多少秒
* snthresh -- 峰检测时信噪比要求
* return.type -- 返回数据类型,可以根据要求返回'XCMSnExp'类数据(默认)、传统的'xcmsSet'类以及'list'
xcmsSet是xcms中可以用于峰检测的传统方法,使用method参数设置峰检测算法,另外根据不同的峰检测算法可以设置该算法需要的参数,详情请参考xcms官方文档。其中'centWave'算法所对应的参数与'CentWaveParam'设置基本一致。
峰检测时除了可以使用centWave算法外,还可以使用其他算法,如'centWaveWithPredIsoROIs'、'massifquant'、'matchedFilter'、'MSW'等,分别对应'CentWavePredIsoParam'、'MassifquantParam'、'MatchedFilterParam'、'MSWParam'参数设置,详情请参考xcms官方文档或者使用R help
峰对齐及分组(peak alignment & grouping)
同一代谢物在不同样品的流出时间会略有差异,因而对于峰检测的结果需要进行对齐(alignment)并将不同样品中的统一代谢物分到各自可以表征该代谢物的峰组(peak group)中(代谢组学中一般成为feature),从而进一步比较不同样品间统一代谢物的含量。通常我们可以使用'obiwarp'算法进行peak alignment,然后利用'density'算法进行peak grouping.
峰补齐
对于峰检测过程中会有部分feature在某些样品中未检出对应代谢物峰的清醒,xcms可以根据已检出feature的信息,在相应样品中强行提取EIC信息,从而计算该代谢物在该样品中的含量信息,我们一般称之为filling gaps
如此,对于一组代谢物样品的峰检测已经全部完成。
对比xcms用于峰检测的新方法和就方法,我们可以发现新方法在命名方面更加直白,可以根据方法名称直接了解该方法所使用的算法,而在以前的峰检测方法中,这些算法均整合在数据处理的过程中。两种方式格局优劣,新方法意义明确,但是在处理时需要更多的参数设置过程,而旧方法数据处理过程更加简洁,但需要对xcms熟练度要求较高。
参考资料
https://www.bioconductor.org/packages/release/bioc/html/xcms.html
XCMS | LC/MS and GC/MS Data Analysis相关推荐
- 基于GC - MS的代谢组学研究揭示:SD大鼠和Wistar大鼠之间存在系统的代谢差异及乙醇灌胃反应差异
Author: Xianfu Gao,Aihua Zhao,Mingmei Zhou,Jingchao Lin,Yunping Qiu,Mingming Su,Wei Jia 写在前面: 大鼠被誉为精 ...
- GC—MS常见数据库有哪些,NIST和AMDIS有什么作用?
GC-MS常见数据库有哪些,NIST和AMDIS有什么作用? (1)提出问题 GC-MS常见数据库有哪些,特点是什么?NIST和AMDIS有什么作用? (2)GC-MS常见数据库介绍 谱库检索是定性分 ...
- 烟用香精计算机辅助调香,GC/MS结合计算机辅助调香系统在烟用香精配方解析中的应用...
摘要: 烟用香精香料是卷烟生产最重要的原料之一,是构成香烟品牌风格的重要因素,其配方也是烟草行业的核心技术之一.在烟叶中添加烟用香精香料能起到加香矫味的作用,并且能达到协调香味的目的,使不同等级和类型 ...
- 转录组分析综述A survey of best practices for RNA-seq data analysis
转录组分析综述 转录组 文献解读 Trinity cufflinks 转录组研究综述文章解读 今天介绍下小编最近阅读的关于RNA-seq分析的文章,文章发在Genome Biology 上的A sur ...
- client elapsed: 0 ms, server elapsed: 1022 ms, timeout: 1000 ms,
{timestamp: 1528113688276, status: 500, error: "Internal Server Error",-} error : "In ...
- Hi-C data analysis tools and papers
Hi-C data analysis tools and papers 全文链接如下: https://github.com/mdozmorov/HiC_tools Tools are sorted ...
- R语言统计入门课程推荐——生物科学中的数据分析Data Analysis for the Life Sciences
Data Analysis for the Life Sciences是哈佛大学PH525x系列课程--生物医学中的数据分析(PH525x series - Biomedical Data Scien ...
- R语言explore包进行探索性数据分析实战(EDA、exploratory data analysis):基于iris数据集
R语言explore包进行探索性数据分析实战(EDA.exploratory data analysis):基于iris数据集 目录
- R探索新数据分析(Exploratory Data Analysis,EDA)
R探索新数据分析(Exploratory Data Analysis,EDA) 目录 R探索新数据分析(Exploratory Data Analysis,EDA) str方法进行数据概览及类型查看
最新文章
- django外调用url_Django学习(url配置及参数获取)
- Shell之awk常用用法
- ssential Diagram for Windows FormsC#/winForm类似visio的拓扑图节点连线控件免费下载
- [剑指Offer] 数据流中的中位数
- 插件~NuGet与packages管理项目的包包
- 平遥摄影展:卡农•布斯克茨和他的「一天的结束」
- 分布式技术一周技术动态 2016.07.10
- qt显示rgba8888 如何改 frame_Qt开源作品17-IP地址输入控件
- Java 学习笔记之 线程安全
- # 学号20155308 2006-2007-2 《Java程序设计》第4周学习总结
- 【AAAI 2021】全部接受论文列表(一)
- 如何防止手机网页双击屏幕实现放大效果
- 厘米换算英尺英寸 (15 分)如果已知英制长度的英尺foot和英寸inch的值,那么对应的米是(foot+inch/12)×0.3048。现在,如果用户输入的是厘米数,那么对应英制长度的英尺和英寸是?
- mysql group by个数_mysql 统计 group by 之后的 group 的个数
- 嵌入式有什么值得学习的软硬件技术?
- 安卓productFlavors多渠道打包简单使用
- 凹凸世界服务器维护到几点,凹凸世界手游2021年7月21日版本更新停服维护公告_凹凸世界手游2021年7月21日更新了什么_玩游戏网...
- 吴军《智能时代》教会我的那些事
- Navicat cannot add foreign key constraint或者添加外键后不显示
- Python 百度地图 API获取地点经纬度