LEfSe (Linear discriminant analysis Effect Size) 是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义和生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker)。

1. 在线安装

Galaxy 中可以使用 admin 账号在 Tool Shed 中直接搜索 lefse,并根据提示一步一步进行安装。本文章的所有截图与操作均来自于 zGalaxy,一个基于 Galaxy release_17.09,部署在阿里云 ECS 经过深度定制的中文版生物信息分析测试平台。

安装完成的网页界面:

2. 模块依赖

LEfSe 的执行需要解决 R、python 依赖:

  • R libraries: splines, stats4, survival, mvtnorm, modeltools, coin, MASS

  • python libraries: rpy2 (v. 2.1 or higher), numpy, matplotlib (v. 1.0 or higher), argparse

  
  1. $ cd <GALAXY_ROOT>

  2. $ . .venv/bin/activate

  3. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  4. $ pip install matplotlib==1.5.0

  5. (.venv)galaxy@ecs-steven 16:30:55 /data/galaxy-dist/galaxy

  6. $ pip install rpy2==2.8.6

matplotlib >= 2.0.0 会导致 LEfSe 的 B)LDAEffectSize(LEfSe) 运行出现 warnning,虽然生成的结果是没问题的。

   
  1. /data/galaxy-dist/galaxy/.venv/lib/python2.7/site-packages/matplotlib/artist.py:896: MatplotlibDeprecationWarning: The set_axis_bgcolor function was deprecated in version 2.0. Use set_facecolor instead.

  2.  return func(v)

3. 测试与使用

3.1 A) Format Data for LEfSe

第一步,点击 Galaxy 的 "获取数据""数据上传""Choose local file"选择本地文件(hmpaerobiosissmall.txt)设置 Type: tabular"start"

  
  1. wget http://huttenhower.sph.harvard.edu/webfm_send/129 -O hmp_aerobiosis_small.txt

第二步,点击 Galaxy 中 LEfSe 分析下的 "A) Format Data for LEfSe",选择第一步输入的数据,设置参数如下。

第三步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "2: A) Format Data for LEfSe on data 1"

如果 Galaxy 历史栏的结果中出现格式报错:

这是因为在 Galaxy 中执行 A) Format Data for LEfSe 分析产生的结果默认为 lefse_internal_for 格式,但 Galaxy 本身无法识别该格式。这就需要我们在  config/datatypesconf.xml 中增加 lefseinternal_for 数据格式的登记信息,然后重启 Galaxy 。

   
  1. <?xml version="1.0"?>

  2. <datatypes>

  3.    <registration>

  4.        ...

  5.        <datatype extension="lefse" type="galaxy.datatypes.data:Lefse" display_in_upload="true"/>

  6.        <datatype extension="lefse_res" type="galaxy.datatypes.tabular:LefseRes" display_in_upload="true"/>

  7.    </registration>

  8. </datatypes>

参考:https://toolshed.g2.bx.psu.edu/repository/viewchangeset?ctxstr=db64b6287cd6&id=cabebb0465f009e4


3.2. B) LDA Effect Size (LEfSe)

第一步,点击 Galaxy 中 LEfSe 分析下的 "B) LDA Effect Size (LEfSe)",选择 A 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "3: B) LDA Effect Size (LEfSe) on data 2"


3.3. C) Plot LEfSe Results

第一步,点击 Galaxy 中 LEfSe 分析下的 "C) Plot LEfSe Results",选择 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "4: C) Plot LEfSe Results on data 3"


3.4. D) Plot Cladogram

第一步,点击 Galaxy 中 LEfSe 分析下的 "D) Plot Cladogram",选择 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "5: D) Plot Cladogram on data 3"


3.5. E) Plot One Feature

第一步,点击 Galaxy 中 LEfSe 分析下的 "E) Plot One Feature",选择 A 和 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "6: E) Plot One Feature on data 3 and data 2"


3.6. F) Plot Differential Features

第一步,点击 Galaxy 中 LEfSe 分析下的 "F) Plot Differential Features",选择 A 和 B 的结果数据,设置参数如下。

第二步,点击 "Execute",提交任务执行。任务完成,在右侧历史栏可以看到生成的结果 "7: F) Plot Differential Features on data 3 and data 2",点击眼睛图片可以下载本次分析的打包文件(*.zip)。

·end·

—如果喜欢,快分享给你的朋友们吧—

我们一起愉快的玩耍吧

本文分享自微信公众号 - 生信科技爱好者(bioitee)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

Galaxy 平台下 LEfSe 安装与使用教程相关推荐

  1. linux 卸载 patch,Oracle RAC 平台下 Patch 安装与卸载 步骤 收藏

    之前整理过一篇Oracle Patch 的文章,参考: 关于Oracle Patch 的知识,参考之前的文章. 这篇主要是演示下RAC 平台下Patch 的安装与卸载. 一.  Path 安装说明 在 ...

  2. Windows平台下SVN安装配置及使用

    1.1Svn和VisualSvn介绍 VisualSvn Server2.5.6(版本控制服务器)免费开源软件 是基于Windows平台上的Subversion服务器,它是免费的 官方下载: http ...

  3. linux平台下MongoDB安装和环境搭建及踩过的坑

    由于demo上线部署时需要用到mongodb来存储数据,这里决定写一篇博客来记录一下安装过程以及遇到的问题的解决方案. 注:文末有福利! 先写一下安装并启动mongodb正确的步骤,然后再总结其中遇到 ...

  4. MySQL学习之路(一):Windows平台下MySQL安装、启动、连接

    MySQL安装.启动.连接. 一.MySQL的基本介绍: (更好的阅读体验,请移步我的个人博客) MySQL是一款优秀的关系型数据库系统(数学模型基于关系代数),以其优秀的性能和开放源代码的许可而广泛 ...

  5. Linux4.0平台下Oracle10g安装

    原创于2008年12月25日,2009年10月19日迁移至此. 参考文档: <Oracle ? Database Installation Guide 10g Release 2 (10.2) ...

  6. 记录mac 平台下 AndroidStudio 安装配置问题

    在mac电脑上安装好Android Studio后如果不想用默认的jdk的话,务必要下载jdk1.8版本(不是任何东西新的都是最好的),否和会出现各种奇葩问题. 当安装好环境以后,创建了一个模拟器,想 ...

  7. Win10 平台下, LightGBM GPU 版本的安装

    1. Light GBM 简介 在数据挖掘和传统机器学习领域,提起大名鼎鼎的 XGBoost,相信很多人都听说过,尤其是在 Kaggle 赛场上,XGBoost 更是风光无限,不过今天的主角却不是 X ...

  8. Linux平台下Eclipse的安装

    Linux平台下Eclipse的安装(2007-06-26 09:50:22)   分类:他山之石 Linux平台下Eclipse的安装 Linux平台下Eclipse的安装2007年06月15日 星 ...

  9. linux hadoop etc目录,题目Linux平台下Hadoop的安装配置

    1Linux平台下Hadoop的安装配置 以下操作均是在虚拟机VWMare10.0平台上安装ubuntu12.04实现.首先要在ubuntu下穿件Hadoop用户. Ubuntulinux查看系统版本 ...

  10. 各种平台下Perl模块的安装方法

    各种平台下Perl模块的安装方法 来源:http://www.linuxforum.net David lee (2001-04-21 18:11:53) Perl到了第五版增加了模块的概念,用来提供 ...

最新文章

  1. firefox+firebug
  2. [置顶] 分步实现具有分页功能的自定义DataList控件【附源代码】
  3. 计算机系统存数及取数方式,计算机系统结构总结2
  4. 初学者用涩性胶皮好还是粘性_乒乓球胶皮的保养方法
  5. 重装JDK后Tomcat和Eclipse的配置
  6. boost::noinit_adaptor用法实例
  7. 华为手机什么时候更新鸿蒙系统_华为鸿蒙系统什么时候能超过iOS、安卓?任正非表态了...
  8. 想重装java jdk_jdk怎么重新安装
  9. gridview使用ObjectDataSource做删除时记得设置DataKeyNames
  10. ztree在刷新时第一个父节点消失_从反向传播推导到梯度消失and爆炸的原因及解决方案(从DNN到RNN,内附详细反向传播公式推导)...
  11. html中图片阴影怎么写,css如何给图片加阴影?
  12. 2.lvm动态逻辑卷
  13. 巴法云 mixly 扩展库
  14. Node.js 静态web服务
  15. [JavaScript]45 Fresh Useful JavaScript and jQuery Techniques and Tools
  16. 高等数学学习笔记——第七十六讲——直角坐标系下二重积分的计算
  17. pythoncad标注教程_CAD 2014二维三维建模渲染标注基础与提升视频教程
  18. Kaldi语音识别技术
  19. 【TV Picture Quality - 02】TV常见信号接口
  20. Python地理数据处理 十一:空间参照系统(SRS)

热门文章

  1. blos硬盘启动台式计算机,最新戴尔台式机bios设置硬盘启动图解
  2. 【转】金蝶KIS云·专业版私有云V16.0于2021年12月31日发布全新安装包
  3. 安卓谷歌地图打开闪退问题解决
  4. webp图片实践之路
  5. 任正非讲话稿400篇_重磅干货丨任正非讲稿400篇(1994—2018)
  6. Win10应用设计的那些事儿
  7. 伪逆矩阵(pseudo-inverse)
  8. window窗口切换快捷键
  9. idea社区版和企业版区别_idea 社区版开发 springboot及问题
  10. 【uniapp 课程表】