这才是GEO数据库挖掘的正确姿势

前阵子,酸谈学社的大师兄Ewen给大家介绍了一个GEO数据集分析工具shinyGEO。本期小编就再来给大家介绍一个来自大英帝国的GEO数据分析神器-GeoDiver(https://www.geodiver.co.uk/ )。

1

首先,官网的使用界面非常直观简单,不仅可以高质量的作图,还可以做差异表达和基因富集分析。听着就感觉非常666,而其用户体验也确实是更加nice,下面让我们一起去探索学习吧。跟shinyGEO一样,用户只要输入GEO dataset的编号运行即可。比如网站的举例数据GDS724,输入编号后,网站会自动识别分组因素,包括不同组织间比较或者individual间的比较。另外,ADVANCED PARAMETERS里还有更多可供选择的参数,包括列表里展示的差异表达基因数目、P value的矫正方法、热图里展示的基因数目、热图聚类的方法,及树状图的展示等等。

2

接下来,我们以individual为例分析下数据挖掘结果:Overview Boxplot从此图可以看到表达量的均值还是有波动的,没有完全在一条直线上,说明数据没有进行归一化,而归一化的目的是调整由于基因芯片技术引起的误差。但在实际的数据分析过程中,数据均值的这条线,只要没有太大的波动,像本例中的情况还是可以用的。如果要进行均一化,一般用平均数或者中位数进行标准化处理,那样处理也更加科学严谨。主成分分析(Principal Component Analysis)我们可以看到PC1和PC2两个主成分的解释度超过了60%,按推断应该可以通过主成分的的坐标图将两组分开,实际情况如下:1)2D图2)3D图用户可以自行选择主成分,观察主成分是否能够将两组数据分开,以判断两组样本是否存在差异,本例数据来看,两组间的差异还是比较明显的。热图(Heatmap)热图分为两个模块,一个模块是差异表达的基因(很像是Pheatmap的作图风格啊,应该就是它了),另外一个是gene set的富集分析图。不管是差异表达的基因还是富集到的通路,网站都提供搜索功能,可在Table的右侧进行搜索筛选。富集到的每个通路,用户可以点击如下图所示的红色箭头,查看在KEGG中的通路情况,而且应该是实时的KEGG通路数据(笔者推测,因为加载通路数据时需要一些时间),所以功能还是比较强大的。火山图网站作者煞费苦心,画了两个火山图如下。笔者认为火山图就只是一个粗略的展示,并没有太多意义。当然,对于筛选差异表达基因时观察某个基因在整体中的情况,还是有一定帮助意义的。这个网站能够完成基本的GEO数据分析,就看各位能不能各显神通,用好这个工具啦!—END—欢迎大家关注解螺旋生信频道-挑圈联靠公号~

                                                                        点下“在看”,多根头发

geo数据差异分析_GeoDiver:GEO数据挖掘分析利器相关推荐

  1. geo数据差异分析_答疑呀嘿丨如何对GEO数据库的数据进行差异表达基因分析?

    又是一周答疑时间到! 感谢本周答疑老师-上海其明的杨老师,侯老师和张老师! 本周又有一些小伙伴提出了他们的问题,有一些真的对大家比较有参考意义,注意认真阅读哦~ Q1-生信分析 问:想对GEO数据库的 ...

  2. geo数据差异分析_GEO数据分析之差异基因分析

    Step2-Differential-Expression-Genes 上一篇中做了:GEO数据下载和表达矩阵提取及质控.接下来是差异基因的获得. 一.差异分析 1.表达矩阵 #1.表达矩阵 load ...

  3. geo数据差异分析_GEO2R:对GEO数据库中的数据进行差异分析

    GEO数据库中的数据是公开的,很多的科研工作者会下载其中的数据自己去分析,其中差异表达分析是最常见的分析策略之一,为了方便大家更好的挖掘GEO中的数据,官网提供了一个工具GEO2R, 可以方便的进行差 ...

  4. geo数据差异分析_使用GEO数据库来筛选差异表达基因,KOBAS进行KEGG注释分析

    前言 本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquiti ...

  5. 云计算/大数据/Hadoop2.0/MongoDB/数据挖掘分析/视频教程

    点击进入http://item.taobao.com/item.htm?spm=2013.1.0.0.Al9QzH&id=39577795278 全部内容]:课程内容(更新于2014-3-23 ...

  6. Front Immunol 复现 | 1. GEO数据下载及sva批次校正(PCA可视化)

    FII 前几天有同学问了一篇文章里的一个方法的实现,看了一下这篇文章除了qPCR验证基本都是纯生信,今天就试着来复现一下.随缘复现哈,如果阅读数据不好看的话,可能就放弃了,希望大家多多点赞.在看,转发 ...

  7. 临床小白GEO 数据快速处理

    ** 临床小白GEO 数据快速处理 ** 工具:R+Sangerbox(https://shengxin.ren/article/222) 1.下载GSE并整理矩阵 行名为基因名 列名为样本名 如果行 ...

  8. 网站分析实战——如何以数据驱动决策,提升网站价值(大数据时代的分析利器)

    网站分析实战--如何以数据驱动决策,提升网站价值(大数据时代的分析利器) 王彦平吴盛峰  编著 ISBN 978-7-121-19312-5 2013年1月出版 定价:59.00 316页 16开 编 ...

  9. RNA 1. SCI 文章中读取 GEO 数据

    依稀记得10年前一个样本的RNA-SEQ费用还是蛮高的,而现在就是洒洒水啦,所以这种转录组的数据也已经成为文章的主流,基本上就是WES结合RNA,但是个人感觉,真的能关联到突变基因和表达的水平上去的, ...

最新文章

  1. uitableviw 自适应高度
  2. Android原生绘图进度条+简单自定义属性代码生成器
  3. CACTI 0.87e 安装
  4. Oracle笔记-USRS01.DBF文件过大,解决办法
  5. (5):Silverlight 2 实现简单的拖放功能
  6. 泡泡玛特上市首日涨79.22%报69港元 总市值953亿港元
  7. AJAX Control Toolkit ——FilteredTextBoxExtender(文本过滤)
  8. 开课吧:全栈工程师的关键开发技能(硬实力)
  9. 2020Java学习路线(珍藏版)
  10. 【数学建模】【lingo】lingo的基本操作
  11. iOS原生二维码扫描白屏问题
  12. 哪个软件测试交易系统好用,交易系统测试结果的可信度检验
  13. 使用Python库valuequant和每股收益历史数据计算股权价值
  14. Django学习之视图层
  15. Basset: learning the regulatory code of the accessible genome with deep convolutional neural network
  16. 验证手机号码格式的正则表达式编写思路详解
  17. 第七周--项目1-静态成员应用
  18. DIY一个UNISOLDER焊台无线红外休眠座
  19. PTA 7-47 打印选课学生名单
  20. H3C模拟器 用户名包含非ASCII字符启动失败 解决方案/windows中文用户名修改

热门文章

  1. python彩色图像如何进行高斯滤波ValueError: correlate2d inputs must both be 2-D arrays解决方法
  2. CSP认证201509-3 模板生成系统[C++题解]:字符串处理、模拟、哈希表、引号里面有空格的字符串怎么读入
  3. 中国人民大学_《组织行为学》_15如何降低集体决策的风险?
  4. django models索引_django-models – Django模型“IndexError:列表索引超出范围”Pydev
  5. 两个列表合并去重_花生AI论文去重V1.4更新合并查同义词功能
  6. python语言使用什么语句实现上下文管理协议_Python with语句上下文管理器两种实现方法分析...
  7. python heap_python topN max heap,使用heapq还是自己实现?
  8. android 圆滑曲线,如何使用贝塞尔曲线在一组点上绘制平滑线?
  9. linux内核md5,浅谈MD5及简单使用
  10. mysql免安装版鞋子_MySQL创建用户及授权