今天给大家讲讲芯片数据分析中常见的一些图的作用,让大家伙儿知道它们在BB些啥。

箱式图(Box plot)

基因芯片的原始数据是需要进行标准化处理的,主要目的是消除由于实验技术(如荧光标记效率、扫描参数的设置、空间位置的差异等)所导致的基因表达量的变化,让各个样本和平行实验的数据处于相同的水平,使得基因表达数据真实地反映测量样品的生物学差异。

箱式图反映的是标准化前后的基因表达数据情况,标准化后,整体数据的中位数会处于同一水平线上(见下方右图),这表明标准化的结果很好。常用的芯片间数据标准化方法有Quantile Normalization和Global Normalization。

散点图(Scatter plot)

芯片数据的散点图常用于评估两组数据总体分布集中趋势,是由芯片分析的原始数据经过标准化处理,转化为log2的对数后,在一个二维直角坐标系平面中绘制而成的。如果集中趋势不好,则表明芯片数据处理的不好(一般是标准化,归一化做的不好)。散点图中每个点代表一个探针信号,X轴Y轴数值分别对应该探针信号在不同样本中的强弱(下图X轴是Ctrl组,Y轴是Exp组),图中的绿线是Fold change的阈值线(一般是±2),即绿线之外的点在信号强弱(基因表达量)上是具有显著差异的。

聚类分析(Hierarchical cluster)图

聚类分析是为了寻找数据之间的相似性进行分类。基因芯片数据分析中比较常用的是分层聚类,它是利用一系列计算,首先找到关系最近(基因表达行为具有相关性等)的两群合并,再找关系相近两群再合并,直到所有的群合并到一个组中。用挑选的差异基因的表达情况来计算样本之间的相关性,对差异基因进行聚类分析可以全面地直观地展示样品之间的关系及差异情况(见下图)。一般来说,同一类样本能通过聚类出现在同一个簇(cluster)中(如果同一类样本,比如实验组3个样本,不能被聚类,则说明芯片分析的结果不好),聚在同一个簇的基因可能具有类似的生物学功能。下图就是比较常见的聚类分析的热图(Heat map)。

1、色表,表示由蓝到红对应到基因表达量的变化,蓝色表示低表达,红色表示高表达;

2、树状图,X轴方向是样本的聚类,Y轴方向是基因的聚类;

3、每个色块代表一个基因的表达量,X轴对应所属样本,Y轴对应基因名称。

火山图(Volcano plot)

火山图就是长得像火山喷发的图(本宫真的没在瞎BB)。火山图在一张图中显示了两个重要的指标,Fold change和P-value,可以非常直观且合理地筛选出在两样本间发生差异表达的基因。比如下图,X轴是log(Fold change),Y轴为-log(P-value),设置FC和P-value的阈值筛选差异基因,那些红点表示的就是差异基因

GO图

在上次的文章(有关生物信息学你必须要知道的)中提到基因本体论(Gene ontology, GO)是对基因功能的注释,它由许多个词条构成,而这些词条是有层次的,它们具有从属关系,所以这些词条构成了一个有向无环图。GO的最顶层是细胞组分(Cellular Component, CC),分子功能(Molecular Function, MF)和生物学过程(Biological Process, BP)这三个词条。下图就是一个GO富集分析的结果。

维恩图(Venn diagrams)

维恩图用于显示元素集合重叠区域,举个应用的例子吧,芯片分析筛选出的差异表达基因是一个集合,数据库中查询的疾病相关基因是一个集合,我们把这两个集合取一个交集,这个交集中的基因就是我们可能会感兴趣的基因。下图中,作者定义了4个集合,4个集合均取交集的结果为0,所以作者只能退而求其次,选3个集合的交集。

文中插图的来源文献:

1、Exploring functions of long noncoding RNAs across multiple cancers through co-expression network

2、Microarray profiling analysis of long non-coding RNAs expression in tendinopathy: identification for potential biomarkers and mechanisms

3、Identification of differentially expressed genes and small molecule drugs for the treatment of tendinopathy using microarray analysis

4、

最后,再给大家推荐两篇文章练练手:

1、Circulating microRNA-150-5p as a novel biomarker for advanced heart failure: A genome-wide prospective study

2、Genome-wide analysis of long noncoding RNA (lncRNA) expression in colorectal cancer tissues from patients with liver metastasis

没有下载权限的童鞋可以去SCI-HUB下载(http://www.sci-hub.io/)。

比较两组数据的差异用什么图更直观_芯片数据分析中常见的一些图的作用相关推荐

  1. 比较两组数据的差异用什么图更直观_试验数据统计中常用的 量,图,和线再也不担心文章的统计用图了!...

    本文来源:小麦研究联盟 今天跟大家详细总结一下我们农业试验数据统计中常用的 量,图,和线. 如果不想看下边长篇大论,请看小编给您总结的懒人包: 标准差: 群体的标准差是群体中所有数据方差的平方根,它衡 ...

  2. 比较两组数据的差异用什么图更直观_科研数据可视化:巧妙运用各种形式的图表...

    导读: 图片和表格不仅是讲述科研故事的有力工具,也是科学出版物的重要组成部分.科研论文数量种类庞杂,在这个快节奏的时代,为了更高效地获取论文的重要信息,读者通常会跳过稿件的正文,而主要查看文中图表所传 ...

  3. 比较两组数据的差异用什么图更直观_你真的懂如何展示数据吗?

    ↑ 关注 + 星标 ~ 有趣的不像个技术号每晚九点,我们准时相约  偶尔应金主爸爸要求改时间  大家好,我是朱小五 如何来展现的你的数据?是你有时不得不去思考的一个问题. 不同的展示方法,其效果往往差 ...

  4. 比较两组数据的差异用什么图更直观_标准差、Z分数到底是什么鬼??标准差与Z分数的原理与实例介绍 | 心理统计学...

    阿猫同志目前在职读研的专业是应用心理学,2月完成了心理与教育测量学的学习,3月目前在自学心理与教育统计学,每日上班+学习的充实生活,让我想说一句 心理测量学需要有心理统计学基础,当时阿猫在学习常模参照 ...

  5. 比较两组数据的差异用什么图更直观_用8分钟给你讲讲line graph的写法

    我是雅思写作老师宋京航,这是我的第一篇教学文章/视频.按照常规操作,我可能需要给你讲一下考试介绍和考情分析,但是那些百度能搜到的废话我确实不想写.那么, 我们直接进入正题.以上有吹拉弹唱视频版,以下润 ...

  6. 比较两组数据的差异用什么图更直观_扩增子图表解读7三元图:三组差异数量和关系...

    点击上方蓝色「宏基因组」关注我们!专业干货每日推送! 背景介绍(Introduction) 宏基因组学 宏基因组学目前的主要研究方法包括:16S/ITS/18S扩增子.宏基因组.宏转录组和代谢组,其中 ...

  7. 比较两组数据的差异用什么图更直观_用Excel制作旋风图

    旋风图是较为常用的数据对比图表,这种"背靠背"式的图表可以更直观地对比两组数据. 基本形态的制作 第一步 首先选取数据(数据我自己编的,以此为例)插入簇状条形图 之后你会得到这样一 ...

  8. python 分析两组数据的差异_R语言limma包差异基因分析(两组或两组以上)

    使用limma包进行差异基因分析时,做最多的是两分类的,例如control组和disease组,但也会碰到按照序列进行的分组.这时,如果逐一使用两两比较求差异基因则略显复杂.其实开发limma包的大神 ...

  9. 比较两组数据的差异用什么图更直观_用好这11种可视化图表,数据可视化技能秒提升...

    可视化不是单纯的数据展示,其真正价值是设计出可以被读者轻松理解的数据展示.数据与合适的图形结合,不仅能够让复杂的统计数字简单化.形象化,还能给读者一种视觉的享受. 今天,就让我们根据数据分析软件亿信A ...

最新文章

  1. 求第k小元素:采用特定分治策略
  2. 学术写作利器——LaTeX入门笔记整理(不定期更新,附加使用心得)
  3. boost::contract模块实现loop的测试程序
  4. Sqoop(四)增量导入、全量导入、减量导入
  5. CodeForces - 1333F Kate and imperfection(数论+贪心)
  6. 【GIF动画+完整可运行源代码】C++实现 堆排序——十大经典排序算法之七
  7. 用JS写了一个模拟串行加法器
  8. 第七季2:MP4v2库的移植与播放实战
  9. pd17虚拟机启动器怎么生成?快来看看吧
  10. 开源项目的网址[不定时更新]
  11. SQL Server使用convert对datetime日期数据进行获取
  12. Apache Sqoop性能调整
  13. “校内网”将不存在,“校内网”更名为“人人网”
  14. 圆弧的函数c语言,VC++中Arc函数画圆弧
  15. 关于NOI Linux的IDE及代码调试技巧(OIER必看)
  16. python游戏编程
  17. “华为“和“荣耀”区别日益明显,荣耀传递潮流价值观
  18. linux启动分区丢,Linux装机因为分区丢失引导解决办法
  19. DWA动态窗口法的原理及应用
  20. python翻译中文读法_Python如何将中文翻译成拼音?,又,一个,奇葩,要求,是,转,的...

热门文章

  1. win 2016 ssh_如何使用BPF将SSH会话转换为结构化事件
  2. Vivado中RTL封装IP流程
  3. 基于FPGA的直流电机PWM控制+毕业论文
  4. python中列表实现自加减元素_python初学者知识整合
  5. halcon 将数据保存到excel_Python保存数据到Excel文件的多个sheet
  6. java返回属性_java – 根据对象属性确定哪个枚举返回
  7. upload-labs_pass20-move_uploaded_file函数特性
  8. websocket网络层详解_【技术分享】WebSocket漏洞与防护详解
  9. python2.7安装pip_python2.7 安装pip的方法步骤(管用)
  10. stm32l0的停止模式怎么唤醒_最强家庭娱乐系统+儿童模式,小度在家智能屏X8开售抢先体验...