各位亲爱的土豪富婆,承蒙您慧眼识珠大驾光临大Y老师为您准备的小灶课堂。

-----以下是日常碎碎念,日理万机的您,可以直接跳到图图图图分割线享用-----

对于“诈尸式”更新,大Y老师其实是很不赞同的,尤其是收到土豪富婆的问 (cui) 候 (geng),每天在心头惦念我粉百千次,却腾不出手来更新的时候。本来按计划呢,这一期我们应当继续PCA的进阶,不过,既然这位大牛兄弟提出来要讲一讲MA,你们猜宠粉狂魔大Y老师会作何选择呢?大Y老师真的很高兴看到有人主动提出想要了解的图,相信这位朋友一定是一位积极又努力的优秀牛。大Y老师也一如既往地欢迎大家发私信。

至于为什么隔了这么久,大Y老师还是有必要解释一下。近期在申请几个级别较高的基金,占用了包括吃饭睡觉在内的所有时间,没能快点加更,还请各位大牛海涵(手动抱拳)。说起来,有机会的话,写一些申请书撰写的小技巧,不知大家可有兴趣?

上次我们聊到了婚姻,正巧就出台了一项未婚已育妇女可办理生育津贴的新政。关于婚姻的内核,大Y老师与朋友展开了坦率的交流,也写了很大一段文字想与大家分享。不过可能不够zzzq,还是决定不发出来了。对于中国来说,随着经济的发展,私有化财产的增加,每个个体更加独立,思想也必然更加多元化。80、90后尚且存在“男大当婚、女大当嫁”的思维惯性,00、10、20后以后会怎么看待婚姻制度,怎么选择自己的生活方式,还真是一个未知数啊。

从生物学的角度,结婚不属于人类本能。婚姻制度是人类社会生活的选择,是一个非常法律化、物质化、现实化的框架形式。从法律层面看,你会发现,婚姻里面所有的东西都有价格,除了爱情。为什么有人说婚姻是爱情的坟墓?相对于婚姻的极度现实,爱情极度形而上。爱情完全是精神层面的感受,没有办法用任何法律、物质、现实的载体来衡量。爱情和婚姻的矛盾冲突在婚礼现场达到第一个巅峰。假如你是个愿意留意观察人性的人,就有机会看到,台上山盟海誓的情侣,转眼可能因为礼金分配大闹脾气,象征纯洁爱情的信物,最终一定要比一比克拉大小。这种强烈对比又矛盾统一的状态,让大Y老师愿意揣着礼金,奔波于不同婚宴,并乐此不疲。人性是复杂的,观摩人性是个高深又刺激的课题(大Y老师注,观摩人性可以,但不要考验啊,考验人性是必输无疑的)。

和结婚不同,追求爱情是人类的本能,爱情是人类的情感需求之一。如果做个类比的话,对于很多人来说,亲情就像空气,与生俱来,以至于常常忘记它的存在;友情嘛,像文凭,别管你用什么途径,只要想办法努努力,总能拥有几个,只是含金量会有区别;爱情呢,像奢侈品,摆在橱窗里闪闪发光,让每个人心生向往,但真的不是谁都可以拥有,然后就,满大街都是A货。

那么,有什么办法可以获得真爱吗?看好了,大Y老师告诉你两点干货,第一你得真信爱情,第二,你得向内求。可能有朋友就要质疑了,说我向外追求男神女神都来不及呢,我向内能求到啥呢?你先自己琢磨琢磨,这期碎碎念太多了,下期碎碎念,大Y老师告诉你。

好啦,下面我们就要开始今天的识图之旅啦。老规矩,请大家先一起喝一口水,因为下面的内容可是全网独家干货,真的超干~

-----我是图图图图的分割线-----

【第一回合】

MA(Minus-versus-Add)plot图还有好几个别称,这侧面说明,它的名字其实没有特别的意义。为什么需要MA plot呢?

有时候,人们需要通过点图呈现a, b两组变量在多个因素(比如很多基因表达量)上数值的比较。最直接的就是用这两组数值分别作为横纵坐标画图,当两组毫无差异的时候,数值会全部落在45度斜线上。偏离这条斜线越远,则两组差异越大。但是并非所有人都像王濛一样,眼睛就是尺,当点比较多(如基因比较多)的时候,人很难通过一条斜线来衡量两组数值的关系,尤其很难比较不同点之间,两组到底在哪个点上差异更大。显然这样一个依赖于45度斜线的散点图并不能直观地承载有效信息。于是统计学家想到,可不可以通过某种转换,让这条45度斜线变成一条水平线,那么哪个点偏离了这条线,就一目了然了。转换后的X轴是两组数值的均值,即(a+b)2,Y轴是两组的差值,即b-a,一个是add,一个是minus,这就是MA(Minus-versus-Add)plot了。MA plot在早期microarray(芯片转录组测序)数据分析中会被使用,比如下图:

F1000Res2016

XY轴都是通过转换计算的,不过不管怎么转换,只要是点图,就符合大Y老师所讲的必要元素,让我们快速复习一下点图基础,然后一起解读MA plot。

MA plot的X轴是两组均值。由于众所周知的原因(聪明的你可以回忆一下上上期火山图的内容哦),基因表达量数值范围很大,不适合直接用实际值来画图,所以一般取的是log处理后的,表达量取值呢,CPM、TPM、FPKM,各种标化后的表达量任君选择。Y轴则是两组log处理表达量的差值。让我们来一起回忆一下高中的数学内容,log(b) – log(a) = log(b/a),这不是巧了吗这不是,刚好是logFC(聪明的你可以回忆一下上上期火山图的内容哦)。明确了X和Y轴的来历,咱们就可以轻松地解读MA plot啦。当一个点(即一个基因)的Y值是0,说明它在两组间没有差别,当它X轴数值越大,说明它在两组的均值越大。那么,当一个点的X轴数值很大,Y轴绝对值也很大的时候,就说明它是那种平均表达量高,组间差别还很大的基因,意味着这个基因一定在其中一组有着惊人的表达量。反过来,如果它Y轴绝对值很大,但是X轴数值很小,说明它很有可能是小量表达的基因,微量的变化带来较大的倍数波动。再进一步,聪明的你一定想得到,大部分Y轴绝对值大的点其实会集中在X轴数值居中的部位,所以大部分MA plot是沿X轴流线型或三角形分布的。

当然了,跟火山图类似的,MA plot也可以增加许多补充元素,点的颜色、大小、基因标签等等,让图形更加丰富饱满。

【第二回合】

后来,随着bulk RNA-seq越来越普及,人们发现,未必平均表达量高的基因作用就更大,所以呈现差异基因的时候,MA plot的X轴可能帮不到什么忙。因而,现在MA plot已经很少用来呈现差异基因了,更多研究选择了火山图和热图组合的形式。不过,正是因为可以同时呈现平均表达量和变化量,在质控结果呈现部分,MA plot混得倒是风生水起。一方面,可以直观展示数据测序质量。比如,如果大部分点的X轴数值都接近于0,说明基因表达量普遍偏低,可能测序深度不够,或者文库质量不好。另一方面,在RNA-seq数据的分析中,不仅需要进行标准化,还需要通过算法对数据进行降噪校正,去掉干扰信号。校正后的数据,其组间差异总体上应该较为平均地分布在Y=0两侧,也就是说,所有的点整体上看起来水平悬浮。但是,如果结果显示出这些点整体跑偏,中线严重偏离了Y=0,甚至形成了弧形,则说明校正方法可能不太适宜。

Abel Symposia 2016

怎么样,了解了MA plot的前世今生,对于看懂点图是不是更有信心啦?支持大家多多转发,让更多的大牛们从苦学代码中解脱,也欢迎给大Y老师私信聊聊你的想法。关于点图,关于爱情,我们下期再聊。

欢迎大家关注“生信识图”公众号(shengxinshitu),别忘了点击右上角的 ··· 加星标哦,不然后面的精彩推送无法显示(大Y老师也不太理解为什么公众号有这样的设计,请大家包涵啊,手动抱拳)。
        热烈欢迎独一无二的你分享在生信学习中的感想、困扰和乐趣。如果你在阅读文献、图形设计或者恋爱交友、吃喝玩乐方面需要任何咨询,也欢迎给大Y老师私信(评论会看不到,大Y老师也不太理解为什么公众号有这样的设计,请大家包涵啊,手动抱拳),大Y老师最喜欢聊天,期待看到你的消息!

生信识图之 点图进阶-3(MA)相关推荐

  1. 生信识图之 点图进阶-4 (PCA下篇)

    各位亲爱的土豪富婆,承蒙您慧眼识珠大驾光临大Y老师为您准备的小灶课堂. 近期有朋友说发现有人抄袭咱们的文章,自标为"原创".对此大Y老师有心理准备,咱们的每一篇文章都是大Y老师仔细 ...

  2. 生信识图 之 点图进阶-1

    各位亲爱的土豪富婆,承蒙您慧眼识珠大驾光临大Y老师为您准备的小灶课堂. -----以下是日常碎碎念,日理万机的您,可以直接跳到图图图图分割线享用----- 大Y老师做生信分析十多年了,在此期间结识很多 ...

  3. 生信识图之 点图进阶-6(UMAP)

    各位亲爱的土豪富婆,见字如面. -----以下是日常碎碎念,日理万机的您,可以直接跳到图图图图分割线享用----- 春天来啦,又到了--考研计划的时候.大Y老师不是会把咱们公众号的更新陆续同步到知乎上 ...

  4. 生信常用分析图形绘制01 -- 各种类型的热图!你学会了吗?

    有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧! 由于本系列的所有分析代码均为师兄 ...

  5. 生信常用分析图形绘制04 -- 桑基图

    有了R语言的基础,以及ggplot2绘图基础,我们的生信常用分析图形的绘制就可以提上日程了!本系列,师兄就开始带着大家一起学习如何用R语言绘制我们自己的各种分析图吧! 由于本系列的所有分析代码均为师兄 ...

  6. 生物信息通识课 - 让实验者了解生信,让生信人快速入门

    生物信息在生物研究中应用越来越多,生物各个分支的学生和教师不可避免与生信打些交道,简单到使用在线工具查找基因的功能,在线工具做些常规分析,到设计一个高通量测序实验,从公司提供的报告中分析结果,再到自己 ...

  7. 生信分析和美图资源推荐!!!

    宏基因组/微生物组是当今世界科研最热门的研究领域之一,中科院科研人员创立"宏基因组"公众号,入选科研圈评选"2019年度学术媒体优质公众号",联合海内外同行共同 ...

  8. 图形化开放式生信分析系统开发 - 9 Illumina测序仪测序数据自动拆分

    前文链接: 图形化开放式生信分析系统开发 - 1 需求分析及技术实现 图形化开放式生信分析系统开发 - 2 样本信息处理 图形化开放式生信分析系统开发 - 3 生信分析流程的进化 图形化开放式生信分析 ...

  9. 生信漫谈如何做出美美的多序列比对图

    前言 做生信的小朋友看到别人文章里面的多序列比对图是不是感觉特别好看,特别养眼,但是让自己去做,出的图真是惨不忍睹,无法直视,被老板ds,没办法,因为你们没有找到好用的软件,还有你也没要找到正确的使用 ...

最新文章

  1. CV之ICG:计算机视觉之图像标题生成(Image Caption Generator)算法的简介、使用方法、案例应用之详细攻略
  2. [python进阶]11接口:从协议到抽象基类
  3. linux 线程优先级算法,能讲一下在Linux系统中时间片是怎么分配的还有优先级的具体算法是...
  4. vue 安装 less_解决旧Vue项目升级less-loader 6.0.0报错
  5. OpenJDK9 Hotspot :Zero 解释器 - BytecodeInterpreter
  6. linux 列表看多个文件数量,查看linux默认能最多开启多少个文件数量
  7. debug最常用的快捷键
  8. JAVA中List与Array之间互换
  9. 微信开发者工具测试方法
  10. 服务器进不去系统system,system是什么进程 system进程可以关闭吗
  11. js刻度尺插件_html5 canvas+js刻度尺代码
  12. oracle监听_保存在,oracle 监听 lsnrctl 命令 (推荐)
  13. 从零开始搭建仿抖音短视频APP-开发用户业务模块(3)
  14. [论文阅读]PAN++: Towards Efficient and Accurate End-to-End Spotting of Arbitrarily-Shaped Text
  15. Matlab画图如何去掉图形框右边和上边的刻度
  16. 使用VLC合并音频与视频文件
  17. android禁止下拉刷新,Android开发之无痕过渡下拉刷新控件的实现思路详解
  18. 瀑布开发模式和敏捷开发模式的区别和思考
  19. 【C#上位机(简单实现串口发送)】
  20. TIM561激光雷达读取和修改配置参数

热门文章

  1. 下载及安装NCCL教程
  2. mac os 录屏快捷键_Mac录屏软件集合,自带不够专业来凑
  3. Qt-Q_OBJECT宏及控件提升导致的类重定义问题
  4. 千年古刹南普陀寺义工十年发展已逾6000人
  5. Java学习day096 并发(六)(线程安全的集合:高效的映射、集和队列、映射条目的原子更新、对并发散列映射的批操作、并发集视图、写数组的拷贝、并行数组算法、较早的线程安全集合)
  6. 为什么我星际争霸画面是窗口_为什么我喜欢看全球星际联盟
  7. JAVA计算机毕业设计校园线上点餐系统Mybatis+源码+数据库+lw文档+系统+调试部署
  8. 从Spring源码探究AOP代码织入的过程
  9. Ceph 集群监控之Calamari 安装部署
  10. LCD12864 菜单部分编写