一、图表介绍

1.热图

(1)数值型矩阵、数据框:颜色代表数值大小

(2)相关性热图:有一半是冗余,可优化

(3)差异基因热图

2.散点图和箱线图

注:箱线图代表单个基因在两组间的表达差异

注:箱线图需要分组信息,同一个分组,分组关键词必须一致

注:箱线图向量的下标必须与表达矩阵一一对应

注:箱线图结果图比较扁,证明其重复性很好

3.火山图

(1)FC:处理组平均值/对照组平均值

logFC:对FC取对数

正常取值范围是10以内,lnF代表正无穷

logFC>0,treat>control,基因表达量上调,

logFC<0,treat>control,基因表达量下调,

常见阈值:1/2/1.2/2.2/0.565=log2(1.5)

4、主成成分分析【把多指标转化为少数几个综合指标(即主成分)】

(1)每一个点代表一个样本,点与点之间的距离代表样本之间的差异

中心点(95%置信区间):不是样本点

作用:用于预实验,简单查看组间是否有差别

(2)PCA样本聚类图【数据较多时使用】

同一组是否聚成一簇(组内重复较好)/中心点间是否有差距(组间差别大)

二、GEO数据分析

1、分析思路

注:文章题目最好不要出现Bioinformatics

2、表达矩阵

行名:探针ID,分析时需要转化为gene_symbol

需要注释的是每个样本的分组信息

3、富集分析:衡量一条通路里的基因在差异基因里是否足够多

输入数据为:差异基因的entrezid

区别:symbol是基因名,entrezid是富集分析指定用的

注意这两个名称并非一一对应,损失/增加部分基因属于正常

GeneRation:差异基因里有x个属于这条通路

BgRation:通路里的基因数/KEGG数据库里总共多少个基因

探索:clusterprofiler包

一个补充链接:

一文极速读懂 Gene Ontology (GO)数据库 - 知乎 (zhihu.com)

三、代码分析流程

第二步与第三步是重点!

生信技能树课程记录笔记(七)20220602-20220604相关推荐

  1. 生信技能树课程记录笔记(七)20220531

    一.数据框排序 法一:sort函数 默认升序. 例:sort(test$Sepal.Length) 法二:order函数 默认升序,返回数据下标组成的数组. 可以给向量排序,也可以给数据框排序 例:t ...

  2. 生信技能树课程记录笔记(三)20220526

    matrix 矩阵--只允许一种数据 data.frame 数据框--每列只允许一种数据类型 list 列表--各种都可 依据生成函数判断/用class 或i函数判断一下数据类型 一.数据框 新建数据 ...

  3. R:生信技能树学习笔记一

    生信技能树小破站:R应该这样学1-4 1.查看已经安装的包的地址 .libPaths() 2.怎么查看函数用法 #在RStudio的右下角窗口的help可以看到 ?函数名 3.三个有用的函数 1.he ...

  4. R:生信技能树学习笔记二

    生信技能树小破站:R应该这样学5-7 1.热图 rm(list=ls()) library(pheatmap) a1=rnorm(100) dim(a1)=c(5,20) #设置维度 pheatmap ...

  5. CancerSubtypes包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理)

    CancerSubtypes包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理,感谢Jimmy老师!) 1. 引言 2. 数据处理 2.1 基本处理 2.1.1 通过检查数据分布来分 ...

  6. ProTICS包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理)

    ProTICS包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理,感谢Jimmy老师!) 1.设置环境 2.Part1的结果 3.Part2的结果 4.Part3的结果 5.相关函数 ...

  7. 生信技能树【代码大全搜录】

    生信技能术代码大全: rm(list = ls()) options()$repos options()$BioC_mirror #options(BioC_mirror="https:// ...

  8. TCGA学习笔记一(生信技能树概述版)

    1.背景介绍 重要数据 外显子数据 表达数据 小RNA测序数据 拷贝数芯片 甲基化数据 蛋白质组学数据 临床信息 癌症背景知识 网页工具大全 GDC cbioportal:按照paper来分类的 UC ...

  9. 菜鸟生信学习第三节笔记:plink常用功能

    plink由哈佛大学的Shaun Purcell开发的一个免费,开源的全基因组关联分析软件. 官网:PLINK 1.9 主要功能: 1.数据提取,合并.提取特定SNP.样本.基因组某段区域的基因型3. ...

  10. 生信技能树 电脑配置linux,生信技能树--Jimmy - Linux 20题

    一.在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列. 二.在创建好的文件夹下面,比如我的是 /Users/jimmy/tmp/1/2/3/4/5/6/7/8/9 ,里面 ...

最新文章

  1. git revert和git reset的区别
  2. 把你手机里的照片秒变3D!Facebook训练了一个CNN端到端系统
  3. FZU 1061 矩阵连乘
  4. linux decode函数,Oracle 中 decode 函数用法
  5. Qt之程序发布以及打包成exe安装包
  6. 手机版wps怎么制作折线图_手机怎么制作电子签名?有没有手机电子签名软件或者APP?...
  7. SharePoint 2010: 对于开发人员
  8. SCSF 系列:Smart Client Software Factory 与 ObjectBuilder
  9. Kali渗透测试——netdiscover
  10. 添加Maven(mvn)、sbt的国内仓库
  11. Android原生游戏开发:使用JustWeEngine开发微信打飞机
  12. easyui模版html,EasyUI 模板(Template)_Vue EasyUI Demo
  13. 尝试 Nitrux 系统的六大理由
  14. nginx代理、白名单过滤、双域名备案代理
  15. HTML网页中显示图片(相对路径 绝对路径)
  16. android程序设计拍照,Android编程实现拍照功能的2种方法分析
  17. Aspose.Slides使用教程:使用 C# 在 PowerPoint 演示文稿中添加页眉和页脚
  18. [C++]<numeric>头文件介绍
  19. android studio运行时报错AVD Nexus_5X_API_P is already running解决办法
  20. 《O2P卸甲笔记》附录:Oracle XE快速安装

热门文章

  1. 关于补码--看锆石fpga计算峰峰值时的疑问启示
  2. quartusII编译时出现Error (119013): Current license file does not support the EP4CE6F17C8 device
  3. 永中集成Office 2013 简体中文免费版
  4. 【SQL学习】select语句使用实例
  5. word目录及图表目录的自动生成
  6. 代码智能:问题与解法
  7. micro usb接口定义图
  8. Type-c与micro usb 的对应关系
  9. 微信api接口调用-微信群管理
  10. 越狱显示苹果服务器调整,iOS 14 后台切换界面更改?可能是越狱插件修改