五分钟GO、KEGG和COG注释和富集分析
文章目录
- GeneOntology(GO)数据库简介
- GO注释
- 原理
- 方式一
- 方式二
- 利用eggnog
- 可视化
- 富集分析
- 原理
- 操作
GeneOntology(GO)数据库简介
- GO数据库把生物的生命活动主要分为三个过程:
细胞组分
分子功能
生化过程 - 主要针对的是基因(Gene)的产物(RNA或Protein),而不只是gene本身;因为某个gene存在可变剪切,同一个gene有多种表达产物;这个gene 产物有个专有ID即GO term。
- GO term之间的关系(Relationship):
is a
part of
has part
regulates
occurs in
GO注释
原理
- 其实现有的很多数据库之间已经实现互相注释,即表示nr-swissport-go-Ko等等之间的ID是一一对应起来的;
- 所谓的注释即获得该基因表达产物的GO term ID就行了。
方式一
- 利用blast、diamond等工具将序列比对并获得到nr、swissport等数库中对应的序列ID(gene id或gene symbol等等);
- 根据数据库ID对应字典(idmapping.tb.gz)查询获得GO term ID。
方式二
- 利用interproscan等工具注释序列的功能域(Domain)或Motif,并获得对应的GO term ID。
利用eggnog
最简单快捷的方式。
可视化
利用WEGO
富集分析
原理
常用的富集分析方法有Fisher精准概率法。以GO富集分析为例:
在单基因分析筛选差异表达基因基础上,Fisher精准概率法利用几何分布(hypergeometric distribution)原理,推断每个基因集中的差异表达基因的比例是否与整个基因集中差异表达基因的***比例***相同。该方法包括两个假设:
- 基因是否为差异表达基因(DE)
- 基因是否属于GO术语定义的基因集S
Fisher’s Exact Test原理:https://www.pathwaycommons.org/guide/primers/statistics/fishers_exact_test/
Fisher’s Exact Test和卡方检验的区别:
https://blog.csdn.net/u011955252/article/details/50704459
富集分析:https://www.jianshu.com/p/3cd3fc14ba16?utm_campaign=haruki&utm_content=note&utm_medium=seo_notes&utm_source=recommendation
操作
利用GeneOntology的AmiGO
五分钟GO、KEGG和COG注释和富集分析相关推荐
- 2015年01月30日 - Git五分钟教程
2019独角兽企业重金招聘Python工程师标准>>> 许多人认为Git太混乱或是复杂的版本控制系统,这篇文章是面向一些人想快速上手使用Git, 对于大多数基本需求这篇文章涵盖了使用 ...
- tree老师:每天五分钟教你学linux基础命令02
tree老师:每天五分钟教你学linux基础命令02 ls ls命令用于列出文件和目录.默认上,他会列出当前目录的内容.带上参数后,我们可以用ls做更多的事情. 比如,当我们刚刚改了文件,却不记得是 ...
- 吹牛的资本之Hibernate框架,五分钟搞定Hibernate...
Hibernate框架: (ps:有标记"百度网盘可看"的地方可在网盘中下载配有注释的原代码) 现在努力的敲代码,是为了以后可以选择敲不敲代码! 百度网盘:http://pan.b ...
- 五分钟学会Playwright录制脚本的方法以及语法难点
这篇文章系统地介绍了上手Playwright的方法,但是录制脚本部分讲解不够详尽,今天我在这里重点的介绍一下Playwright 录制脚本的方法来丰满我的Playwright系列技术文章. Play ...
- 五分钟搭建一个基于BERT的NER模型
BERT 简介 BERT是2018年google 提出来的预训练的语言模型,并且它打破很多NLP领域的任务记录,其提出在nlp的领域具有重要意义.预训练的(pre-train)的语言模型通过无监督的学 ...
- B 站神曲damedane:精髓在于换脸,五分钟就能学会
导读:AI 换脸技术层出不穷,但一代更比一代强.最近,一个发表在 NeurIPs 2019 的 AI 换脸模型 first order motion model 火了起来,其表情迁移效果胜过同领域其它 ...
- 五分钟搭建BERT服务,实现1000+QPS,这个Service-Streamer做到了
作者 | 刘欣 简介:刘欣,Meteorix,毕业于华中科技大学,前网易游戏技术总监,现任香侬科技算法架构负责人.之前专注游戏引擎工具架构和自动化领域,2018年在GDC和GoogleIO开源Airt ...
- matlab批量储存变量_科协五分钟|用Matlab工具包处理音频信号
科协近期大事汇总 1. 9月28日晚,硬件人才计划顺利验收. 2. 9月28日下午,仪器设计大赛综合组交流. 3. 五系联合实验室参观筹办中,预计第六第七周举办 4. 仪器设计大赛新生组开发稳步进行. ...
- 启程 - 《每日五分钟搞定大数据》
<每日五分钟搞定大数据>原创系列,每周不定期更新.欢迎关注公众号:大叔据 想了很久,准备开始写一系列的文章,记录这些年来的所得所想,感觉内容比较多不知从哪里开始,画了个思维导图确定了大 ...
最新文章
- CCS中给工程加入C66x CSL库和头文件
- git项目比对_Argo 项目入驻 CNCF,一文解析 Kubernetes 原生工作流
- 长方体工艺品の切割(洛谷P5729题题解,Java语言描述)
- P2181 对角线(python3实现)
- Almost Arithmetic Progression(CF-978D)
- 数据库事务的四个隔离级别
- 升级 python 2.6.6 到 2.7.14 版本(pip工具安装)
- Ajax无刷新实现省市联动,并在回发后保留省市下拉框状态
- HTTP和HTTPS及 Fiddler抓包原理
- Sprinboot支付宝h5支付、退款(java版)
- Java web 在线预览--参考二
- win10 java不兼容_win10系统提示edge浏览器不兼容的解决方法
- php关键词回复源码,PHP对接微信公众号实现简单自动回复
- SAD SATD的区别及应用
- 小程序使用云开发,拍照获取银行卡卡号
- Springboot汽车配件销售管理系统毕业设计源码131650
- Channel 接口EventLoop 接口 ChannelFuture 接口
- 关于Adams驱动函数单位与符号d的问题
- 高一被清华姚班录取,高三委拒谷歌 offer,一个重度网瘾少年到理论计算机科学家的蜕变!......
- 单目SLAM在移动端应用的实现难点有哪些?