一文极速读懂 KEGG 数据库
文章目录
- 一、介绍
- 二、KEGG的数据库构成
- 三、KEGG PATHWAY 数据库
- 1. 参考通路图 (map)
- 2. 物种特异性通路 (org)
- 3. 直系同源物通路 (ko)
- 4. 酶通路 (ec)
- 5. 反应通路 (reaction)
- 四、KEGG ORTHOLOGY(KO)数据库
一、介绍
在进行生物学实验或者生物信息的学习中,都会听说KEGG富集分析
,而且该方法在高通量测序分析中已然成为数据分析中必不可少的一环。
这种分析方法依托的是由 Kanehisa实验室 在1995年开发的KEGG数据库,全称为 Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书)。它拥有多个子数据库,包含基因组,生化反应,生化物质,疾病与药物,以及最常用PATHWAY通路信息。
接下来进入KEGG官网:https://www.kegg.jp ,它的主页主要由以下几部分构成:
二、KEGG的数据库构成
KEGG子库中存储的信息是生物系统的计算机表示形式,由基因和蛋白质(基因组信息)和化学物质(化学信息)的分子部件组成,这些部件的相互作用,反应和关系构成调控网络图(系统信息),除此之外,还包含疾病和药物信息(健康信息)。具体的分类及数据库如下:
分类 | 数据库 | 描述 | 标志 |
系统 信息 |
KEGG PATHWAY | KEGG 通路图 | |
KEGG BRITE | BRITE 层次结构和表 | ||
KEGG MODULE | KEGG 模块 | ||
基因组 信息 |
KEGG ORTHOLOGY (KO) | 功能直系同源物 | |
KEGG GENOME | KEGG 完整基因组 | ||
KEGG GENES | 基因和蛋白质 | ||
KEGG SSDB | 基因序列相似性 | ||
化学 信息 |
KEGG COMPOUND | 小分子 | |
KEGG GLYCAN | 聚糖 | ||
KEGG REACTION | 生化反应 | ||
KEGG RCLASS | 反应类型 | ||
KEGG ENZYME | 酶命名 | ||
健康 信息 |
KEGG NETWORK | 疾病相关网络 | |
KEGG VARIANT | 人基因变异 | ||
KEGG DISEASE | 人类疾病 | ||
KEGG DRUG | 药物 | ||
KEGG DGROUP | 药物分组 | ||
KEGG ENVIRON | 健康相关物质 |
三、KEGG PATHWAY 数据库
在所有子数据库中最重要也是最常用的就是KEGG PATHWAY,它包括大量由科研人员根据已有研究文献,通过手动绘制的KEGG通路图,代表着代谢过程,环境信息过程,细胞过程,生物系统,人类疾病和药物开发。
每个通路都由一个五位数字标识,后跟以下任意一个:map,ko,ec,rn和三字母或四字母生物代码,它们分别代表五种通路类型:
- map编号:代表reference pathway,根据已有的知识绘制的、概括的、详尽的具有一般参考意义的代谢图。 一个点同时表示一个基因,这个基因编码的酶或这个酶参加的反应
- org编号:物种特异性通路,这里就是将K编号基因(直系同源基因,后面会介绍)换为每个物种中对应的基因
- ko编号:KO通路中的点表示直系同源基因
- ec编号:EC通路中的点表示相关的酶
- rn编号:化学反应通路中的点只表示该点参与的某个反应、反应物及反应类型
在了解每种通路之前我们先学会在KEGG中切换每种通路类型
地址:https://www.kegg.jp/kegg-bin/show_pathway?org_name=map&mapno=00020&mapscale=&show_description=hide
使用过程中切换各种通路类型,比如进入TCA循环 ,可以通过左上角下路菜单来切换:
接下来,我们详细介绍每种通路:
1. 参考通路图 (map)
这里以 TCA循环 的通路图为例,进入参考通路图(Reference pathway)。这是原始版本的通路,也是后续几种通路图的"模板"。每个白框可以代表直系同源基因,酶,反应,也可以点击链接至KO,ENZYME和REACTION详细信息。
上述的形状,箭头,线段代表如下意义:
2. 物种特异性通路 (org)
我们选择人的物种名Homo sapiens (human)
,点击Go
。可以看到与Reference pathway 图(map00020)不同的是有物种特异性基因被标注为绿色,而且通路编号为hsa00020
访问链接:https://www.kegg.jp/kegg-bin/show_pathway?org_name=hsa&mapno=00020&mapscale=&show_description=hide
当然,如果直接访问
hsa00020
的链接也可以进入该通路:https://www.kegg.jp/kegg-bin/show_pathway?hsa00020
点击绿色基因,会进入Gene
详细信息
3. 直系同源物通路 (ko)
蓝色框超链接到从原始版本中选择的KO条目
进入PCK
的直系同源基因信息
4. 酶通路 (ec)
蓝色框超链接到从原始版本中选择的ENZYME条目
进入ENZYME
5. 反应通路 (reaction)
蓝色框超链接到从原始版本中选择的反应条目,
点击后进入对应的反应信息界面,如下图
四、KEGG ORTHOLOGY(KO)数据库
KEGG ORTHOLOGY (KO)数据库是构建Pathway和Module的基础,相当于KEGG数据库构建的基石,因此理解KO数据库的构成对于使用及了解KEGG至关重要。
然而,这种通用方法不足以理解由物种内基因和基因组的变异所引起的更详细的特征,特别是对于理解与人类基因和基因组的疾病相关的变异而言。后来他们开发了 KEGG NETKERK,该数据库不仅涉及基因变异,而且包括病毒和其他因素的网络变异方面的疾病和药物知识。
KEGG的开发者根据不同生物之间基因和基因组的保守和变异,引入直系同源物(KO)的概念,使得KEGG通路图,BRITE层次结构和KEGG模块的参考数据集可以广泛应用于任何细胞生物。
概念
1.KO号:表示不分物种的通路,相当于所有物种的这一通路的并集,比如ko00020
代表的 TCA 循环 (下图所示),下图的每个圆角矩形也代表着一个KO通路。
2.K号:表示基因,每个号代表的是所有物种的一个同源基因,比如上图中的K01596
代表的是 PCK。
进入K01596的详细页面,我们会看到它代表的是一个基因列表,这些基因具有一个功能却来自于不同的物种。
3.C号:表示化合物
对于分析工具使用和kegg资源下载,会在后续文章中更新。
一文极速读懂 KEGG 数据库相关推荐
- 一文快速读懂 KEGG 数据库与通路图
一.介绍 在进行生物学实验或者生物信息的学习中,都会听说KEGG富集分析,而且该方法在高通量测序分析中已然成为数据分析中必不可少的一环. 这种分析方法依托的是由 Kanehisa实验室 在1995年开 ...
- 一文极速读懂UniProt数据库
Uniprot (Universal Protein )是包含蛋白质序列,功能信息,研究论文索引的蛋白质数据库,整合了包括EBI( European Bioinformatics Institute) ...
- 一文极速读懂 Gene Ontology (GO)数据库
一.介绍 官方:基因本体(GO)知识库是有关基因功能的全球最大信息来源. 这些知识既是人类可读的,也是机器可读的,并且是生物医学研究中大规模分子生物学和遗传学实验的计算分析的基础. 在读懂基因本体论( ...
- 一文深入浅出读懂NoSQL
一文深入浅出读懂NoSQL 2016-11-25 Runoot.com ICT架构师技术交流 NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL".在现 ...
- 一文彻底读懂物联网关键技术之——ZigBee!
一文彻底读懂物联网关键技术之--ZigBee! 本文采用问答形式向你详细地介绍了方方面面,不夸口的说,你所需要知道的关于 ZigBee的一切,在这里基本可以了解到! 在智能硬件和物联网领域,时下大名鼎 ...
- [数据库] 一文读懂Mysql数据库索引实现原理
咱们用了这么久Mysql数据库做项目,你知道数据是怎么存在数据库里吗?他们是如何存储的吗? 今天咱们就来扒一扒Mysql数据库索引的底层实现,Mysql数据库的索引是由都是由B+树实现的,那为什么不是 ...
- 一文读懂 OceanBase 数据库的SLog日志
作者简介:镜水,一个无限进步的数据库学徒. 作者简介:海芊,一个致力于当网红的 OceanBase 文档工程师. 本文主要介绍 OceanBase 数据库的 Slog 日志,从代码层面剖析 Slog ...
- 一文读懂 UniProt 数据库(2023 最新版)
一.UniProt 数据库介绍 Uniprot (Universal Protein )是包含蛋白质序列,功能信息,研究论文索引的蛋白质数据库,整合了包括EBI( European Bioinform ...
- 一文彻底读懂优秀开源产品MyBatis一级缓存设计!
孙玄 奈学教育CEO 读完需要 3 分钟 速读仅需 1 分钟 孙玄, 现任奈学教育科技创始人&CEO ,毕业于浙大,前百度资深研发工程师.前 58 集团技术委员会主席/高级系统架构师到前转转公 ...
- 一文能读懂车载与Android的关系
文章目录 1 Android Auto 1.1 核心功能 1.1.1 Google Assistant 1.2 兼容的车型和应用 1.3 App 1.3.1 开发 1.3.2 设计 1.4 无线 2 ...
最新文章
- 8. An Introduction to MCMC for Machine Learning (1)
- Python 量化(四)计算股票的移动平均线
- 巧用Angular项目的get设置Angular class属性访问的别名
- Android 隐藏底部三个虚拟按键
- ASP.NET 中执行 URL 重写
- vscode怎么安装python包_vscode如何安装python
- c语言上机指导答案清华,第一章自测练习答案清华大学c语言习题实验指导及课程设计...
- 开发经验分享_03_解决问题3步走(思路)
- pycharm远程调试python_使用PyCharm进行Python远程调试
- LeetCode 145 二叉树的后序遍历(非递归)
- 【Java并发】Runnable、Callable、Future、FutureTask
- 安装navicat之后双击就会闪退_win2012,2016 能安装oracle 10g吗?
- 哈尔滨冰景:映衬时代主题
- Socket通信的安全策略问题
- poi导出word文档
- 线性分类器(Linear Classifier)
- Win10+外接显示器 “未检测到其他显示器”
- 详析:谷歌为何紧急封杀阿里云OS?
- Android通知栏-Notification(通知消息)
- 体悟朝闻道,夕死可以