KEGG被称为京都基因组百科全书,是一个综合性的数据库。对于如此庞大的数据库,肯定需要对数据进行分门别类的整理。除了将各种数据拆分到不同的子数据库中之外,KEGG还对所有的数据进行了更加细致的功能分类,这些功能分类的信息就存储在brite 数据库中。

birte 主要包含以下五大类别的分类信息:

  1. genes and protein

  2. compounds and  reactions

  3. drugs

  4. diseases

  5. organisms and cells

在brite数据库中,以文件的形式存储分类信息。包含两种格式的文件:

  • table 格式,比如对药物的分类

    http://www.genome.jp/kegg/drug/br08340.html

  • htext 文件,比如kegg  orthology 的分类

    http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg

提供了两种格式的文件用于下载,htext 对应的后缀为 keg, json 对应json。

json 格式是网络数据传说的新标准,主要用于程序解析;`keg 文件是纯文本文件,可以用文本编辑器打开。

以所有ko的分类文件 ko00000.keg 文件为例:

分类层级按照字母顺序排列,示例文件中A 为第一级分类,B, C, D 依次为第二级。

我们可以直观的看到 K00844 属于Glycolysis / Gluconeogenesis 这个分类,对应的更上一级的分类为Carbohydrate metabolism,再上一级为 Metabolism

keg 文件格式还是非常容易理解的,但是使用起来不够直观,当我们想要查询某个KO的具体分类时,如果和这个KO处于同一分类的节点太多时,需要往上翻阅很多行,才能找到对应的分类;有时一不小心就翻过了,就会搞错。

当然可以通过程序格式化这个文件,比如将这个文件变成如下的格式:

KO Name C B A
K00844 HK… Glycolysis… Carbo..bolism Metabolism

这样方便查看条目的详细分类信息;

对于没有编程基础的人来说,kegg 提供了keggHier 程序,专门用于查看brite中的分类信息。软件是用java 开发的,提供了图形界面,简单易用;

下载地址 :

http://www.kegg.jp/kegg/download/kegtools.html

使用方法

  • 双加批处理文件启动

  • 从菜单栏点击File按钮,选择导入kegg网站上的数据

  • 这里选择第一个kegg  pathway map 的分类结构,进行查看

    向下的三角形表示展开的意思,这里有3个,说明pathway 共有3层分类,鼠标可以点击任意一条记录,可以展开详细信息;

  • 右上角的搜索框可以搜索,通过搜索框可以快速查找你感兴趣的记录

总结:

  1. brite 是存储分类信息的数据库,提供了包含pathway, ko,  module, drug, disease,organism 等所有记录的分类;

  2. 分类信息通过文件进行距离,有keg 和table两种格式;

  3. 通过KEGGHier工具,可以方便的浏览 KEGG 分类系统;

KEGG Brite 数据库相关推荐

  1. 从KEGG BRITE数据库下载数据

    因为笔者学习需要从KEGG BRITE数据库下载数据,在这里记录一下. 系统:UBUNTU22 结果

  2. KEGG pathway 数据库

    pathway 建立在ko 数据库的基础上,基于我们对生命活动中的分子相互作用和化学物质的反应的认识,构建了复杂的调控网络,采用通路图的形式,进行展示. 通路图中融合了ko, module, comp ...

  3. KEGG Drug 数据库

    kegg drug 数据库是一个药物相关信息的综合数据库,包括了在日本,美国,欧洲上市的的药物.所有在日本上市的药物,不论处方药还是非处方药,包括天然药物和中药,都会在Drug 数据中有对应的记录:对 ...

  4. KEGG Disease 数据库

    kegg disease 数据库收录了已经报告的各种疾病的信息,每个记录用H Number 唯一标识, 比如H00004. 在kegg 中,将疾病视作分子网络的一个不正常的状态.所有的遗传因素,环境因 ...

  5. KEGG在线数据库使用攻略

    本文转载自"美吉生物",己获授权. KEGG简介 KEGG是一个整合了基因组.化学和系统功能信息的数据库.把从已经完整测序的基因组中得到的基因目录与更高级别的细胞.物种和生态系统水 ...

  6. KEGG Enzyme 数据库

    生物体内的大多数反应都需要酶的参与,酶在生命活动中发挥了重要作用.IUBMB/UPAC 国际标准化命名委员会对已经发现的酶都提供了标准化的的命名方式,叫做EC number. KEGG ENZYME ...

  7. KEGG数据库,除了pathway你还知道哪些

    欢迎关注"生信修炼手册"! KEGG称之为京都基因组百科全书,作为一个综合型的数据库,和NCBI类似,它也是有各个子数据库构成的,本文作为一个合集,整理了之前推送的KEGG数据库相 ...

  8. 带有社区检测算法的多标签学习方法预测药物靶点相互作用(DTI-MLCD)

    1. 摘要     确定药物-靶标相互作用(DTIs)是药物发现和药物重新定位的重要步骤.为了大大降低实验成本,蓬勃发展的机器学习被应用到这个领域,并发展了许多计算方法,特别是二分类方法.然而,目前的 ...

  9. 一文快速读懂 KEGG 数据库与通路图

    一.介绍 在进行生物学实验或者生物信息的学习中,都会听说KEGG富集分析,而且该方法在高通量测序分析中已然成为数据分析中必不可少的一环. 这种分析方法依托的是由 Kanehisa实验室 在1995年开 ...

  10. 使用kegg数据库的一点见解

    使用kegg数据库的一点见解 对kegg这个数据库感兴趣主要是看到Jimmy之前在推文中讲到做GSEA分析还是用kegg原始数据库好,因为msigdb这个数据库关于通路的数据是比较老的.而另外一个原因 ...

最新文章

  1. 一文读懂支持向量机SVM(附实现代码、公式)
  2. 数组最大最小值比较次数优化
  3. 4G最快网速相当于30M宽带
  4. 数字三角形问题 (动态规划初步)
  5. 【网址收藏】Fedora 34安装Wine、微信
  6. 网络营销常用工具与资源
  7. MFC中STL容器中Vector,List,Map基本用法汇总
  8. Mysql之inner join,left join,right join详解
  9. 关注细节但不陷入细节
  10. 虚拟机下给Ubuntu挂载新硬盘
  11. 读Doom启示录 有感
  12. 常用制图工具Visio-ProcessOn
  13. mac降级safari_如何在Mac上的Safari中将网页另存为PDF
  14. 语音识别(Speech Recognition)
  15. 利用python进行假设检验
  16. MySQL安装问题总结
  17. 【Java基础】(八)方法(即C等语言中的函数)
  18. 关闭电脑弹窗广告的几种方法
  19. #ACW 4084 号码牌(无向图连通性+简单拓扑序)
  20. remix使用_使用Remix展平合同和调试

热门文章

  1. 时间序列的距离度量DTW
  2. 快捷指令 python_有没有硬核的iOS快捷指令推荐(实用性)?
  3. 太拼了!张朝阳的一张作息表刷爆朋友圈
  4. 集线器,路由器,交换机的作用和差别是什么?怎样区分交换机,集线器,路由器?
  5. kubernetes 非安全部署
  6. android webp格式的图片,Android使用webp格式图片的步骤
  7. 绕过CDN查找网站真实IP
  8. 写贺卡给毕业师姐怎么写计算机系的,给师兄师姐的毕业贺卡寄语
  9. 华为usg6320服务器映射,华为防火墙USG6320配置(简单)
  10. java高级工程师认证考试_Java高级软件工程师人才缺口巨大