转载于 Original 2017-06-20 liuhui 生信百科

KEGG 数据库中,把功能相似的蛋白质归为同一组,然后标上 KO 号。通过相似性比对,可以为未知功能的蛋白序列注释上 KO 号。通过KEGG数据库的注释极大的方便我们进行生物学通路的研究,可以直接查看物种某条生物学通路上基因的存在情况。

最简单的方法是看公司给的KEGG注释或者直接下载本物种每个基因的注释结果(比如,植物Phytozome;动植物Ensemble),然后对应到自己的差异基因集里面。

当然如果自己的物种没有KEGG注释结果,那只能自己动手了!

截止到 2015 年 6 月 12 日,KEGG 数据库中共收录了 3,904 个完整的基因组。其中 304 个为真核生物,3,600 个为原核生物。在真核生物中,共有 299 个物种(一个物种可能不止一个基因组),分为 172 科,227 属;在原核生物中,共有 1,858 个物种,分为 809 属。

KEGG 对这些物种的基因序列构成了一个非冗余的 KEGG GENES 数据库;通过 BlastKOALA 和 GhostKOALA, 可对用户提交的蛋白质序列,与 KEGG GENES 数据库分别进行 BLAST 或 GHOSTX 相似性比对,为蛋白质序列注释上 K number,即 KO 号。其中,GHOSTX 比对和 BLAST 比对类似,能够检测到分歧度较大的同源序列(remote homologues),在速度上比 BLAST 大约快 100 倍,两者的区别是:

  • BlastKOALA:用于注释高质量基因组,只能提交 5,000 - 10,000 条蛋白质序列。

  • GhostKOALA:用于注释宏基因组,文件大小为 300 M 以内。

有了 KO 号,就可以重构 KEGG 数据库中的 KEGG pathways 及其他分子网络,然后进行其它分析。

这里以 BlastKOALA 为例,对蛋白质序列进行 KO 注释。

分析步骤如下:

  • 到这个网页:http://www.kegg.jp/blastkoala/

  • 上传 fasta 格式的蛋白质序列

选择物种所属的分类单元,如这里选择植物“plant”

选择一个数据库进行比对。这些数据库由 KEGG GENES 分别在种、属、科水平去冗余后生成。这里选“属”水平的真核生物,如下图右表所示,上传的蛋白质序列限制为 7,500 条序列。

填写自己的邮箱地址,并提交任务,开始分析

回跳转到这个界面,耐心等待即可

分析完成后,会收到邮件通知。

点击链接,返回如下结果。需要注意的是分析结果会在 7 天后删除,所以尽快将结果下载到本地。

在这个结果界面,可以查看 pathway 等信息。

Reference: Kanehisa, M., Sato, Y., and Morishima, K. (2016) BlastKOALA and GhostKOALA: KEGG tools for functional characterization of genome and metagenome sequences. J. Mol. Biol. 428, 726-731.

转载于:https://www.cnblogs.com/xiaojikuaipao/p/7190621.html

KEGG Pathway Anonatation相关推荐

  1. 手把手教你给KEGG pathway图标注颜色

    今天是六一儿童节,祝宝宝们节日快乐. KEGG是一个整合了基因.化合物.酶和系统功能的数据库,它利用图形来表征代谢通路,以及各种通路间的关系,使得研究者能够在系统层面了解所关注的代谢通路(pathwa ...

  2. 微生信在线绘制KEGG Pathway通路分类汇总图

    KEGG Pathway分析是文献中几乎必备的一项功能分析.在pathway富集分析中,我们一般关注的是输入基因富集到哪些通路,但是殊不知,这些通路还可以进行分类汇总. 在KEGG官网(KEGG PA ...

  3. KEGG pathway 数据库

    pathway 建立在ko 数据库的基础上,基于我们对生命活动中的分子相互作用和化学物质的反应的认识,构建了复杂的调控网络,采用通路图的形式,进行展示. 通路图中融合了ko, module, comp ...

  4. python获取kegg pathway map的信息

    1. 定位及获取目标元素 由于这是一个structured data,而且有一定的层次,鉴于需要较快完成信息的整理,所以并没有另外新学structured data信息的爬取(以后再说QAQ) 如果简 ...

  5. KEGG数据库,除了pathway你还知道哪些

    欢迎关注"生信修炼手册"! KEGG称之为京都基因组百科全书,作为一个综合型的数据库,和NCBI类似,它也是有各个子数据库构成的,本文作为一个合集,整理了之前推送的KEGG数据库相 ...

  6. go分析和kegg分析_一文教你如何掌握基因功能(GO)和信号通路(Pathway)分析

    大家在进行差异基因表达分析时,会得到一批显著差异基因,接下来就需要分析这些基因参与了哪些功能,常见的就是GO功能注释和KEGG(pathway)通路富集分析.那么,啥叫GO功能注释呢?啥是KEGG? ...

  7. PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组、新增KEGG层级

    PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组.新增KEGG层级 更新时间:2021年7月8日 PICRUSt推出了近8年,引用5000余次. 现推出PICRUSt2,202年再次霸 ...

  8. 三级结构_kegg pathway三级层级结构转对应表格

    先上图,如果不是需要的就可以不用往下看了. 首先是什么样的层级结构,如下图,有些长,不完整,完整的图太长上传不了,打开链接https://www.genome.jp/kegg/pathway.html ...

  9. RNA 10. SCI 文章中基因表达富集之 KEGG 注释

    全网最全 KEGG 注释结果绘图,直击 SCI 绘图标注,关注我,您最好的选择! 前言 1. KEGG 原理 KEGG(Kyoto Encyclopedia of Genes and Genomes) ...

最新文章

  1. 027_JavaScript数组迭代
  2. Linux文件查找命令find
  3. 每天学习flash一点(3) flash外部读取xml
  4. glassfish发布应用_WildFly 8与GlassFish 4 –选择哪个应用服务器
  5. 1014.修改clion的工具链
  6. 动态分区分配_关于硬盘的磁盘分区,干货分享!
  7. (1)Jenkins Linux环境下的简单搭建
  8. 【学习笔记】生物数据库の初步了解
  9. 用计算机教学体育,体育教学中计算机的应用
  10. 设计模式 —— 装饰模式
  11. 服务器停了3个月网站还能恢复吗,网站被降权怎么恢复正常(网站不更新会被降权)...
  12. 用python判断身份证号性别_验证身份证号的Python脚本
  13. LD3320语音识别模块分析
  14. 还在为不会做PPT而担忧嘛,有这个PPT神器,从此秒变王者!
  15. 大家在人生低谷时有多惨,怎么熬过来的(四)
  16. hp vse虚拟服务器,HP9000用户升级硬件平台的捷径
  17. 开关电源模块并联供电系统_大容量开关电源的设计
  18. android+学籍管理,论文基于android的学籍管理系统的设计与实现.doc
  19. SAP ABAP ALV 的一些总结:Docking container 和 Dialogbox container
  20. vue3 + vant 全局的loading效果制作,写的挺好的留个底

热门文章

  1. 陈绍鹏:让信息科技渗入奥运会的每一个细胞
  2. 贵金属投资交易风险高吗?
  3. 折腾linux日记(一):win10 Ubuntu20.04双系统安装
  4. Verilog有符号数与无符号数的相互转化
  5. Jetson TX1刷机教程(解决Auvidea carrier boards(2x USB3.0)+ 源码编译安装opencv3.2存储空间不足问题)
  6. 【基础题目集】7-8 超速判断 (10分)
  7. ftp连不上,但是能ping通开发板
  8. 《c语言入门题目5》根据父母身高估算儿子的身高
  9. 微信小程序是什么?有哪些特点?
  10. Ricoh Theta X 评测