KEGG Pathway Anonatation
转载于 Original 2017-06-20 liuhui 生信百科
KEGG 数据库中,把功能相似的蛋白质归为同一组,然后标上 KO 号。通过相似性比对,可以为未知功能的蛋白序列注释上 KO 号。通过KEGG数据库的注释极大的方便我们进行生物学通路的研究,可以直接查看物种某条生物学通路上基因的存在情况。
最简单的方法是看公司给的KEGG注释或者直接下载本物种每个基因的注释结果(比如,植物Phytozome;动植物Ensemble),然后对应到自己的差异基因集里面。
当然如果自己的物种没有KEGG注释结果,那只能自己动手了!
截止到 2015 年 6 月 12 日,KEGG 数据库中共收录了 3,904 个完整的基因组。其中 304 个为真核生物,3,600 个为原核生物。在真核生物中,共有 299 个物种(一个物种可能不止一个基因组),分为 172 科,227 属;在原核生物中,共有 1,858 个物种,分为 809 属。
KEGG 对这些物种的基因序列构成了一个非冗余的 KEGG GENES 数据库;通过 BlastKOALA 和 GhostKOALA, 可对用户提交的蛋白质序列,与 KEGG GENES 数据库分别进行 BLAST 或 GHOSTX 相似性比对,为蛋白质序列注释上 K number,即 KO 号。其中,GHOSTX 比对和 BLAST 比对类似,能够检测到分歧度较大的同源序列(remote homologues),在速度上比 BLAST 大约快 100 倍,两者的区别是:
BlastKOALA:用于注释高质量基因组,只能提交 5,000 - 10,000 条蛋白质序列。
GhostKOALA:用于注释宏基因组,文件大小为 300 M 以内。
有了 KO 号,就可以重构 KEGG 数据库中的 KEGG pathways 及其他分子网络,然后进行其它分析。
这里以 BlastKOALA 为例,对蛋白质序列进行 KO 注释。
分析步骤如下:
到这个网页:http://www.kegg.jp/blastkoala/
上传 fasta 格式的蛋白质序列
选择物种所属的分类单元,如这里选择植物“plant”
选择一个数据库进行比对。这些数据库由 KEGG GENES 分别在种、属、科水平去冗余后生成。这里选“属”水平的真核生物,如下图右表所示,上传的蛋白质序列限制为 7,500 条序列。
填写自己的邮箱地址,并提交任务,开始分析
回跳转到这个界面,耐心等待即可
分析完成后,会收到邮件通知。
点击链接,返回如下结果。需要注意的是分析结果会在 7 天后删除,所以尽快将结果下载到本地。
在这个结果界面,可以查看 pathway 等信息。
Reference: Kanehisa, M., Sato, Y., and Morishima, K. (2016) BlastKOALA and GhostKOALA: KEGG tools for functional characterization of genome and metagenome sequences. J. Mol. Biol. 428, 726-731.
转载于:https://www.cnblogs.com/xiaojikuaipao/p/7190621.html
KEGG Pathway Anonatation相关推荐
- 手把手教你给KEGG pathway图标注颜色
今天是六一儿童节,祝宝宝们节日快乐. KEGG是一个整合了基因.化合物.酶和系统功能的数据库,它利用图形来表征代谢通路,以及各种通路间的关系,使得研究者能够在系统层面了解所关注的代谢通路(pathwa ...
- 微生信在线绘制KEGG Pathway通路分类汇总图
KEGG Pathway分析是文献中几乎必备的一项功能分析.在pathway富集分析中,我们一般关注的是输入基因富集到哪些通路,但是殊不知,这些通路还可以进行分类汇总. 在KEGG官网(KEGG PA ...
- KEGG pathway 数据库
pathway 建立在ko 数据库的基础上,基于我们对生命活动中的分子相互作用和化学物质的反应的认识,构建了复杂的调控网络,采用通路图的形式,进行展示. 通路图中融合了ko, module, comp ...
- python获取kegg pathway map的信息
1. 定位及获取目标元素 由于这是一个structured data,而且有一定的层次,鉴于需要较快完成信息的整理,所以并没有另外新学structured data信息的爬取(以后再说QAQ) 如果简 ...
- KEGG数据库,除了pathway你还知道哪些
欢迎关注"生信修炼手册"! KEGG称之为京都基因组百科全书,作为一个综合型的数据库,和NCBI类似,它也是有各个子数据库构成的,本文作为一个合集,整理了之前推送的KEGG数据库相 ...
- go分析和kegg分析_一文教你如何掌握基因功能(GO)和信号通路(Pathway)分析
大家在进行差异基因表达分析时,会得到一批显著差异基因,接下来就需要分析这些基因参与了哪些功能,常见的就是GO功能注释和KEGG(pathway)通路富集分析.那么,啥叫GO功能注释呢?啥是KEGG? ...
- PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组、新增KEGG层级
PICRUSt2分析实战:16S扩增子OTU或ASV预测宏基因组.新增KEGG层级 更新时间:2021年7月8日 PICRUSt推出了近8年,引用5000余次. 现推出PICRUSt2,202年再次霸 ...
- 三级结构_kegg pathway三级层级结构转对应表格
先上图,如果不是需要的就可以不用往下看了. 首先是什么样的层级结构,如下图,有些长,不完整,完整的图太长上传不了,打开链接https://www.genome.jp/kegg/pathway.html ...
- RNA 10. SCI 文章中基因表达富集之 KEGG 注释
全网最全 KEGG 注释结果绘图,直击 SCI 绘图标注,关注我,您最好的选择! 前言 1. KEGG 原理 KEGG(Kyoto Encyclopedia of Genes and Genomes) ...
最新文章
- 027_JavaScript数组迭代
- Linux文件查找命令find
- 每天学习flash一点(3) flash外部读取xml
- glassfish发布应用_WildFly 8与GlassFish 4 –选择哪个应用服务器
- 1014.修改clion的工具链
- 动态分区分配_关于硬盘的磁盘分区,干货分享!
- (1)Jenkins Linux环境下的简单搭建
- 【学习笔记】生物数据库の初步了解
- 用计算机教学体育,体育教学中计算机的应用
- 设计模式 —— 装饰模式
- 服务器停了3个月网站还能恢复吗,网站被降权怎么恢复正常(网站不更新会被降权)...
- 用python判断身份证号性别_验证身份证号的Python脚本
- LD3320语音识别模块分析
- 还在为不会做PPT而担忧嘛,有这个PPT神器,从此秒变王者!
- 大家在人生低谷时有多惨,怎么熬过来的(四)
- hp vse虚拟服务器,HP9000用户升级硬件平台的捷径
- 开关电源模块并联供电系统_大容量开关电源的设计
- android+学籍管理,论文基于android的学籍管理系统的设计与实现.doc
- SAP ABAP ALV 的一些总结:Docking container 和 Dialogbox container
- vue3 + vant 全局的loading效果制作,写的挺好的留个底
热门文章
- 陈绍鹏:让信息科技渗入奥运会的每一个细胞
- 贵金属投资交易风险高吗?
- 折腾linux日记(一):win10 Ubuntu20.04双系统安装
- Verilog有符号数与无符号数的相互转化
- Jetson TX1刷机教程(解决Auvidea carrier boards(2x USB3.0)+ 源码编译安装opencv3.2存储空间不足问题)
- 【基础题目集】7-8 超速判断 (10分)
- ftp连不上,但是能ping通开发板
- 《c语言入门题目5》根据父母身高估算儿子的身高
- 微信小程序是什么?有哪些特点?
- Ricoh Theta X 评测