参考:https://www.cnblogs.com/xiaojikuaipao/p/7190779.html   https://blog.csdn.net/ygyxl/article/details/79742751

GO 注释主要有两种方法:序列相似性比对(BLAST)和结构域相似性比对(InterProScan)

1. 将基因序列与 swiss-prot 蛋白质数据库进行 BLAST 比对,得到如下结果:

c00_g1_i1       RNF13_MOUSE     52.00   50      23      1       17      166     240     288     2e-11   65.5

c01_g1_i1       RS25_NEUCR      78.72   94      20      0       375     94      1       94      1e-32   116

其中,第二列为 swiss-prot 蛋白质数据库序列的 ID(UniProtKB ID)。

2. 注释

从 ftp://ftp.pir.georgetown.edu/databases/idmapping 下载 idmapping.tb.gz,该文件共有 22 列(tab 键分割),如:

Q6GZX4    001R_FRG3G  2947773  YP_031579.1  81941549; 49237298  PF04947  GO:0006355; GO:0046782; GO:0006351  UniRef100_Q6GZX4  UniRef90_Q6GZX4 UniRef50_Q6GZX4 UPI00003B0FD4   654924   15165820    AY548484    AAT09660.1

UniProtKB accession UniProtKB ID EntrezGene RefSeq NCBI GI number PDB Pfam GO PIRSF IPI UniRef100 UniRef90 UniRef50 UniParc PIR-PSD accession NCBI taxonomy MIM UniGene Ensembl PubMed ID EMBL/GenBank/DDBJ EMBL protein_id

根据文件 idmapping.tb.gz,将 blast 的结果,通过 UniProtKB ID,将第八列的 GO 号注释到对应的基因上,

python UniProt2GO_annotate.py idmapping.tb.gz blastout outputfile

结果如下:

c93619_g2_i1 GO:0005506,GO:0016705,GO:0016021,GO:0004497,GO:0020037

c93619_g2_i3 GO:0009733,GO:0020037,GO:0044550,GO:0016021,GO:0016020,GO:0016711,GO:0009813,GO:0005789,GO:0005506

c70056_g1_i1 GO:0005737,GO:0019722,GO:0071889,GO:0005829,GO:0001077,GO:0006357,GO:0097720,GO:0000978,GO:0046872,GO:0005634,GO:0006874

c93748_g1_i1 GO:0006729,GO:0008124

转载于:https://www.cnblogs.com/shawn2018/p/8667968.html

GO功能注释-简单快速相关推荐

  1. 插件 | 蛋白序列集合功能注释快速完成 - Quick Protein Anno

    写在前面 下游数据分析的时候,大体会遇到以下两个场景: 手工查看基因组任意位置的基因,具体的注释信息,以及其前后基因的功能注释信息 手上有某个序列或者某几个序列,想要快速知道这些序列对应的蛋白到底都有 ...

  2. WebSocket + Redis简单快速实现Web网站单设备登录功能

    1.写在前面的话 生活中,我们在使用一些APP的时候,有过一种体验,就是在A手机上登录账号,因为某些原因需要在B手机上登录,然后就会在A手机上看到类似"该账号在其他设备登录"的提示 ...

  3. 基因组注释3.基因的功能注释Prokka

    基因组注释的前两篇为大家讲解了关于基因组组成成分分析(包括重复序列的识别.非编码基因和编码基因预测等)的内容,今天,将重点介绍如何进行基因的功能注释. 基因的功能注释 获得基因结构信息后,我们希望能够 ...

  4. go split 正则_WEGO使用—华大基因在线GO功能注释

    点击上方「蓝字」关注我们 WEGO是华大基因公司的一个在线GO注释的网站,根据网站的介绍:WEGO(网络基因本体注释图)是一个简单但有用的工具,用于可视化,比较和绘制基因本体注释结果.随着GO词汇越来 ...

  5. KEGG功能注释工具 KofamKOALA 安装与使用

    KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...

  6. EggNOG功能注释数据库在线和本地使用

    文章目录 COG简介 eggNOG简介 eggNOG mapper在线版 eggNOG mapper本地版 安装说明 软件安装 数据库下载 基本使用 HMMER方法 diamond方法 结果解读 高级 ...

  7. linux下kegg注释软件,KEGG功能注释工具 KofamKOALA 安装与使用

    KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...

  8. pc端html轮播带滑块,swiper.js简单快速实现轮播滑动(兼容PC端、移动端)

    swiper是一款免费以及轻量级轮播滑动的js框架,适用于PC端跟移动端,官方地址:(https://www.swiper.com.cn/) 效果演示: PC端 移动端(在浏览器将设备切换为手机,这里 ...

  9. 简单Android app开发_如何简单快速开发外卖app?

    如何开发一个外卖app?app开发需要多少钱?随着美团.饿了么的外卖app的发展,对餐饮.生鲜果蔬.超市便利店行业来说,app成为必不可缺少的一部分.与其向第三方交纳一定不开发一个自己的外卖平台.也有 ...

最新文章

  1. 一道看完答案你会觉得很沙雕的「动态规划算法题」
  2. CentOS7下搭建Nextcloud13.0.5
  3. win10内核linux,windows 10中发布完整的Linux内核
  4. Windows环境下配置JDK
  5. equals方法的重写
  6. .NET面试题解析(02)-拆箱与装箱
  7. MySQL双主机双Master方案测试
  8. 深入分析Linux自旋锁
  9. [20171225]变态的windows批处理4.txt
  10. 图片验证码是如何刁难用户的?一招教你彻底去除图片验证码!
  11. 【Linux实验】Linux操作基础
  12. 汇编语言学习:VM上安装Win98系统
  13. Python自省机制
  14. [COGS2479]偏序
  15. 小巧机身 性能强悍 正睿第三代可扩展1U机架式服务器
  16. java get方法_java get方法
  17. 关于求最大公倍数的不同算法比较
  18. 开年新书热销榜 TOP10
  19. HTML5商业解决方案公司网页模板
  20. 50部经典影片,你看过哪些?

热门文章

  1. 基于Proteus的四位数码管显示
  2. 【天光学术】演讲稿:青春的激流
  3. 华为故意负优化手机?!数码博主带头造反了啊……
  4. 【YoloV5】YoloV5训练图片增强 python代码
  5. LAMP环境部署物联网项目
  6. java byte reader_Java字节流与字符流
  7. Mybatis—TypeHandler
  8. stable diffusion webui mov2mov
  9. nginx rewrite与proxy_pass详解
  10. c语言 结构类型(详细)