GO功能注释-简单快速
参考:https://www.cnblogs.com/xiaojikuaipao/p/7190779.html https://blog.csdn.net/ygyxl/article/details/79742751
GO 注释主要有两种方法:序列相似性比对(BLAST)和结构域相似性比对(InterProScan)
1. 将基因序列与 swiss-prot 蛋白质数据库进行 BLAST 比对,得到如下结果:
c00_g1_i1 RNF13_MOUSE 52.00 50 23 1 17 166 240 288 2e-11 65.5
c01_g1_i1 RS25_NEUCR 78.72 94 20 0 375 94 1 94 1e-32 116
其中,第二列为 swiss-prot 蛋白质数据库序列的 ID(UniProtKB ID)。
2. 注释
从 ftp://ftp.pir.georgetown.edu/databases/idmapping 下载 idmapping.tb.gz,该文件共有 22 列(tab 键分割),如:
Q6GZX4 001R_FRG3G 2947773 YP_031579.1 81941549; 49237298 PF04947 GO:0006355; GO:0046782; GO:0006351 UniRef100_Q6GZX4 UniRef90_Q6GZX4 UniRef50_Q6GZX4 UPI00003B0FD4 654924 15165820 AY548484 AAT09660.1
UniProtKB accession UniProtKB ID EntrezGene RefSeq NCBI GI number PDB Pfam GO PIRSF IPI UniRef100 UniRef90 UniRef50 UniParc PIR-PSD accession NCBI taxonomy MIM UniGene Ensembl PubMed ID EMBL/GenBank/DDBJ EMBL protein_id
根据文件 idmapping.tb.gz,将 blast 的结果,通过 UniProtKB ID,将第八列的 GO 号注释到对应的基因上,
python UniProt2GO_annotate.py idmapping.tb.gz blastout outputfile
结果如下:
c93619_g2_i1 GO:0005506,GO:0016705,GO:0016021,GO:0004497,GO:0020037
c93619_g2_i3 GO:0009733,GO:0020037,GO:0044550,GO:0016021,GO:0016020,GO:0016711,GO:0009813,GO:0005789,GO:0005506
c70056_g1_i1 GO:0005737,GO:0019722,GO:0071889,GO:0005829,GO:0001077,GO:0006357,GO:0097720,GO:0000978,GO:0046872,GO:0005634,GO:0006874
c93748_g1_i1 GO:0006729,GO:0008124
转载于:https://www.cnblogs.com/shawn2018/p/8667968.html
GO功能注释-简单快速相关推荐
- 插件 | 蛋白序列集合功能注释快速完成 - Quick Protein Anno
写在前面 下游数据分析的时候,大体会遇到以下两个场景: 手工查看基因组任意位置的基因,具体的注释信息,以及其前后基因的功能注释信息 手上有某个序列或者某几个序列,想要快速知道这些序列对应的蛋白到底都有 ...
- WebSocket + Redis简单快速实现Web网站单设备登录功能
1.写在前面的话 生活中,我们在使用一些APP的时候,有过一种体验,就是在A手机上登录账号,因为某些原因需要在B手机上登录,然后就会在A手机上看到类似"该账号在其他设备登录"的提示 ...
- 基因组注释3.基因的功能注释Prokka
基因组注释的前两篇为大家讲解了关于基因组组成成分分析(包括重复序列的识别.非编码基因和编码基因预测等)的内容,今天,将重点介绍如何进行基因的功能注释. 基因的功能注释 获得基因结构信息后,我们希望能够 ...
- go split 正则_WEGO使用—华大基因在线GO功能注释
点击上方「蓝字」关注我们 WEGO是华大基因公司的一个在线GO注释的网站,根据网站的介绍:WEGO(网络基因本体注释图)是一个简单但有用的工具,用于可视化,比较和绘制基因本体注释结果.随着GO词汇越来 ...
- KEGG功能注释工具 KofamKOALA 安装与使用
KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...
- EggNOG功能注释数据库在线和本地使用
文章目录 COG简介 eggNOG简介 eggNOG mapper在线版 eggNOG mapper本地版 安装说明 软件安装 数据库下载 基本使用 HMMER方法 diamond方法 结果解读 高级 ...
- linux下kegg注释软件,KEGG功能注释工具 KofamKOALA 安装与使用
KEGG数据库,即京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes),是系统分析基因功能.基因组信息的数据库. KofamKOALA是一个方便的 ...
- pc端html轮播带滑块,swiper.js简单快速实现轮播滑动(兼容PC端、移动端)
swiper是一款免费以及轻量级轮播滑动的js框架,适用于PC端跟移动端,官方地址:(https://www.swiper.com.cn/) 效果演示: PC端 移动端(在浏览器将设备切换为手机,这里 ...
- 简单Android app开发_如何简单快速开发外卖app?
如何开发一个外卖app?app开发需要多少钱?随着美团.饿了么的外卖app的发展,对餐饮.生鲜果蔬.超市便利店行业来说,app成为必不可缺少的一部分.与其向第三方交纳一定不开发一个自己的外卖平台.也有 ...
最新文章
- 一道看完答案你会觉得很沙雕的「动态规划算法题」
- CentOS7下搭建Nextcloud13.0.5
- win10内核linux,windows 10中发布完整的Linux内核
- Windows环境下配置JDK
- equals方法的重写
- .NET面试题解析(02)-拆箱与装箱
- MySQL双主机双Master方案测试
- 深入分析Linux自旋锁
- [20171225]变态的windows批处理4.txt
- 图片验证码是如何刁难用户的?一招教你彻底去除图片验证码!
- 【Linux实验】Linux操作基础
- 汇编语言学习:VM上安装Win98系统
- Python自省机制
- [COGS2479]偏序
- 小巧机身 性能强悍 正睿第三代可扩展1U机架式服务器
- java get方法_java get方法
- 关于求最大公倍数的不同算法比较
- 开年新书热销榜 TOP10
- HTML5商业解决方案公司网页模板
- 50部经典影片,你看过哪些?