很多人觉得基因注释很高深,特别对于那些不太懂编程的来说,感到无从下手,去年我也折腾了差不多半年,最后发现也就那么回事。一开始我是找各种基因注释的工具,例如研究geneontology自带的perl程序,里面涉及了众多模板,而且是模块里面又有模块,运行时不是少了这个模块就是那个模块有问题,最后折腾了两三个月也没有得到理想结果。后来用了blast2go这个程序用起来是没有问题,可实在是太慢,几个小时下去,泡都不冒一个。最后默默在躺在床上反思,我的目的是什么,注释的原理是什么。按照这个思路,慢慢的去找这些问题的答案,最后终于开窍了,想明白了真的好简单,现将思路简单归纳如下:

1、基因注释方法

1)根据已注释的信息,利用序列相似性原则,去注释未知序列。

2)查找文献资料注释基因功能。

基因批量注释的话都是采用第一种。

2、所需资料

1)将需要注释的序列翻译成氨基酸序列;

2)下载现有的已注释的蛋白序列(uniprot_sprot.fasta.gz,文件大小为78MB);

3)下载联系蛋白序号和注释号(GO的accession)的文件(idmapping.td.gz,文件大小为2.17G);

4)下载最新的GO数据库文件assocdb-data.gz;

3、注释方法

1)利用formatdb格式化已注释的蛋白序列为blast库;

2)将需要注释的序列与blast库做blast;

3)找到与需注释序列相似度高的蛋白序列号;

4)找到这些蛋白序列号对应的注释号(GO号);

5)用GO号在GO数据库文件中的term表中找到注释信息或者在geneontology官网用GO号就可以查到详细的注释信息;

如果用NCBI数据库,方法也差不多,先下载已注释的蛋白序列,格式化数据成blast库,将需注释的序列与这个blast库比对,找到相似度高的已注释的蛋白序列号,用此序列号用NCBI中gene_info.gz和gene2access找到蛋白序列的gene号,然后将此号用gene2go数据找到go号,最后用go号找到其注释信息就行了。

如果按照以上方法操作的话,其实基因注释非常简单,几乎只要做个blast,然后将信息对应过来就可以了,远没有那么复杂。

mysql blast2go,blast2go相关推荐

  1. 从 Blast2GO 本地化聊一聊 Linux 下 MySQL 的源码安装

    Blast2GO 是一个基于序列相似性搜索的 GO 注释和功能分析工具,它可以直接统计分析基因功能信息,并可视化 GO 有向非循环图(DAG)上的相关功能特征,分析 BLAST.GO-mapping. ...

  2. blast2go centos mysql 5.7++ 安装报错ERROR 1819 (HY000) at line 4

    1)解决导入数据mysql -uroot -p passwd <b2gdb.sql 报错ERROR 1819 (HY000) at line 4: Your password does not ...

  3. blast2go mysql_Blast2go本地化教程

    idmapping.tb.gz.go_201307-assocdb-data.gz2.本地化架构由于blast2go数据库太大,请务必将my.ini文件的datadir设置到一个空间足够的磁盘,例如我 ...

  4. 搭建本地blast2go

    1. 从http://www.blast2go.com/b2glaunch/resources  下载相应资源( http://www.blast2go.com/data/blast2go/b2g4p ...

  5. mysql 快捷查询数据库各表占用空间,mysql查看索引占用空间,mysql查看数据占用空间

    先贴一张图! 第一步,"很重要" 在mysql中,有一个创建之初自带的库information_schema,这个库中包含着数据库相关信息,查询数据占用空间就是使用该库,所以首先进 ...

  6. mysql并发更新数据,多用户并发修改数据解决方案。

    mysql并发更新数据,多用户并发修改数据解决方案. 在系统中,有一些如余额.资产.积分的数据,是要保证数据一致性的.如,一个人使用两个设备同时进行消费操作,如何保证数据一致性的问题. 我们一起来思考 ...

  7. mysql查询字段大小写结果相同,mysql大小写查询不敏感,mysql5.7查询不区分大小写解决方案。

    下面有两条sql,主键查询,在mysql中查询到的结果相同. SELECT* FROM USER WHEREid = 'EM58hdK4nXC';SELECT* FROM USER WHEREid = ...

  8. 数据库中自定义排序规则,Mysql中自定义字段排序规则,Oracle中自定义字段排序规则,decode函数的用法,field函数的用法

    数据库中自定义排序 场景:有一张banner表,表中有一个status字段,有0, 1, 2三个状态位,我想要 1,0,2的自定义排序(这里是重点),然后再进行之上对sequence字段进行二次排序( ...

  9. mybatis查询报错:com.mysql.cj.exceptions.DataConversionException: Cannot determine value type from string

    mybatis查询报错: com.mysql.cj.exceptions.DataConversionException: Cannot determine value type from strin ...

  10. docker一步安装mysql,docker的魅力就在于此

    正常来说,使用docker安装东西的步骤是serach它有没有,然后pull它 这里其实只要一步(如果你没有安装过.没有端口占用等问题的话!!) $ docker run -d -p 3306:330 ...

最新文章

  1. Oracle再发力,区块链平台多项更新
  2. hp compaq presarop v3009笔记本重新启动蓝屏!
  3. 程序员面试题精选100题(50)-树的子结构[数据结构]
  4. 【安全漏洞】黑客利用IE 0 day漏洞部署VBA恶意软件
  5. GPS服务端解析程序编写日记
  6. 使用Boxfuse为您的REST API设置https
  7. 条件注释判断兼容浏览器版本CSS HACK !--[if !IE]!--[if IE]!--[if lt IE 6]!--[if gte IE 6]...
  8. https防止注入_渗透入侵之PE注入如何应对
  9. mercurial使用_DBA对Mercurial的介绍–什么时候以及为什么我们应该使用版本控制
  10. e的矩阵次方_利用状态转移矩阵和VBA求游戏中各种事件达成次数的期望
  11. mysql 安装和修改编码(utf8mb4)
  12. 动态链接库dll,导入库lib,静态链接库lib
  13. 南油外服-网易游戏测试(外包) 面试
  14. 这款微信插件太好用了
  15. UiPath Excel内容去重操作
  16. 十大在线编程学习网站
  17. atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能。 铃声 功能。。 音频切割(按照副歌部
  18. 把代码做成笔记——Jupyter Notebook
  19. 天玥运维安全网关_中国工业网络安全厂商综合能力概览
  20. 完善三维全栈产品布局 的卢深视用三维全栈技术点亮2020全球智博会

热门文章

  1. python 当前时间的零点,python 获取当天凌晨零点的时间戳方法
  2. 特殊字符存入mysql_数据库中特殊字符的存取
  3. 教你怎么用手机进入路由器管理界面
  4. python从字符串中提取数字
  5. 原生JavaScript贪吃蛇
  6. python gzip_Python之gzip模块的使用
  7. 二项式展开 matlab,二项式造句_造句大全
  8. HWADDR配置错误导致network重启失败处理
  9. tp框架中构造函数__construct()与初始化函数_initialize()的区别
  10. Syzmlw蜗居在线播放