mysql blast2go,blast2go
很多人觉得基因注释很高深,特别对于那些不太懂编程的来说,感到无从下手,去年我也折腾了差不多半年,最后发现也就那么回事。一开始我是找各种基因注释的工具,例如研究geneontology自带的perl程序,里面涉及了众多模板,而且是模块里面又有模块,运行时不是少了这个模块就是那个模块有问题,最后折腾了两三个月也没有得到理想结果。后来用了blast2go这个程序用起来是没有问题,可实在是太慢,几个小时下去,泡都不冒一个。最后默默在躺在床上反思,我的目的是什么,注释的原理是什么。按照这个思路,慢慢的去找这些问题的答案,最后终于开窍了,想明白了真的好简单,现将思路简单归纳如下:
1、基因注释方法
1)根据已注释的信息,利用序列相似性原则,去注释未知序列。
2)查找文献资料注释基因功能。
基因批量注释的话都是采用第一种。
2、所需资料
1)将需要注释的序列翻译成氨基酸序列;
2)下载现有的已注释的蛋白序列(uniprot_sprot.fasta.gz,文件大小为78MB);
3)下载联系蛋白序号和注释号(GO的accession)的文件(idmapping.td.gz,文件大小为2.17G);
4)下载最新的GO数据库文件assocdb-data.gz;
3、注释方法
1)利用formatdb格式化已注释的蛋白序列为blast库;
2)将需要注释的序列与blast库做blast;
3)找到与需注释序列相似度高的蛋白序列号;
4)找到这些蛋白序列号对应的注释号(GO号);
5)用GO号在GO数据库文件中的term表中找到注释信息或者在geneontology官网用GO号就可以查到详细的注释信息;
如果用NCBI数据库,方法也差不多,先下载已注释的蛋白序列,格式化数据成blast库,将需注释的序列与这个blast库比对,找到相似度高的已注释的蛋白序列号,用此序列号用NCBI中gene_info.gz和gene2access找到蛋白序列的gene号,然后将此号用gene2go数据找到go号,最后用go号找到其注释信息就行了。
如果按照以上方法操作的话,其实基因注释非常简单,几乎只要做个blast,然后将信息对应过来就可以了,远没有那么复杂。
mysql blast2go,blast2go相关推荐
- 从 Blast2GO 本地化聊一聊 Linux 下 MySQL 的源码安装
Blast2GO 是一个基于序列相似性搜索的 GO 注释和功能分析工具,它可以直接统计分析基因功能信息,并可视化 GO 有向非循环图(DAG)上的相关功能特征,分析 BLAST.GO-mapping. ...
- blast2go centos mysql 5.7++ 安装报错ERROR 1819 (HY000) at line 4
1)解决导入数据mysql -uroot -p passwd <b2gdb.sql 报错ERROR 1819 (HY000) at line 4: Your password does not ...
- blast2go mysql_Blast2go本地化教程
idmapping.tb.gz.go_201307-assocdb-data.gz2.本地化架构由于blast2go数据库太大,请务必将my.ini文件的datadir设置到一个空间足够的磁盘,例如我 ...
- 搭建本地blast2go
1. 从http://www.blast2go.com/b2glaunch/resources 下载相应资源( http://www.blast2go.com/data/blast2go/b2g4p ...
- mysql 快捷查询数据库各表占用空间,mysql查看索引占用空间,mysql查看数据占用空间
先贴一张图! 第一步,"很重要" 在mysql中,有一个创建之初自带的库information_schema,这个库中包含着数据库相关信息,查询数据占用空间就是使用该库,所以首先进 ...
- mysql并发更新数据,多用户并发修改数据解决方案。
mysql并发更新数据,多用户并发修改数据解决方案. 在系统中,有一些如余额.资产.积分的数据,是要保证数据一致性的.如,一个人使用两个设备同时进行消费操作,如何保证数据一致性的问题. 我们一起来思考 ...
- mysql查询字段大小写结果相同,mysql大小写查询不敏感,mysql5.7查询不区分大小写解决方案。
下面有两条sql,主键查询,在mysql中查询到的结果相同. SELECT* FROM USER WHEREid = 'EM58hdK4nXC';SELECT* FROM USER WHEREid = ...
- 数据库中自定义排序规则,Mysql中自定义字段排序规则,Oracle中自定义字段排序规则,decode函数的用法,field函数的用法
数据库中自定义排序 场景:有一张banner表,表中有一个status字段,有0, 1, 2三个状态位,我想要 1,0,2的自定义排序(这里是重点),然后再进行之上对sequence字段进行二次排序( ...
- mybatis查询报错:com.mysql.cj.exceptions.DataConversionException: Cannot determine value type from string
mybatis查询报错: com.mysql.cj.exceptions.DataConversionException: Cannot determine value type from strin ...
- docker一步安装mysql,docker的魅力就在于此
正常来说,使用docker安装东西的步骤是serach它有没有,然后pull它 这里其实只要一步(如果你没有安装过.没有端口占用等问题的话!!) $ docker run -d -p 3306:330 ...
最新文章
- Oracle再发力,区块链平台多项更新
- hp compaq presarop v3009笔记本重新启动蓝屏!
- 程序员面试题精选100题(50)-树的子结构[数据结构]
- 【安全漏洞】黑客利用IE 0 day漏洞部署VBA恶意软件
- GPS服务端解析程序编写日记
- 使用Boxfuse为您的REST API设置https
- 条件注释判断兼容浏览器版本CSS HACK !--[if !IE]!--[if IE]!--[if lt IE 6]!--[if gte IE 6]...
- https防止注入_渗透入侵之PE注入如何应对
- mercurial使用_DBA对Mercurial的介绍–什么时候以及为什么我们应该使用版本控制
- e的矩阵次方_利用状态转移矩阵和VBA求游戏中各种事件达成次数的期望
- mysql 安装和修改编码(utf8mb4)
- 动态链接库dll,导入库lib,静态链接库lib
- 南油外服-网易游戏测试(外包) 面试
- 这款微信插件太好用了
- UiPath Excel内容去重操作
- 十大在线编程学习网站
- atitit 音频 项目 系列功能表 音乐 v3 t67.docx Atitit 音频 项目 系列功能表 音频 音乐 语言领域的功能表 听歌识曲功能 酷我功能。 铃声 功能。。 音频切割(按照副歌部
- 把代码做成笔记——Jupyter Notebook
- 天玥运维安全网关_中国工业网络安全厂商综合能力概览
- 完善三维全栈产品布局 的卢深视用三维全栈技术点亮2020全球智博会
热门文章
- python 当前时间的零点,python 获取当天凌晨零点的时间戳方法
- 特殊字符存入mysql_数据库中特殊字符的存取
- 教你怎么用手机进入路由器管理界面
- python从字符串中提取数字
- 原生JavaScript贪吃蛇
- python gzip_Python之gzip模块的使用
- 二项式展开 matlab,二项式造句_造句大全
- HWADDR配置错误导致network重启失败处理
- tp框架中构造函数__construct()与初始化函数_initialize()的区别
- Syzmlw蜗居在线播放