blast2go mysql_blast2go本地化-2017教程
Blast2go本地化教程网上也有不少,但是都是13年之前的,由于最近有这个需求,我也重新收集了下资料,然后整理了下:
主要参考:http://blog.shenwei.me/local-blast2go-installation/
http://www.blast2go.com/b2glaunch/resources/35-localb2gdb
各种baidu+google
通常我们上游分析得到的蛋白序列需要和主流的数据库进行比对,完成功能注释。常用数据库一共有以几种:
Nr:NCBI官方非冗余蛋白数据库,包括PDB, Swiss-Prot, PIR, PRF; 如果要用DNA序列,就是nt库 Pfam: 蛋白结构域注释的分类系统 Swiss-Prot: 高质量的蛋白数据库,蛋白序列得到实验的验证 KEGG: 代谢通路注释数据库. GO: 基因本体论注释数据库
这里我们就讲解如何本地化Blast2go完成蛋白序列到GO数据库的注释。
前期准备Mysql,这个肯定不用说了,必须的要的,我的是ubuntu 14.04,用apt默认安装的,然后将默认数据库目录改到自己的空间大的目录下,我是改到home目录下了,可参考修改mysql默认数据库目录
Java,这个教程里面说是1.6 or 1.7,但我试了下1.8也是可以用的,那肯定就是用1.8咯,教程点明必须要Oracle JDK版,我也没试过open版到底行不行,所以还是听教程的,安装步骤很简单,使用add-apt进行安装
sudo add-apt-repository ppa:webupd8team/javasudo apt-get updatesudo apt-get install oracle-java8-installer
数据的下载,其实就是一个需要导入mysql库的数据,主要用于比对后的id mapping
这些直接用wget下载就行了godatabase: http://archive.geneontology.org/latest-full/ 下载go_monthly-assocdb-data.gz即可
gene2accession.gz: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz
gene_info.gz: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene_info.gz
idmapping.tb.gz: ftp://ftp.pir.georgetown.edu/databases/idmapping/idmapping.tb.gz
下载安装文件: local_b2g_db.zip
文件整理
新建一个目录blast2go(名字随意),解压上述文件,并将所有文件都放到blast2go目录下,然后cd到blast2go目录下,进行后续操作,文件总共有这几个:
b2gdb.sql b2gdb.sql~ gene2accession gene_info go_monthly-assocdb-data idmapping.tbmysql-connector-java-5.0.8-bin.jar
导入数据库将b2gdb.sql导入mysql数据库,并添加几个表格(前提你有root权限,没有权限的话,请参照上面的参考文章)
mysql -u root -p password <>b2gdb.sql
创建mysql数据库的一个用户blast2go,密码为blast4it(自己记住密码),方便后续调用这个数据库(我对数据库不熟悉,反正我照做了)
mysql -u root -p password -e 'GRANT ALL ON b2gdb.* TO 'blast2go'@'localhost' IDENTIFIED BY 'blast4it';'mysql -u root -p password -e 'FLUSH PRIVILEGES;'
接下来就是导入各个数据了
mysql -s -u root -p password b2gdb <>#这步耗时会很久mysql -u root -p password b2gdb -e 'LOAD DATA LOCAL INFILE '/home/anlan/blast2go/gene2accession' INTO TABLE gene2accession FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';'mysql -u root -p password b2gdb -e 'LOAD DATA LOCAL INFILE '/home/anlan/blast2go/gene_info' INTO TABLE gene_info FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';'
最后导入mapping数据(如果你b2gdb密码设置的不是blast4it,记得下面的命令也跟着改,后续的一些的配置文件中的b2gdb的密码也要跟着改)
java -cp .:mysql-connector-java-5.0.8-bin.jar: ImportIdMapping /home/anlan/blast2go/idmapping.tb localhost b2gdb blast2go blast4it
测试
理论上,上述的步骤都没报错的话,下面的测试肯定没问题的下载官网的测试例子https://blast2go.com/data/blast2go/b2g4pipe_v2.5.zip,其实也是之后正式使用的执行文件
修改配置文件b2gPipe.properties,如下:
// GO and B2G Data Access BasicDbacces.dbname=b2gdbDbacces.dbhost=your_ip:3306Dbacces.dbuser=blast2goDbacces.dbpasswd=blast4it
your_ip即为你的ip地址,如果你有root权限的话,安装mysql时默认是3306端口的,不是的话,需要改为你设置的端口
运行自带的例子
sh ./runPipeExample.sh
结果会出现在当前目录下的result文件夹中,主要的也就是.dat和.annot两个文件了
注意:如果是go_monthly-assocdb-data数据导入时卡了或者异常退出了,需要重新导入的话,只要重新执行下命令就行了
mysql -s -u root -p password b2gdb <>
如果是gene2accession和gene_info异常退出的话,需要先将mysql里面的对应的表格删除后,才能重新执行命令
mysql> use b2gdb;mysql> truncate table gene2accession;mysql> truncate table gene_info;
如果是idmapping.tb异常退出的话,需要删除的表格是gi2uniprot,然后再重新执行命令
mysql> use b2gdb;mysql> truncate table gi2uniprot;
后记
不知道有没有想过,做成一个R包呢?
blast2go mysql_blast2go本地化-2017教程相关推荐
- blast2go mysql_Blast2go本地化教程
idmapping.tb.gz.go_201307-assocdb-data.gz2.本地化架构由于blast2go数据库太大,请务必将my.ini文件的datadir设置到一个空间足够的磁盘,例如我 ...
- docker web程序本地化_Docker教程
Docker安装 Windows安装Docker(图解教程) Mac OS安装Docker(图解教程) Linux安装Docker(详解版) Windows Server安装Docker Docke ...
- chatgpt平替,清华chatglm本地化部署教程(aigc大模型风口,校招找工作必备),包含weiui部署,api部署,对话框部署
ChatGLM-6B 是一个开源的.支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数.结合模型量化技术,用户可以在消费级的显卡上进行 ...
- [转].Net实现本地化简易教程
本文转自:https://www.cnblogs.com/csdbfans/archive/2011/10/17/2214048.html 实现多语言版本的支持,就是所谓的国际化,也说是本地化. 今天 ...
- IntelliJ IDEA 2017新工具
IntelliJ IDEA 2017 教程之概述 图文详解如何安装 Intellij IDEA 2017 深入剖析 IntelliJ IDEA 2017 的目录结构 图文详解如何配置 IntelliJ ...
- 怎么改微信号第二次_微信号怎么修改第二次 微信号第二次修改方法2017
最近有消息说微信账号可以修改了,等了这么久,到底微信号可以改第二次吗?想看看微信号怎么修改第二次的赶紧来这看看微信号第二次修改方法2017教程吧. 微信账号作为目前微信用户使用的唯一id,相信很多人对 ...
- Kanzi 记录:界面整体介绍(一),自己理解,绝非生搬硬套。
kanzi的界面布局最常用的有九个--节点数.资源库.资源字典.页面.视图窗口.资产窗口.状态管理器窗口.活动窗口.预制件..以上九个最常用的界面窗口是熟悉Kanzi用法最基础的也是必须知道的内容.本 ...
- 【翻译】Paparazzi: Surface Editing by way of Multi-View Image Processing
这里写目录标题 摘要 1 INTRODUCTION 2 RELATED WORK 3 OVERVIEW 3.1 基于能量的图像过滤器 3.2 随机多视图优化 3.3 迭代图像过滤器 4 设计注意事项 ...
- 新手必看:生成对抗网络的初学者入门指导
新手必看:生成对抗网络的初学者入门指导 https://www.cnblogs.com/DicksonJYL/p/9698877.html 本文为 AI 研习社编译的技术博客,原标题 A Beginn ...
- MIUI国际/欧版使用小米应用商店/国内浏览器-解决不会下载软件/上网问题
MIUI国际版/欧版系统十分简洁,并且内置软件和大陆全部不同,导致新手使用门槛很高 最常见的就是手机上网和软件下载这2大问题.国际版预装的是Googlplay商店,想要下载 软件必须在手机上登录后,才 ...
最新文章
- 做了几道Linux笔试题1
- (2.19)备份与还原--备份的原理与总结
- Python爬虫基本库的使用
- UESTC 电子科大专题训练 DP-N
- mongodb身份验证_MongoDB身份验证
- Camel 2.11 –没有Spring的Camel Web应用程序
- android UI进阶之实现listview的分页加载
- net framework安装有什么影响_踢脚暖比地暖安装简单,升温快,为什么没有普及?这2点影响很大...
- 八数码问题简单解决办法
- 树莓派之BT下载器实现
- matlab列联表的独立性检验,(8.4列联表独立性分析案例.ppt
- 农村科学实验杂志农村科学实验杂志社农村科学实验编辑部2022年第12期目录
- RAW怎么转为JPG?这些转换技巧值得收藏
- 最简单的梯度下降法求最优值
- ios代码大全】代码例子区全区搜索索引
- 蓝牙作为智能钥匙的媒介
- c语言约会,初次约会的十个话题 这么和女生聊天保准不冷场
- hz什么梗_Hz是什么意思?指的是什么?
- 产品经理(PM)素质与技能初总结
- excel中if多条件判断语句