http://blog.sciencenet.cn/blog-686680-748695.html

http://blog.shenwei.me/local-blast2go-installation/

http://www.dxy.cn/bbs/thread/15446435#15446435

本地Blast2GO安装,及其数据库更新和导入数据中断的解决方案

 17 Aug, 2013 · Read in about 5 min · (939 Words)

 bioinf linux

本文提供改进的本地化Blast2GO自动化安装脚本,以及指导如何更新数据库,并提供导入数据中断的解决方案。对无root权限的用户同样有效,同时指导如何成功运行b2g4pipe和本地Blast2GO图形界面。

——————————————————————————

本人仅安装了此程序,未跑过真实数据,且时间已久,不做任何解答,抱歉

——————————————————————————

由于Blast2GO官方网站提供的Blast2GO数据库安装教程需要用户具有root权限,而其官网上另一自动化安装脚本已过时,会出错,故文本将二者结合,并根据自身经验重新整理。

软件环境

  • 操作系统 :Linux(Centos, Ubuntu, Fedora等),最好有root权限,方便配置mysql。
  • 数据库 :Mysql(或者Mysql的分支MariaDB),要有能创建数据库权限的用户,如果没有,可以参照我另一篇日志在没有Root权限的情况下安装Mysql。
  • Java运行环境:一定要Oracle  JDK (6、7都行),不要用OpenJDK,否则无法运行b2g4pipe!可参照我另一篇日志《Linux安装JDK》(内含没root权限时安装方法)。
  • Local NCBI-Blast,可参照我另一篇文章《Linux系统中NCBI BLAST+本地化教程》。

注:1. 除非是已经非root安装mysql在有足够磁盘空间的分区(home)下,请一定参照网上的方法把Mysql的数据库目录配置到有足够空间的目录下面!2. 安装oracle  jdk,不用卸载openjdk,并切换java到oracle jdk。

sudo /usr/sbin/alternatives --config java

手动准备数据

1) 避免不稳定的网络环境使下载中断,自己用迅雷或者FTP客户端(wget也支持断点续传)下载以下4个文件(一共5.1G):

  • godatabase: http://archive.geneontology.org/latest-full/ 目录下对应的go_XXXX-assocdb-data.gz
  • gene_info.gz: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene_info.gz
  • gene2accession.gz:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz
  • idmapping.tb.gz:ftp://ftp.pir.georgetown.edu/databases/idmapping/idmapping.tb.gz

2) 解压文件。提示:gzip -d解压文件后会删除原来的压缩文件。

gzip -d *.gz

3)下载local_b2g_db.zip文件,并解压。内含创建数据库的b2gdb.sql文件和导入idmapping文件的java程序ImportIdMapping.class及其依赖的库mysql-connector-java-5.0.8-bin.jar。

为了方便,上述文件都放到同一目录下。解压后文件清单如下:

./:   31.48 GB2.97 KB      ImportIdMapping.class2.33 KB      b2gdb.sql1.83 KB      download_and_install.sh3.27 GB      gene2accession1.32 GB      gene_info22.37 GB      go_201307-assocdb-data4.51 GB      idmapping.tb528.18 KB      mysql-connector-java-5.0.8-bin.jar

导入数据库

0) 预防针。

b2gdb.sql建立数据库以及用户时,默认只赋予用户(blast2go)在本机(localhost)访问数据库(b2gdb)的权限,如下所示:

GRANT ALL ON b2gdb.* TO 'blast2go'@'localhost' IDENTIFIED BY 'blast4it';
FLUSH PRIVILEGES;

如果你今后需要在自己电脑使用服务器的b2g数据库,那么你需要赋予blast2go在任意主机(%)访问数据库的权限,修改如下:

GRANT ALL ON b2gdb.* TO 'blast2go'@'%' IDENTIFIED BY 'blast4it';
FLUSH PRIVILEGES;

没这样设置的结果就是,PC远程连接服务器的数据库提示connection time out,即使PC和服务器的防火墙设置无问题,仍然无法连接数据库。那么补救措施就是在服务器登陆mysql(必要时-P指定端口),运行上述两句mysql命令。

1) 配置download_and_install.sh文件:

#!/bin/sh# 配置以下7行
godbname=go_201307-assocdb-data          # 根据http://archive.geneontology.org/latest-full/下assocdb-data.gz文件更改
dbname=b2gdb                             # 数据库 名称,不用改
dbuser=root                              # 数据库 用户名
dbpass=passwordofroot                    # 数据库 用户密码
dbhost=localhost                         # 数据库 所在ip
dbport=3306                              # 数据库 端口,3306是默认的,如果是无root权限安装的MySQL,一定要改为设置的端口,比如我的33060
path=/home/shenwei/Public/Data/local_b2g # 数据文件目录,注意路径末尾不要有“/”# 如果已经下载数据文件,下列部分保持注释
### Download the GO database the NCBI mapping files and the PIR mapping
# wget http://archive.geneontology.org/latest-full/$godbname.gz
# wget ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene_info.gz
# wget ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz
# wget ftp://ftp.pir.georgetown.edu/databases/idmapping/idmapping.tb.gz# 如果已经下载并解压数据文件,下列部分保持注释
###unzip files
# gzip -dv $godbname.gz
# gzip -dv gene_info.gz
# gzip -dv gene2accession.gz
# gzip -dv idmapping.tb.gzecho 1. Create the DB Tables and user
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass < b2gdb.sql### Import data to the GO Database
echo 2. Import $godbname
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass $dbname < $godbnameecho 3. Import gene2accession
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass $dbname -e"LOAD DATA LOCAL INFILE '$path"/gene2accession"' INTO TABLE gene2accession FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';"echo 4. Import gene_info
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass $dbname -e"LOAD DATA LOCAL INFILE '$path"/gene_info"' INTO TABLE gene_info FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';"echo 5. Import idmapping.tb
java -cp .:mysql-connector-java-5.0.8-bin.jar: ImportIdMapping $path/idmapping.tb $dbhost:$dbport $dbname blast2go blast4it
echo All data imported.

注意:如果是无root权限安装的MySQL,一定要设置数据库端口为为自己设置的端口,比如我的33060,否则无法导入idmapping.tb。

如果导入数据出现中断,切勿简单地重新运行download_and_install,请参照后面的章节进行操作。

总共导入数据需要约7小时。

数据库各文件大小:

b2gdb/:   74.91 GB17.59 GB      association.MYI14.82 GB      evidence.MYI6.43 GB      evidence_dbxref.MYI5.91 GB      evidence.MYD3.90 GB      association.MYD3.63 GB      dbxref.MYI3.31 GB      gene_product.MYI2.68 GB      gene2accession.MYD2.37 GB      gene_product_count.MYI2.01 GB      gi2uniprot.MYI1.95 GB      gene_product_synonym.MYI1.67 GB      evidence_dbxref.MYD1.42 GB      gene_product.MYD1.40 GB      gene2accession.MYI1.28 GB      gene_info.MYD1.10 GB      gene_product_synonym.MYD1.10 GB      gene_product_count.MYD894.13 MB      gi2uniprot.MYD636.91 MB      dbxref.MYD349.73 MB      gene_info.MYI224.40 MB      species.MYI156.21 MB      graph_path.MYI55.88 MB      species.MYD23.98 MB      graph_path.MYD16.19 MB      term_synonym.MYI10.71 MB      term.MYI9.58 MB      term_dbxref.MYI7.27 MB      term_definition.MYD5.63 MB      term2term.MYI5.16 MB      term_synonym.MYD3.10 MB      term.MYD2.32 MB      term_dbxref.MYD1.53 MB      term2term.MYD1.08 MB      term_definition.MYI735.00 KB      association_qualifier.MYI419.75 KB      association_qualifier.MYD343.00 KB      term_subset.MYI196.00 KB      gene_product_homolset.MYI111.00 KB      term2term_metadata.MYI87.12 KB      term_subset.MYD82.42 KB      gene_product_homolset.MYD49.76 KB      db.MYD38.00 KB      db.MYI37.67 KB      term2term_metadata.MYD36.00 KB      homolset.MYI35.00 KB      association_species_qualifier.MYI16.73 KB      species.frm14.35 KB      homolset.MYD12.63 KB      db.frm12.60 KB      association.frm12.58 KB      graph_path.frm12.57 KB      term.frm12.56 KB      term_synonym.frm12.54 KB      gene_product.frm12.52 KB      dbxref.frm12.51 KB      evidence.frm11.69 KB      association_species_qualifier.MYD9.06 KB      gene_info.frm8.96 KB      gene2accession.frm8.67 KB      relation_properties.frm8.64 KB      source_audit.frm8.62 KB      seq.frm8.61 KB      homolset.frm8.56 KB      gene_product_ancestor.frm8.54 KB      term_definition.frm8.53 KB      instance_data.frm8.53 KB      gene_product_count.frm8.53 KB      term2term.frm8.51 KB      relation_composition.frm8.50 KB      association_property.frm8.50 KB      gene_product_homology.frm8.49 KB      intersection_of.frm8.49 KB      term2term_metadata.frm8.49 KB      phylotree_property.frm8.48 KB      assoc_rel.frm8.48 KB      seq_property.frm8.47 KB      association_qualifier.frm8.47 KB      gene_product_property.frm8.46 KB      gene_product_seq.frm8.46 KB      term_dbxref.frm8.46 KB      term_property.frm8.45 KB      gene_product_phylotree.frm8.45 KB      gene_product_homolset.frm8.45 KB      association_species_qualifier.frm8.44 KB      graph_path2term.frm8.43 KB      gene_product_synonym.frm8.43 KB      association_isoform.frm8.42 KB      phylotree.frm8.42 KB      gene_product_subset.frm8.42 KB      gene_product_dbxref.frm8.41 KB      evidence_dbxref.frm8.41 KB      term_audit.frm8.40 KB      term_subset.frm8.40 KB      seq_dbxref.frm8.39 KB      gi2uniprot.frm7.00 KB      relation_composition.MYI4.00 KB      source_audit.MYI4.00 KB      instance_data.MYI3.00 KB      relation_properties.MYI2.00 KB      seq_property.MYI2.00 KB      gene_product_property.MYI1.00 KB      term_property.MYI1.00 KB      intersection_of.MYI1.00 KB      phylotree.MYI1.00 KB      phylotree_property.MYI1.00 KB      graph_path2term.MYI1.00 KB      seq.MYI1.00 KB      seq_dbxref.MYI1.00 KB      gene_product_homology.MYI1.00 KB      gene_product_subset.MYI1.00 KB      gene_product_seq.MYI1.00 KB      gene_product_phylotree.MYI1.00 KB      gene_product_dbxref.MYI1.00 KB      term_audit.MYI1.00 KB      gene_product_ancestor.MYI1.00 KB      association_property.MYI1.00 KB      association_isoform.MYI1.00 KB      assoc_rel.MYI289.00  B      relation_composition.MYD196.00  B      source_audit.MYD145.00  B      relation_properties.MYD65.00  B      db.opt24.00  B      instance_data.MYD0.00  B      gene_product_dbxref.MYD0.00  B      seq_property.MYD0.00  B      intersection_of.MYD0.00  B      gene_product_ancestor.MYD0.00  B      assoc_rel.MYD0.00  B      association_isoform.MYD0.00  B      term_audit.MYD0.00  B      seq_dbxref.MYD0.00  B      term_property.MYD0.00  B      seq.MYD0.00  B      phylotree.MYD0.00  B      gene_product_seq.MYD0.00  B      graph_path2term.MYD0.00  B      gene_product_property.MYD0.00  B      association_property.MYD0.00  B      gene_product_phylotree.MYD0.00  B      gene_product_subset.MYD0.00  B      gene_product_homology.MYD0.00  B      phylotree_property.MYD

运行官方的例子b2g4pipe

下载https://blast2go.com/data/blast2go/b2g4pipe_v2.5.zip并解压。配置b2gPipe.properties文件中b2gdb信息:

// GO and B2G Data Access Basic
Dbacces.dbname=b2gdb
Dbacces.dbhost=localhost:3306
Dbacces.dbuser=blast2go
Dbacces.dbpasswd=blast4it

注意

1) 如果是无root权限安装的MySQL,一定要设置数据库端口为为自己设置的端口。

2) 如果是在本地运行,一定要保证服务器的mysql端口(3306)没有被防火墙屏蔽,Dbaccess.dbhost中的IP也要设置成服务器的IP。

进入到b2g4pipe目录,运行自带例子。

sh ./runPipeExample.sh

其内容如下,也可以直接在命令行输入,:

#!/bin/bash
# Windows中不要上面这行!!!!!!!!!!!!!# -Xmx1024M 指定java最大可使用内存,根据情况更改
java -Xmx1024M -cp *:ext/*: es.blast2go.prog.B2GAnnotPipe -in 10_BlastResults_2011.xml -out results/myproject-prop b2gPipe.properties -v -annot -dat -img -ips ipsr -annex -goslim -wiki html_template.html# Windows中把冒号改成分号!!!!!!!!!!!!!
# java -Xmx1G-cp *;ext/*; es.blast2go.prog.B2GAnnotPipe -in 10_BlastResults_2011.xml -out results/myproject-prop b2gPipe.properties -v -annot -dat -img -ips ipsr -annex -goslim -wiki html_template.html

注意:如果是在windows上运行,要将其中的冒号“:”改为分号“;”,文件名后缀改为.bat,直接双击文件运行。

不到一分钟运行结束。

运行图形界面

在自己的安装了java(安装方法请google,记得设置环境变量PATH、CLASSPATH)的电脑(也可以通过VNC远程连接服务器)上直接运行命令java -cp *:ext/*: es.blast2go.Blast2GO或者,将其写入文件(windows中后缀为.bat,linux为.sh):

#!/bin/bash
# Windows中不要上面这行!!!!!!!!!!!!!# -Xmx1024M 指定java最大可使用内存,根据情况更改
java -Xmx1024M -cp *:ext/*: es.blast2go.Blast2GO# Windows中把冒号改成分号!!!!!!!!!!!!!
# java -Xmx1024M -cp *;ext/*; es.blast2go.Blast2GO

进入到b2g4pipe目录,运行脚本(windows中直接双击.bat文件):

sh ./Blast2GO_GUI.sh

进入图形界面后,配置数据库:菜单栏点击“Tools”,最后一个“DB configuration”,更改Host为localhost,DB name为b2gdb,然后点击播放按钮(指向右边的三角形)生效,下次启动程序仍然有效。

注意:如果是无root权限安装的MySQL,Host需要加上自定义的mysql端口,比如192.168.1.2:33060,192.168.1.2为服务器IP。

运行例子:菜单栏File->Import->Import Blast Results->One XML File,导入10_BlastResults_2011.xml,菜单栏Mapping->Run Go Mapping Step即可。运行一分钟左右完成。

数据库更新 ,导入数据中断的解决方案:

1)assocdb-data数据的更新:

下载解压新的assocdb-data文件后,注释download_and_install.sh中其它导入数据的命令,只保留第二步:

### Import data to the GO Database
echo 2. Import $godbname
mysql -h$dbhost -u$dbuser -p$dbpass $dbname < $godbname

并运行download_and_install.sh。不用担心与旧的数据冲突,它们会被自动删除然后更新。

2)gene2accession、gene_info、idmapping.tb的更新:

由于它们是以导入数据文件的方式导入数据库,需要登陆到数据库中,手动清空对应的原来数据表中的数据:

$ mysql -u root -p
Enter password:mysql> use b2gdb;
Database changedmysql> truncate table gene2accession;
Query OK, 0 rows affected (16.67 sec)mysql> truncate table gene_info;
Query OK, 0 rows affected (2 min 2.49 sec)mysql> truncate table gi2uniprot;
Query OK, 0 rows affected (0.00 sec)mysql> quit
Bye

注意,上面truncate table gi2uniprot花费0.00 sec是因为当时我还没有导入idmapping.tb,即gi2uniprot中还没有数据,所以速度很快。

3)用download_and_install导入数据时,如果出现中断,请参照上面“数据库各文件大小”核对数据文件大小,确认已导入和未导入的数据库,按照“数据库更新”的操作恢复导入过程,切勿简单地重新运行download_and_install。

参考

  1. Blast2GO安装 http://blog.sciencenet.cn/blog-402211-629228.html
  2. Blast2GO Documentation http://www.blast2go.com/b2glaunch/resources
  3. Local Blast2GO Database Installation http://www.blast2go.com/b2glaunch/resources/35-localb2gdb
  4. 其它无数Google出来的页面

其它

根据b2gPipe.properties文件可以看出,blast2go的不仅能做基本的go注释(本文所安b2g数据库所支持),还能(需要)做GoSlim、Simap Integration等(均需联网),甚至在线blast,这需要运行b2gPipe或者b2gGUI的电脑能链接互联网。那么通过ssh连接服务器做的时候就需要服务器联网,或者通过代理让服务器联网;或者在自己联网的PC上做。

至于,PC远程连接服务器的数据库提示connection time out的情况,请参照前文“导入数据库”的“0) 预防针”部分。

感谢各位的反馈。

-EOF-

本地Blast2GO安装,及其数据库更新和导入数据中断的解决方案

本文提供改进的本地化Blast2GO自动化安装脚本,以及指导如何更新数据库,并提供导入数据中断的解决方案。对无root权限的用户同样有效,同时指导如何成功运行b2g4pipe和本地Blast2GO图形界面。

——————————————————————————

本人仅安装了此程序,未跑过真实数据,且时间已久,不做任何解答,抱歉

——————————————————————————

由于Blast2GO官方网站提供的Blast2GO数据库安装教程需要用户具有root权限,而其官网上另一自动化安装脚本已过时,会出错,故文本将二者结合,并根据自身经验重新整理。

软件环境

  • 操作系统 :Linux(Centos, Ubuntu, Fedora等),最好有root权限,方便配置mysql。
  • 数据库 :Mysql(或者Mysql的分支MariaDB),要有能创建数据库权限的用户,如果没有,可以参照我另一篇日志在没有Root权限的情况下安装Mysql。
  • Java运行环境:一定要Oracle  JDK (6、7都行),不要用OpenJDK,否则无法运行b2g4pipe!可参照我另一篇日志《Linux安装JDK》(内含没root权限时安装方法)。
  • Local NCBI-Blast,可参照我另一篇文章《Linux系统中NCBI BLAST+本地化教程》。

注:1. 除非是已经非root安装mysql在有足够磁盘空间的分区(home)下,请一定参照网上的方法把Mysql的数据库目录配置到有足够空间的目录下面!2. 安装oracle  jdk,不用卸载openjdk,并切换java到oracle jdk。

sudo /usr/sbin/alternatives --config java

手动准备数据

1) 避免不稳定的网络环境使下载中断,自己用迅雷或者FTP客户端(wget也支持断点续传)下载以下4个文件(一共5.1G):

  • godatabase: http://archive.geneontology.org/latest-full/ 目录下对应的go_XXXX-assocdb-data.gz
  • gene_info.gz: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene_info.gz
  • gene2accession.gz:ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz
  • idmapping.tb.gz:ftp://ftp.pir.georgetown.edu/databases/idmapping/idmapping.tb.gz

2) 解压文件。提示:gzip -d解压文件后会删除原来的压缩文件。

gzip -d *.gz

3)下载local_b2g_db.zip文件,并解压。内含创建数据库的b2gdb.sql文件和导入idmapping文件的java程序ImportIdMapping.class及其依赖的库mysql-connector-java-5.0.8-bin.jar。

为了方便,上述文件都放到同一目录下。解压后文件清单如下:

./:   31.48 GB2.97 KB      ImportIdMapping.class2.33 KB      b2gdb.sql1.83 KB      download_and_install.sh3.27 GB      gene2accession1.32 GB      gene_info22.37 GB      go_201307-assocdb-data4.51 GB      idmapping.tb528.18 KB      mysql-connector-java-5.0.8-bin.jar

导入数据库

0) 预防针。

b2gdb.sql建立数据库以及用户时,默认只赋予用户(blast2go)在本机(localhost)访问数据库(b2gdb)的权限,如下所示:

GRANT ALL ON b2gdb.* TO 'blast2go'@'localhost' IDENTIFIED BY 'blast4it';
FLUSH PRIVILEGES;

如果你今后需要在自己电脑使用服务器的b2g数据库,那么你需要赋予blast2go在任意主机(%)访问数据库的权限,修改如下:

GRANT ALL ON b2gdb.* TO 'blast2go'@'%' IDENTIFIED BY 'blast4it';
FLUSH PRIVILEGES;

没这样设置的结果就是,PC远程连接服务器的数据库提示connection time out,即使PC和服务器的防火墙设置无问题,仍然无法连接数据库。那么补救措施就是在服务器登陆mysql(必要时-P指定端口),运行上述两句mysql命令。

1) 配置download_and_install.sh文件:

#!/bin/sh# 配置以下7行
godbname=go_201307-assocdb-data          # 根据http://archive.geneontology.org/latest-full/下assocdb-data.gz文件更改
dbname=b2gdb                             # 数据库 名称,不用改
dbuser=root                              # 数据库 用户名
dbpass=passwordofroot                    # 数据库 用户密码
dbhost=localhost                         # 数据库 所在ip
dbport=3306                              # 数据库 端口,3306是默认的,如果是无root权限安装的MySQL,一定要改为设置的端口,比如我的33060
path=/home/shenwei/Public/Data/local_b2g # 数据文件目录,注意路径末尾不要有“/”# 如果已经下载数据文件,下列部分保持注释
### Download the GO database the NCBI mapping files and the PIR mapping
# wget http://archive.geneontology.org/latest-full/$godbname.gz
# wget ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene_info.gz
# wget ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/gene2accession.gz
# wget ftp://ftp.pir.georgetown.edu/databases/idmapping/idmapping.tb.gz# 如果已经下载并解压数据文件,下列部分保持注释
###unzip files
# gzip -dv $godbname.gz
# gzip -dv gene_info.gz
# gzip -dv gene2accession.gz
# gzip -dv idmapping.tb.gzecho 1. Create the DB Tables and user
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass < b2gdb.sql### Import data to the GO Database
echo 2. Import $godbname
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass $dbname < $godbnameecho 3. Import gene2accession
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass $dbname -e"LOAD DATA LOCAL INFILE '$path"/gene2accession"' INTO TABLE gene2accession FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';"echo 4. Import gene_info
mysql -h$dbhost -P$dbport -u$dbuser -p$dbpass $dbname -e"LOAD DATA LOCAL INFILE '$path"/gene_info"' INTO TABLE gene_info FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';"echo 5. Import idmapping.tb
java -cp .:mysql-connector-java-5.0.8-bin.jar: ImportIdMapping $path/idmapping.tb $dbhost:$dbport $dbname blast2go blast4it
echo All data imported.

注意:如果是无root权限安装的MySQL,一定要设置数据库端口为为自己设置的端口,比如我的33060,否则无法导入idmapping.tb。

如果导入数据出现中断,切勿简单地重新运行download_and_install,请参照后面的章节进行操作。

总共导入数据需要约7小时。

数据库各文件大小:

b2gdb/:   74.91 GB17.59 GB      association.MYI14.82 GB      evidence.MYI6.43 GB      evidence_dbxref.MYI5.91 GB      evidence.MYD3.90 GB      association.MYD3.63 GB      dbxref.MYI3.31 GB      gene_product.MYI2.68 GB      gene2accession.MYD2.37 GB      gene_product_count.MYI2.01 GB      gi2uniprot.MYI1.95 GB      gene_product_synonym.MYI1.67 GB      evidence_dbxref.MYD1.42 GB      gene_product.MYD1.40 GB      gene2accession.MYI1.28 GB      gene_info.MYD1.10 GB      gene_product_synonym.MYD1.10 GB      gene_product_count.MYD894.13 MB      gi2uniprot.MYD636.91 MB      dbxref.MYD349.73 MB      gene_info.MYI224.40 MB      species.MYI156.21 MB      graph_path.MYI55.88 MB      species.MYD23.98 MB      graph_path.MYD16.19 MB      term_synonym.MYI10.71 MB      term.MYI9.58 MB      term_dbxref.MYI7.27 MB      term_definition.MYD5.63 MB      term2term.MYI5.16 MB      term_synonym.MYD3.10 MB      term.MYD2.32 MB      term_dbxref.MYD1.53 MB      term2term.MYD1.08 MB      term_definition.MYI735.00 KB      association_qualifier.MYI419.75 KB      association_qualifier.MYD343.00 KB      term_subset.MYI196.00 KB      gene_product_homolset.MYI111.00 KB      term2term_metadata.MYI87.12 KB      term_subset.MYD82.42 KB      gene_product_homolset.MYD49.76 KB      db.MYD38.00 KB      db.MYI37.67 KB      term2term_metadata.MYD36.00 KB      homolset.MYI35.00 KB      association_species_qualifier.MYI16.73 KB      species.frm14.35 KB      homolset.MYD12.63 KB      db.frm12.60 KB      association.frm12.58 KB      graph_path.frm12.57 KB      term.frm12.56 KB      term_synonym.frm12.54 KB      gene_product.frm12.52 KB      dbxref.frm12.51 KB      evidence.frm11.69 KB      association_species_qualifier.MYD9.06 KB      gene_info.frm8.96 KB      gene2accession.frm8.67 KB      relation_properties.frm8.64 KB      source_audit.frm8.62 KB      seq.frm8.61 KB      homolset.frm8.56 KB      gene_product_ancestor.frm8.54 KB      term_definition.frm8.53 KB      instance_data.frm8.53 KB      gene_product_count.frm8.53 KB      term2term.frm8.51 KB      relation_composition.frm8.50 KB      association_property.frm8.50 KB      gene_product_homology.frm8.49 KB      intersection_of.frm8.49 KB      term2term_metadata.frm8.49 KB      phylotree_property.frm8.48 KB      assoc_rel.frm8.48 KB      seq_property.frm8.47 KB      association_qualifier.frm8.47 KB      gene_product_property.frm8.46 KB      gene_product_seq.frm8.46 KB      term_dbxref.frm8.46 KB      term_property.frm8.45 KB      gene_product_phylotree.frm8.45 KB      gene_product_homolset.frm8.45 KB      association_species_qualifier.frm8.44 KB      graph_path2term.frm8.43 KB      gene_product_synonym.frm8.43 KB      association_isoform.frm8.42 KB      phylotree.frm8.42 KB      gene_product_subset.frm8.42 KB      gene_product_dbxref.frm8.41 KB      evidence_dbxref.frm8.41 KB      term_audit.frm8.40 KB      term_subset.frm8.40 KB      seq_dbxref.frm8.39 KB      gi2uniprot.frm7.00 KB      relation_composition.MYI4.00 KB      source_audit.MYI4.00 KB      instance_data.MYI3.00 KB      relation_properties.MYI2.00 KB      seq_property.MYI2.00 KB      gene_product_property.MYI1.00 KB      term_property.MYI1.00 KB      intersection_of.MYI1.00 KB      phylotree.MYI1.00 KB      phylotree_property.MYI1.00 KB      graph_path2term.MYI1.00 KB      seq.MYI1.00 KB      seq_dbxref.MYI1.00 KB      gene_product_homology.MYI1.00 KB      gene_product_subset.MYI1.00 KB      gene_product_seq.MYI1.00 KB      gene_product_phylotree.MYI1.00 KB      gene_product_dbxref.MYI1.00 KB      term_audit.MYI1.00 KB      gene_product_ancestor.MYI1.00 KB      association_property.MYI1.00 KB      association_isoform.MYI1.00 KB      assoc_rel.MYI289.00  B      relation_composition.MYD196.00  B      source_audit.MYD145.00  B      relation_properties.MYD65.00  B      db.opt24.00  B      instance_data.MYD0.00  B      gene_product_dbxref.MYD0.00  B      seq_property.MYD0.00  B      intersection_of.MYD0.00  B      gene_product_ancestor.MYD0.00  B      assoc_rel.MYD0.00  B      association_isoform.MYD0.00  B      term_audit.MYD0.00  B      seq_dbxref.MYD0.00  B      term_property.MYD0.00  B      seq.MYD0.00  B      phylotree.MYD0.00  B      gene_product_seq.MYD0.00  B      graph_path2term.MYD0.00  B      gene_product_property.MYD0.00  B      association_property.MYD0.00  B      gene_product_phylotree.MYD0.00  B      gene_product_subset.MYD0.00  B      gene_product_homology.MYD0.00  B      phylotree_property.MYD

运行官方的例子b2g4pipe

下载https://blast2go.com/data/blast2go/b2g4pipe_v2.5.zip并解压。配置b2gPipe.properties文件中b2gdb信息:

// GO and B2G Data Access Basic
Dbacces.dbname=b2gdb
Dbacces.dbhost=localhost:3306
Dbacces.dbuser=blast2go
Dbacces.dbpasswd=blast4it

注意

1) 如果是无root权限安装的MySQL,一定要设置数据库端口为为自己设置的端口。

2) 如果是在本地运行,一定要保证服务器的mysql端口(3306)没有被防火墙屏蔽,Dbaccess.dbhost中的IP也要设置成服务器的IP。

进入到b2g4pipe目录,运行自带例子。

sh ./runPipeExample.sh

其内容如下,也可以直接在命令行输入,:

#!/bin/bash
# Windows中不要上面这行!!!!!!!!!!!!!# -Xmx1024M 指定java最大可使用内存,根据情况更改
java -Xmx1024M -cp *:ext/*: es.blast2go.prog.B2GAnnotPipe -in 10_BlastResults_2011.xml -out results/myproject-prop b2gPipe.properties -v -annot -dat -img -ips ipsr -annex -goslim -wiki html_template.html# Windows中把冒号改成分号!!!!!!!!!!!!!
# java -Xmx1G-cp *;ext/*; es.blast2go.prog.B2GAnnotPipe -in 10_BlastResults_2011.xml -out results/myproject-prop b2gPipe.properties -v -annot -dat -img -ips ipsr -annex -goslim -wiki html_template.html

注意:如果是在windows上运行,要将其中的冒号“:”改为分号“;”,文件名后缀改为.bat,直接双击文件运行。

不到一分钟运行结束。

运行图形界面

在自己的安装了java(安装方法请google,记得设置环境变量PATH、CLASSPATH)的电脑(也可以通过VNC远程连接服务器)上直接运行命令java -cp *:ext/*: es.blast2go.Blast2GO或者,将其写入文件(windows中后缀为.bat,linux为.sh):

#!/bin/bash
# Windows中不要上面这行!!!!!!!!!!!!!# -Xmx1024M 指定java最大可使用内存,根据情况更改
java -Xmx1024M -cp *:ext/*: es.blast2go.Blast2GO# Windows中把冒号改成分号!!!!!!!!!!!!!
# java -Xmx1024M -cp *;ext/*; es.blast2go.Blast2GO

进入到b2g4pipe目录,运行脚本(windows中直接双击.bat文件):

sh ./Blast2GO_GUI.sh

进入图形界面后,配置数据库:菜单栏点击“Tools”,最后一个“DB configuration”,更改Host为localhost,DB name为b2gdb,然后点击播放按钮(指向右边的三角形)生效,下次启动程序仍然有效。

注意:如果是无root权限安装的MySQL,Host需要加上自定义的mysql端口,比如192.168.1.2:33060,192.168.1.2为服务器IP。

运行例子:菜单栏File->Import->Import Blast Results->One XML File,导入10_BlastResults_2011.xml,菜单栏Mapping->Run Go Mapping Step即可。运行一分钟左右完成。

数据库更新 ,导入数据中断的解决方案:

1)assocdb-data数据的更新:

下载解压新的assocdb-data文件后,注释download_and_install.sh中其它导入数据的命令,只保留第二步:

### Import data to the GO Database
echo 2. Import $godbname
mysql -h$dbhost -u$dbuser -p$dbpass $dbname < $godbname

并运行download_and_install.sh。不用担心与旧的数据冲突,它们会被自动删除然后更新。

2)gene2accession、gene_info、idmapping.tb的更新:

由于它们是以导入数据文件的方式导入数据库,需要登陆到数据库中,手动清空对应的原来数据表中的数据:

$ mysql -u root -p
Enter password:mysql> use b2gdb;
Database changedmysql> truncate table gene2accession;
Query OK, 0 rows affected (16.67 sec)mysql> truncate table gene_info;
Query OK, 0 rows affected (2 min 2.49 sec)mysql> truncate table gi2uniprot;
Query OK, 0 rows affected (0.00 sec)mysql> quit
Bye

注意,上面truncate table gi2uniprot花费0.00 sec是因为当时我还没有导入idmapping.tb,即gi2uniprot中还没有数据,所以速度很快。

3)用download_and_install导入数据时,如果出现中断,请参照上面“数据库各文件大小”核对数据文件大小,确认已导入和未导入的数据库,按照“数据库更新”的操作恢复导入过程,切勿简单地重新运行download_and_install。

参考

  1. Blast2GO安装 http://blog.sciencenet.cn/blog-402211-629228.html
  2. Blast2GO Documentation http://www.blast2go.com/b2glaunch/resources
  3. Local Blast2GO Database Installation http://www.blast2go.com/b2glaunch/resources/35-localb2gdb
  4. 其它无数Google出来的页面

其它

根据b2gPipe.properties文件可以看出,blast2go的不仅能做基本的go注释(本文所安b2g数据库所支持),还能(需要)做GoSlim、Simap Integration等(均需联网),甚至在线blast,这需要运行b2gPipe或者b2gGUI的电脑能链接互联网。那么通过ssh连接服务器做的时候就需要服务器联网,或者通过代理让服务器联网;或者在自己联网的PC上做。

至于,PC远程连接服务器的数据库提示connection time out的情况,请参照前文“导入数据库”的“0) 预防针”部分。

感谢各位的反馈。

-EOF-

本地Blast2GO安装,及其数据库更新和导入数据中断的解决方案相关推荐

  1. python批量导入mysql_用python批量向数据库(MySQL)中导入数据

    用python批量向数据库(MySQL)中导入数据 现有数十万条数据,如下的经过打乱处理过的数据进行导入 数据库内部的表格的数据格式如下与下面的表格结构相同 Current database: pyt ...

  2. 微信小程序云开发——常用功能2:操作云数据库一键批量导入数据(导入json文件)

    微信小程序云开发--常用功能2:操作云数据库一键批量导入数据(导入json文件) 今天我们要添加100条数据.下面的过程是先创建一条记录,然后导出这条数据看json文件中是如何编辑字段的,然后仿照这个 ...

  3. 华夏名网虚拟主机如何导入mysql/mssql数据库,怎样自已导入数据到华夏名网数据库

    华夏名网虚拟主机如何导入mysql/mssql数据库,怎样自已导入数据到华夏名网数据库 华夏名网代理客服losoon经常帮用户导数据和数据库,现总结一点经验,为更多的华夏名网用户提供方便,如何自已导入 ...

  4. python 数据导入mysql_用python批量向数据库(MySQL)中导入数据

    用python批量向数据库(MySQL)中导入数据 现有数十万条数据,如下的经过打乱处理过的数据进行导入 数据库内部的表格的数据格式如下与下面的表格结构相同Current database: pyth ...

  5. 《项目经验》--简单三层使用DataTable向数据库表批量导入数据---向SqlServer多张张表中导入数据

    前面已经介绍过如何向数据库的一张表中批量导入数据,详情见博客<项目经验---简单三层使用DataTable向数据库表批量导入数据---向SqlServer一张表中导入数据>:本文主要介绍如 ...

  6. navicat没安装mysql怎么连接_在本地不安装mysql 数据库 能连接吗?

    展开全部 本地不安装mysql 服务器是可以的,但是至少要安装客户端, 也要安装一个  ODBC 的驱动.62616964757a686964616fe78988e69d833133336564623 ...

  7. solr从数据库为solr_home导入数据

    针对5.3以后的导入数据 1. 在solr_home里添加core容器 该solr_home是安装solr到tomcat时配置的,参见:将solr安装到tomcat里 在该solr_home里新一个文 ...

  8. Navicat 连接 Oracle数据库并,导入数据泵(.dmp)

    如有什么质疑的地方,希望可以和大家一起探讨,共同进步. 一.安装方法: 1.首先下载Navicat Premium和Oracle Database Oracle Database官网下载地址:http ...

  9. android动态更新数据库数据,Android数据库更新——上万条数据的插入

    在实际情况下,很可能遇到会向一个表中插入10万条数据,而这样的数据库更新,如果用寻常的方式,在SQLiteOpenHelper.onUpdate()方法中不断的执行SQL语句,那么效率是可想而知的,甚 ...

  10. SQL Server数据库中批量导入数据的四种方法总结

    在软件项目实施的时候,数据导入一直是项目人员比较头疼的问题.其实,在SQL Server中集成了很多成批导入数据的方法.有些项目实施顾问头疼的问题,在我们数据库管理员眼中,是小菜一碟.现在的重点就是, ...

最新文章

  1. java 调用autoit_Java中调用AutoIt操作控件
  2. 这种奇奇怪怪的符号,只能用latex打出来,如果实在不行,>---|-->>也行
  3. 上海内推 | 极氪智能科技百万年薪「氪学家」项目招聘规控/感知算法工程师
  4. 2021牛客NOIP提高组第二场T2——方格计数(组合数计数)
  5. html5 摄像头 直播,详解HTML5 使用video标签实现选择摄像头功能
  6. 并发编程的数据竞争问题以及解决之道
  7. 获取脚本路径_如何快速有效的写ftp脚本
  8. Struts2框架学习之一:Hello World程序
  9. 零基础搭建Hadoop大数据处理-初识
  10. 3个月攻破CCNA:12周教程资料盘点
  11. 聪明人为何无法征服世界?
  12. @RunWith的使用
  13. 十年风雨,一个普通程序员的成长之路(三)铜陵:大雪与加班
  14. 华为手机如何安装google play, chrome等
  15. JAVA代码实现人物照片的人像分割 | 百度AI
  16. 以下哪种数据结构的查找效率最高
  17. 今年出现了5种电子商务SEO趋势
  18. 《MySQL 入门教程》第 06 篇 备份与恢复
  19. Candence常用操作快捷键
  20. 从零开始学riscv之建房子,先打地基

热门文章

  1. html中什么用来表示特殊字符引号,HTML特殊字符显示
  2. 基于X86汇编语言的简易打字游戏实现
  3. c226打印机驱动安装_打印机驱动安装失败怎么办 打印机驱动安装方法【步骤详解】...
  4. protobuf的GZIP压缩
  5. 特斯拉阀:被遗忘的天才之阀
  6. 全拼到缩写月份单词python_英文中十二月份的全称和缩写
  7. tumblr图片批量下载
  8. Vue Router 路由(路由守卫)---route
  9. 自行车线控前叉换线之——鸡米螺丝
  10. 运行JavaScript代码片段的19种工具