NCBI作为一个巨大的bioinformatics数据库,除了提供B/S界面的查询外,还提供了许多工具查询和下载DB中的数据。本文介绍其中最强大的一种Entrez Direct(Edirect),这是NCBI官方提供的UNIX平台DB数据检索工具(注意,UNIX平台,不是Linux。我曾经在centos上装过,只能实现输出xml格式结果的功能,不能将结果转换成表格格式,因为perl中xtract模块用不了)。以下是使用方法:

一、环境构建。

1.UNIX和Perl。

要找一台UNIX的机器不容易。个人推荐使用Cygwin提供的WIndows PC版UNIX模拟器来实现。Cygwin的安装和配置可百度,网上很多。需要注意的是1.一定要在安装时选择必要的packages,包括Devel和Perl中所有的包(将这两个Categroy从Default点为Install),这样UNIX模拟器在安装时会自动安装好这些组件。特别是Perl,Edirect是基于Perl语言运行的。还有一点是选择镜像,尽量选择位于大陆的mirror作为安装源。安装完毕后,要将Cgywin的bin文件夹加入到windows环境变量的PATH中。

2. 安装Edirect。

安装Edirect前,首先确保UNIX系统中perl和其组件下载器CPAN都安装好了。在命令行输入perl -v,如无报错,则说明perl安装好了。输入perl -MCPAN -e shell,如果进入了cpan的提示符,则cpan可用,输入exit退出到unix提示符下。

注:我原以为Edirect只能在UNIX系统下安装,最近在CentOS7环境下用官方推荐的安装方法也安装上了Edirect,可能是因为新的环境下安装了Bioperl的Bio::SeqIO模块才成功的,究竟是不是这样希望有兴趣的朋友们仔细研究下。

以下是NCBI官方给出的Edirect安装代码:

 cd ~perl -MNet::FTP -e \'$ftp = new Net::FTP("ftp.ncbi.nlm.nih.gov", Passive => 1); $ftp->login;$ftp->binary; $ftp->get("/entrez/entrezdirect/edirect.zip");' #通过perl从NCBI的ftp服务器下载edirect.zip文件夹unzip -u -q edirect.ziprm edirect.zipexport PATH=$PATH:$HOME/edirect #将edirect路径加到UNIX环境变量中./edirect/setup.sh #执行setup.sh脚本安装Edirect。

安装过程中如出现以下提示说明有些perl组件没有装上,不过不要紧,据我观察edirect也能正常用。

永佳@zhanyongjia ~
$ ./edirect/setup.sh

Trying to establish local installations of any missing Perl modules
(as logged in /home/永佳/edirect/setup-deps.log).
Please be patient, as this step may take a little while.
Unable to download a prebuilt xtract executable; attempting to
build one from xtract.go.  A Perl fallback is also available, and
will be used if necessary, so please disregard any errors below.
./edirect/setup.sh:行46: go: 未找到命令

ENTREZ DIRECT HAS BEEN SUCCESSFULLY INSTALLED AND CONFIGURED

安装完成后还有一件事,给edirect文件夹下所有目录和文件777权限,chmod -R 777 ./edirect

至此,Edirect安装完成,查阅NCBI提供的教程学习。http://www.ncbi.nlm.nih.gov/books/NBK179288/#chapter6.Release_Notes

NCBI中Entrez Direct的使用相关推荐

  1. linux command line 利用Entrez Direct下载NCBI数据

    一.软件的安装 1.软件下载: curl    ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -O (熟悉curl下载文件的方法 ...

  2. NCBI中SRA数据库简介

    NCBI中SRA数据库简介 SRA数据库简介 SRA 数据库, 为Sequence Read Archive 的缩写.主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Il ...

  3. [爬虫实战]利用python快速爬取NCBI中参考基因组assembly的相关信息

    1.问题导向 最近在做某个课题的时候,按老师的要求需要从NCBI中批量下载不同物种的参考基因组,同时收集相应参考基因组的一些组装信息,基因组非常多,导致工作量巨大,一个一个手动收集的话,既费时又费力, ...

  4. ncbi查找目的基因序列_如何获得基因序列——在NCBI中查找目的基因实例.PDF

    如何获得基因序列--在NCBI中查找目的基因实例 如何获得基因序列?--在 NCBI 中查找目的基因实例 如何获得基因序列?--在 NCBI 中查找目的基因实例 基因,即具有遗传效应的 DNA 片段, ...

  5. NCBI中SRA数据下载

    NCBI中SRA数据下载 hs6605015 2020-08-02 14:35:34  1170  收藏 8 版权 应用场景: 如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要 ...

  6. NCBI中对所有原核生物ANI计算的统计结果简单讲解

    NCBI中对所有原核生物ANI计算的统计结果简单讲解 来龙去脉还没搞清楚,就先从结果切入.放上一个计算结果的链接https://ftp.ncbi.nlm.nih.gov/genomes/ASSEMBL ...

  7. 根据NCBI中的蛋白名在uniprot中查找对应蛋白登录号及基因名

    根据NCBI中的蛋白名在uniprot中查找对应蛋白登录号及基因名 想法来源 第一个客户 第二位客户 代码分享 反思 想法来源 首先,我要感谢我从事蛋白质组分析工作中遇到的形(xi)形(qi)色(gu ...

  8. direct在计算机网络中是什么意思,计算机中的DIRECT是什么意思呢?

    计算机中的DIRECT是什么意思呢? 來源:互聯網  2009-08-14 18:40:38  評論 分類: 電腦/網絡 >> 電腦常識 問題描述: 计算机中的direct9.0是什么意思 ...

  9. 几种在NCBI中查询获取目的基因序列的方法

    几种在NCBI中查询获取目的基因序列的方法 在NCBI中,如何查询并下载获得某物种的某特定功能的基因序列,相信对于看到此篇的大部分同学来说都不陌生了.想到对于刚开始接触生信的同学们来说,也许尚不能很熟 ...

  10. NCBI中各个符号代表意思

    GCF是RefSeq,GCA是GenBank,GCF可能更可靠一些 F 代表这个地方的是 reference sequences:A 代表这个地方的是 Assembly ACCESSION是NCBI序 ...

最新文章

  1. 使用 Nginx 代理 Socket.io/WebSocket 及 负载均衡配置
  2. python中的可变数据类型有列表和元组,为什么我们需要Python(或任何不可变数据类型)中的元组?...
  3. 2018中国互联网企业100强揭晓!阿里巴巴名列榜首
  4. 【Java面试题视频讲解】提取不重复的整数
  5. C51 特殊功能寄存器英文全称
  6. 【学习Koa】原生koa2 静态资源服务器例子
  7. bzoj4919 大根堆
  8. 【高精】Gift(jzoj(gz) 1763)
  9. linux系统安装显卡驱动卡顿,关于Ubuntu16.04上N卡驱动导致滚动屏幕卡顿问题
  10. OpenStack 的Nova组件详解
  11. mysql trigger 有时 不执行_Mysql 寒假刷题TIPs
  12. 【git】git如何添加本地不是git的项目到Git库中
  13. jsp、css中引入外部资源相对路径的问题
  14. 注册名字英文name域名_关于域名和备案,你想知道的都在这里
  15. TcaplusDBx 黎明觉醒|一路相伴,不负期待
  16. 显卡性能比较 GPU common sense
  17. 多点多地网络改造方案
  18. Python爬取新浪新闻评论的url查找方法
  19. C语言编程求fibonacci前20项,c语言,编程实现,求斐波那契数列,1,1,2,3,5,8,......的前20项及前20项和知道...
  20. 自制RC自动驾驶+遥控智能小车

热门文章

  1. 关于mysql中日期后面多一个 .0
  2. 特殊回文数 C++解法
  3. 操作系统经典书籍推荐
  4. 计算机的表白隐藏功能,微信还有这个功能?隐藏代码还能表白!教你高级告白手段...
  5. element ui表单必填_elementUI 表单校验切换必填和非必填
  6. 10款神奇的字符图案 词汇云生成工具
  7. 用C++完成华氏温度换摄氏温度
  8. 苹果id退出后数据还在吗_【保留数据修复】升级iOS 14后,出现白苹果的修复方法!...
  9. VS上位机开发——串口助手
  10. redis cluster集群架构详解(十二)- 集群通信