NCBI中Entrez Direct的使用
NCBI作为一个巨大的bioinformatics数据库,除了提供B/S界面的查询外,还提供了许多工具查询和下载DB中的数据。本文介绍其中最强大的一种Entrez Direct(Edirect),这是NCBI官方提供的UNIX平台DB数据检索工具(注意,UNIX平台,不是Linux。我曾经在centos上装过,只能实现输出xml格式结果的功能,不能将结果转换成表格格式,因为perl中xtract模块用不了)。以下是使用方法:
一、环境构建。
1.UNIX和Perl。
要找一台UNIX的机器不容易。个人推荐使用Cygwin提供的WIndows PC版UNIX模拟器来实现。Cygwin的安装和配置可百度,网上很多。需要注意的是1.一定要在安装时选择必要的packages,包括Devel和Perl中所有的包(将这两个Categroy从Default点为Install),这样UNIX模拟器在安装时会自动安装好这些组件。特别是Perl,Edirect是基于Perl语言运行的。还有一点是选择镜像,尽量选择位于大陆的mirror作为安装源。安装完毕后,要将Cgywin的bin文件夹加入到windows环境变量的PATH中。
2. 安装Edirect。
安装Edirect前,首先确保UNIX系统中perl和其组件下载器CPAN都安装好了。在命令行输入perl -v,如无报错,则说明perl安装好了。输入perl -MCPAN -e shell,如果进入了cpan的提示符,则cpan可用,输入exit退出到unix提示符下。
注:我原以为Edirect只能在UNIX系统下安装,最近在CentOS7环境下用官方推荐的安装方法也安装上了Edirect,可能是因为新的环境下安装了Bioperl的Bio::SeqIO模块才成功的,究竟是不是这样希望有兴趣的朋友们仔细研究下。
以下是NCBI官方给出的Edirect安装代码:
cd ~perl -MNet::FTP -e \'$ftp = new Net::FTP("ftp.ncbi.nlm.nih.gov", Passive => 1); $ftp->login;$ftp->binary; $ftp->get("/entrez/entrezdirect/edirect.zip");' #通过perl从NCBI的ftp服务器下载edirect.zip文件夹unzip -u -q edirect.ziprm edirect.zipexport PATH=$PATH:$HOME/edirect #将edirect路径加到UNIX环境变量中./edirect/setup.sh #执行setup.sh脚本安装Edirect。
安装过程中如出现以下提示说明有些perl组件没有装上,不过不要紧,据我观察edirect也能正常用。
永佳@zhanyongjia ~
$ ./edirect/setup.sh
Trying to establish local installations of any missing Perl modules
(as logged in /home/永佳/edirect/setup-deps.log).
Please be patient, as this step may take a little while.
Unable to download a prebuilt xtract executable; attempting to
build one from xtract.go. A Perl fallback is also available, and
will be used if necessary, so please disregard any errors below.
./edirect/setup.sh:行46: go: 未找到命令
ENTREZ DIRECT HAS BEEN SUCCESSFULLY INSTALLED AND CONFIGURED
安装完成后还有一件事,给edirect文件夹下所有目录和文件777权限,chmod -R 777 ./edirect
至此,Edirect安装完成,查阅NCBI提供的教程学习。http://www.ncbi.nlm.nih.gov/books/NBK179288/#chapter6.Release_Notes
NCBI中Entrez Direct的使用相关推荐
- linux command line 利用Entrez Direct下载NCBI数据
一.软件的安装 1.软件下载: curl ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -O (熟悉curl下载文件的方法 ...
- NCBI中SRA数据库简介
NCBI中SRA数据库简介 SRA数据库简介 SRA 数据库, 为Sequence Read Archive 的缩写.主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Il ...
- [爬虫实战]利用python快速爬取NCBI中参考基因组assembly的相关信息
1.问题导向 最近在做某个课题的时候,按老师的要求需要从NCBI中批量下载不同物种的参考基因组,同时收集相应参考基因组的一些组装信息,基因组非常多,导致工作量巨大,一个一个手动收集的话,既费时又费力, ...
- ncbi查找目的基因序列_如何获得基因序列——在NCBI中查找目的基因实例.PDF
如何获得基因序列--在NCBI中查找目的基因实例 如何获得基因序列?--在 NCBI 中查找目的基因实例 如何获得基因序列?--在 NCBI 中查找目的基因实例 基因,即具有遗传效应的 DNA 片段, ...
- NCBI中SRA数据下载
NCBI中SRA数据下载 hs6605015 2020-08-02 14:35:34 1170 收藏 8 版权 应用场景: 如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要 ...
- NCBI中对所有原核生物ANI计算的统计结果简单讲解
NCBI中对所有原核生物ANI计算的统计结果简单讲解 来龙去脉还没搞清楚,就先从结果切入.放上一个计算结果的链接https://ftp.ncbi.nlm.nih.gov/genomes/ASSEMBL ...
- 根据NCBI中的蛋白名在uniprot中查找对应蛋白登录号及基因名
根据NCBI中的蛋白名在uniprot中查找对应蛋白登录号及基因名 想法来源 第一个客户 第二位客户 代码分享 反思 想法来源 首先,我要感谢我从事蛋白质组分析工作中遇到的形(xi)形(qi)色(gu ...
- direct在计算机网络中是什么意思,计算机中的DIRECT是什么意思呢?
计算机中的DIRECT是什么意思呢? 來源:互聯網 2009-08-14 18:40:38 評論 分類: 電腦/網絡 >> 電腦常識 問題描述: 计算机中的direct9.0是什么意思 ...
- 几种在NCBI中查询获取目的基因序列的方法
几种在NCBI中查询获取目的基因序列的方法 在NCBI中,如何查询并下载获得某物种的某特定功能的基因序列,相信对于看到此篇的大部分同学来说都不陌生了.想到对于刚开始接触生信的同学们来说,也许尚不能很熟 ...
- NCBI中各个符号代表意思
GCF是RefSeq,GCA是GenBank,GCF可能更可靠一些 F 代表这个地方的是 reference sequences:A 代表这个地方的是 Assembly ACCESSION是NCBI序 ...
最新文章
- 使用 Nginx 代理 Socket.io/WebSocket 及 负载均衡配置
- python中的可变数据类型有列表和元组,为什么我们需要Python(或任何不可变数据类型)中的元组?...
- 2018中国互联网企业100强揭晓!阿里巴巴名列榜首
- 【Java面试题视频讲解】提取不重复的整数
- C51 特殊功能寄存器英文全称
- 【学习Koa】原生koa2 静态资源服务器例子
- bzoj4919 大根堆
- 【高精】Gift(jzoj(gz) 1763)
- linux系统安装显卡驱动卡顿,关于Ubuntu16.04上N卡驱动导致滚动屏幕卡顿问题
- OpenStack 的Nova组件详解
- mysql trigger 有时 不执行_Mysql 寒假刷题TIPs
- 【git】git如何添加本地不是git的项目到Git库中
- jsp、css中引入外部资源相对路径的问题
- 注册名字英文name域名_关于域名和备案,你想知道的都在这里
- TcaplusDBx 黎明觉醒|一路相伴,不负期待
- 显卡性能比较 GPU common sense
- 多点多地网络改造方案
- Python爬取新浪新闻评论的url查找方法
- C语言编程求fibonacci前20项,c语言,编程实现,求斐波那契数列,1,1,2,3,5,8,......的前20项及前20项和知道...
- 自制RC自动驾驶+遥控智能小车
热门文章
- 关于mysql中日期后面多一个 .0
- 特殊回文数 C++解法
- 操作系统经典书籍推荐
- 计算机的表白隐藏功能,微信还有这个功能?隐藏代码还能表白!教你高级告白手段...
- element ui表单必填_elementUI 表单校验切换必填和非必填
- 10款神奇的字符图案 词汇云生成工具
- 用C++完成华氏温度换摄氏温度
- 苹果id退出后数据还在吗_【保留数据修复】升级iOS 14后,出现白苹果的修复方法!...
- VS上位机开发——串口助手
- redis cluster集群架构详解(十二)- 集群通信