安装和使用Entrez Direct软件

#到home目录下
cd
#等同于用~/ ,~/ 表示你的home目录
cd ~/#创建/local/app目录来存放需要安装的程序
mkdir -p ~/local/app#进入app目录
cd ~/local/app

获取entrez direct 工具包

#大写 -O 是使得curl 命令去识别url上的文件名(作为下载后的文件名字)
curl ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -O
#上一条命令等同于
curl ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -o edirect.zip

解压这个工具包

unzip edirect.zip

查看新工具

cd edirect
ll

配置环境变量

echo "export PATH=\$PATH:\$HOME/local/app/edirect" >> $HOME/.bashrc
source ~/.bashrcesearch -help
Option h is ambiguous (help, http, https)
Query Specification-db          Database name-query       Query string
Document Order-sort        Result presentation order
Date Constraint-days        Number of days in the past-datetype    Date field abbreviation-mindate     Start of date range-maxdate     End of date range
....................................................
#.bashrc 这个文件主要保存个人的一些个性化设置,如命令别名、路径等

运行 einfo

einfo -help
einfo 7.40
Database Selection-db        Database name-dbs       Get all database names
Data Summaries-fields    Print field names-links     Print link names
Field Example<Field><Name>ALL</Name><FullName>All Fields</FullName>
.........................................................................

抓取描述信息,然后查看它们

einfo -dbs > einfo-dbs.txt
more einfo-dbs.txt
einfo -db sra > einfo-sra.txt
more einfo-sra.txt

运行esearch

esearch -help
esearch -db nucleotide -query PRJNA257197
#-db是指定数据库类型,而query是跟着你要搜索的关键词。
#在nucleotide这个数据库(database,简称db)里用关键词PRJNA257197搜索


1:数据库类型为nucleotide,我们esearch的时候就指明了,我们要在nucleotide这个数据库=里搜索
2:搜索关键词数量:1(因为我们只输入了一个关键词,就是PRJNA257197)
3:搜索得到的条目有249个


这一步相当于你到NCBI的首页,做了下图的操作:


并点了Search
看!果然是249条检索结果


抓取nucleotides数据

esearch -db nucleotide -query PRJNA257197 | efetch -format fasta > ~/edu/lec3/ebola.fasta

看一下这个文件里有多少条序列

cat ~/edu/lec3/ebola.fasta | grep ">" | wc -l
249
cat ~/edu/lec3/ebola.fasta | wc -l
67603
less ~/edu/lec3/ebola.fasta

以GenBank格式获取数据

esearch -db nucleotide -query PRJNA257197 | efetch -format gb > ~/edu/lec3/ebola.gb
less ~/edu/lec3/ebola.gb

看一下这个文件里有多少条序列

cat ~/edu/lec3/ebola.gb | grep ^LOCUS | wc -l
249

安装和使用Entrez Direct相关推荐

  1. linux command line 利用Entrez Direct下载NCBI数据

    一.软件的安装 1.软件下载: curl    ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -O (熟悉curl下载文件的方法 ...

  2. Oracle 19C 安装指引

    Oracle 19C 安装指引 18C新功能 1.简化的基于镜像的Oracle数据库安装 从18C开始,Oracle可以作为镜像文件来下载和安装,必须解压缩镜像文件到ORACLE_HOME目录,然后执 ...

  3. RabbitMQ底层原理及安装使用详解

    1.RabbitMQ原理概述 2.RabbitMQ安装和管理 3-1.Direct(直接交换器) 4.消息发布时的权衡 5.消息消费时的权衡 6.消息消费的拒绝 7.Spring整合RabbitMQ ...

  4. bedtools指南

    文章目录 官方文档 下载安装 演示版的bed文件 (demo.bed) 我们的基因组文件(genome.txt) 两侧的运算 填充运算 下载测试数据 提取与genes.gff的间隔相对应的序列 获取测 ...

  5. biostar handbook(四)|生物数据及其下载和基本操作

    2017/11/9 第一版: 生物数据库,基本数据类型(genbank, fasta/fastq),数据上传站点 2017/11/12 第二版:如何利用esearch, efecth快速获取SRR序列 ...

  6. SRA数据的下载 PRJNA257197

    从NCBI下载测序数据 | 也许是目前最详细的版本 目录 一.使用NCBI的工具进行下载 1. 下载和安装Entrez Direct以及SRA toolkit 1.1 下载和安装Entrez Dire ...

  7. 【翻译】--19C Oracle 安装指导

    18C新功能 1.简化的基于镜像的Oracle数据库安装 从18C开始,Oracle可以作为镜像文件来下载和安装,必须解压缩镜像文件到ORACLE_HOME目录,然后执行runInstaller安装. ...

  8. NDM的网络配置文件netmap.cfg

    简介 NDM的网络映射包含描述本地节点和网络中的远程节点的连接信息. 为本地节点与之通信的每个节点创建一个远程节点信息记录. 网络映射文件位于d_dir/ndm/cfg/cd_node/netmap. ...

  9. Getfasta--根据Acession Number(Ac号)批量下载GenBank分子序列数据的自动化程序

    推断分子系统发育树时,很多分子序列数据都是从GenBank等公共数据库下载的.当数据很多时,每条序列都要检索.下载十分耗时,而且容易出错.作者基于NCBI官方提供的Entrez direct软件包,二 ...

  10. CLion调试redis6源码

    背景 clion使用cmake来管理编译redis源码,而redis源码本身使用原生的make,因此直接将redis源码导入clion无法直接运行,需要配置cmake. 写c程序大体步骤为: 1).用 ...

最新文章

  1. export 和 export default 的区别
  2. PHP快速排序(原地切分)
  3. Net与Flex入门
  4. java解码p7b证书文件,通过OpenSSL解码X509证书文件
  5. 符号标志位.进位标志位_功能标志的成本是多少?
  6. 极简代码(一)—— 精确率和错误率的计算
  7. 【Oracle】用户管理
  8. android Xmpp+openfire 消息推送 :SASL authentication failed using mechanism DIGEST-MD5
  9. CDMA,GSM,WCDMA,TD-SCDMA,CDMA2000,3G的区别
  10. my sql 触发器_My SQLServer 触发器
  11. arcgis绘制shp文件
  12. ncm转换mp3文件时遇到问题:未找到文件
  13. 充电枪cp信号控制板_交流充电桩控制原理
  14. MongoDB Could not find host matching read preference { mode: \primary\ } for set repl_shard1
  15. 今日头条怎么申请开通原创,怎么快速过新手期
  16. Spark从本地文件中统计包含某个字母的行数
  17. 美术 2.1 DCC工具链与引擎工具链
  18. 使用神经网络和深度学习构造围棋智能算法:实现棋盘落子编码
  19. Facebook取消雅虎的登陆
  20. [从源码学设计]蚂蚁金服SOFARegistry之时间轮的使用

热门文章

  1. 为什么java数值型的负数比正数多一位
  2. android模拟器 权限管理,Android模拟器上未授予权限
  3. 教你如何设置让Excel窗口总是在最前面
  4. 什么是广域网和局域网?
  5. 朱淑真 潸然看断梨花落
  6. 基于Hive解析AST的模仿sqlFlow无中间表的字段级数据血缘的后端
  7. 数仓建模—ID Mapping(下)
  8. python学习-02(数据类型、字符串、列表、元祖、字典)
  9. 没有事业的女孩子很悲惨 - - - 一位老总的话!
  10. 为什么每天都在学习,生活还是没有任何改善?