安装和使用Entrez Direct
安装和使用Entrez Direct软件
#到home目录下
cd
#等同于用~/ ,~/ 表示你的home目录
cd ~/#创建/local/app目录来存放需要安装的程序
mkdir -p ~/local/app#进入app目录
cd ~/local/app
获取entrez direct 工具包
#大写 -O 是使得curl 命令去识别url上的文件名(作为下载后的文件名字)
curl ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -O
#上一条命令等同于
curl ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -o edirect.zip
解压这个工具包
unzip edirect.zip
查看新工具
cd edirect
ll
配置环境变量
echo "export PATH=\$PATH:\$HOME/local/app/edirect" >> $HOME/.bashrc
source ~/.bashrcesearch -help
Option h is ambiguous (help, http, https)
Query Specification-db Database name-query Query string
Document Order-sort Result presentation order
Date Constraint-days Number of days in the past-datetype Date field abbreviation-mindate Start of date range-maxdate End of date range
....................................................
#.bashrc 这个文件主要保存个人的一些个性化设置,如命令别名、路径等
运行 einfo
einfo -help
einfo 7.40
Database Selection-db Database name-dbs Get all database names
Data Summaries-fields Print field names-links Print link names
Field Example<Field><Name>ALL</Name><FullName>All Fields</FullName>
.........................................................................
抓取描述信息,然后查看它们
einfo -dbs > einfo-dbs.txt
more einfo-dbs.txt
einfo -db sra > einfo-sra.txt
more einfo-sra.txt
运行esearch
esearch -help
esearch -db nucleotide -query PRJNA257197
#-db是指定数据库类型,而query是跟着你要搜索的关键词。
#在nucleotide这个数据库(database,简称db)里用关键词PRJNA257197搜索
1:数据库类型为nucleotide,我们esearch的时候就指明了,我们要在nucleotide这个数据库=里搜索
2:搜索关键词数量:1(因为我们只输入了一个关键词,就是PRJNA257197)
3:搜索得到的条目有249个
这一步相当于你到NCBI的首页,做了下图的操作:
并点了Search
看!果然是249条检索结果
抓取nucleotides数据
esearch -db nucleotide -query PRJNA257197 | efetch -format fasta > ~/edu/lec3/ebola.fasta
看一下这个文件里有多少条序列
cat ~/edu/lec3/ebola.fasta | grep ">" | wc -l
249
cat ~/edu/lec3/ebola.fasta | wc -l
67603
less ~/edu/lec3/ebola.fasta
以GenBank格式获取数据
esearch -db nucleotide -query PRJNA257197 | efetch -format gb > ~/edu/lec3/ebola.gb
less ~/edu/lec3/ebola.gb
看一下这个文件里有多少条序列
cat ~/edu/lec3/ebola.gb | grep ^LOCUS | wc -l
249
安装和使用Entrez Direct相关推荐
- linux command line 利用Entrez Direct下载NCBI数据
一.软件的安装 1.软件下载: curl ftp://ftp.ncbi.nlm.nih.gov/entrez/entrezdirect/edirect.zip -O (熟悉curl下载文件的方法 ...
- Oracle 19C 安装指引
Oracle 19C 安装指引 18C新功能 1.简化的基于镜像的Oracle数据库安装 从18C开始,Oracle可以作为镜像文件来下载和安装,必须解压缩镜像文件到ORACLE_HOME目录,然后执 ...
- RabbitMQ底层原理及安装使用详解
1.RabbitMQ原理概述 2.RabbitMQ安装和管理 3-1.Direct(直接交换器) 4.消息发布时的权衡 5.消息消费时的权衡 6.消息消费的拒绝 7.Spring整合RabbitMQ ...
- bedtools指南
文章目录 官方文档 下载安装 演示版的bed文件 (demo.bed) 我们的基因组文件(genome.txt) 两侧的运算 填充运算 下载测试数据 提取与genes.gff的间隔相对应的序列 获取测 ...
- biostar handbook(四)|生物数据及其下载和基本操作
2017/11/9 第一版: 生物数据库,基本数据类型(genbank, fasta/fastq),数据上传站点 2017/11/12 第二版:如何利用esearch, efecth快速获取SRR序列 ...
- SRA数据的下载 PRJNA257197
从NCBI下载测序数据 | 也许是目前最详细的版本 目录 一.使用NCBI的工具进行下载 1. 下载和安装Entrez Direct以及SRA toolkit 1.1 下载和安装Entrez Dire ...
- 【翻译】--19C Oracle 安装指导
18C新功能 1.简化的基于镜像的Oracle数据库安装 从18C开始,Oracle可以作为镜像文件来下载和安装,必须解压缩镜像文件到ORACLE_HOME目录,然后执行runInstaller安装. ...
- NDM的网络配置文件netmap.cfg
简介 NDM的网络映射包含描述本地节点和网络中的远程节点的连接信息. 为本地节点与之通信的每个节点创建一个远程节点信息记录. 网络映射文件位于d_dir/ndm/cfg/cd_node/netmap. ...
- Getfasta--根据Acession Number(Ac号)批量下载GenBank分子序列数据的自动化程序
推断分子系统发育树时,很多分子序列数据都是从GenBank等公共数据库下载的.当数据很多时,每条序列都要检索.下载十分耗时,而且容易出错.作者基于NCBI官方提供的Entrez direct软件包,二 ...
- CLion调试redis6源码
背景 clion使用cmake来管理编译redis源码,而redis源码本身使用原生的make,因此直接将redis源码导入clion无法直接运行,需要配置cmake. 写c程序大体步骤为: 1).用 ...
最新文章
- export 和 export default 的区别
- PHP快速排序(原地切分)
- Net与Flex入门
- java解码p7b证书文件,通过OpenSSL解码X509证书文件
- 符号标志位.进位标志位_功能标志的成本是多少?
- 极简代码(一)—— 精确率和错误率的计算
- 【Oracle】用户管理
- android Xmpp+openfire 消息推送 :SASL authentication failed using mechanism DIGEST-MD5
- CDMA,GSM,WCDMA,TD-SCDMA,CDMA2000,3G的区别
- my sql 触发器_My SQLServer 触发器
- arcgis绘制shp文件
- ncm转换mp3文件时遇到问题:未找到文件
- 充电枪cp信号控制板_交流充电桩控制原理
- MongoDB Could not find host matching read preference { mode: \primary\ } for set repl_shard1
- 今日头条怎么申请开通原创,怎么快速过新手期
- Spark从本地文件中统计包含某个字母的行数
- 美术 2.1 DCC工具链与引擎工具链
- 使用神经网络和深度学习构造围棋智能算法:实现棋盘落子编码
- Facebook取消雅虎的登陆
- [从源码学设计]蚂蚁金服SOFARegistry之时间轮的使用