SRA数据常用的下载方法

研究生了,对以往的知识进行一个复习和总结吧。
SRA数据库存储了现在主要高通量测序平台的原始测序数据和和比对信息,包括了SRA、EBI、DDBJ、JGI等数据库的信息。(这里分享一个小的知识点,现在可以不只依赖NCBI进行查找和下载,国家基因组科学数据中心(NGDC)官网 已经进行了整合)。对于NGDC数据库的使用在这里就暂时不细说了,看后面有没有必要吧,使用方法更加贴合中国人的习惯的。
言归正传,现在SRA数据的下载主要有以下5个方法:
1、NCBI官方提供的SRA Toolkit工具进行下载;
2、通过链接直接下载;
3、aspera 高速下载;
4、grabseqs 工具下载;
5、运用python爬虫等工具进行辅助下载。

1、SRA Toolkit下载数据

1.1、工具的下载和配置

在ncbi官网上选择合适版本进行下载SRA Toolkit。

1.2、工具环境的配置

我这里使用windows系统进行示例。下载好后解压到本地。然后进行环境配置。具体操作如下:win+R,输入sysdm.cpl,在“高级”界面下点击环境变量,点击系统变量中的path,点击编辑,将存放sratoookit的路径复制粘贴进去,点击确定。



在电脑上进行试运行,解决其他问题。使用管理员权限打开cmd,到存放的路径下,输入bin\prefetch.exe,然后根据提示再输入vdb-config --interactive,按X退出。就可以正常使用了。

cd 360download\sratoolkit.2.11.1-win64\
bin\prefetch.exe
vdb-config --interactive
bin\prefetch.exe -h

1.3、SRA Toolkit使用方法

下载单个数据只需要运行如下代码即可:

prefeth SRR4045218 -O output  #output为数据输出路径

批量进行下载时,需提前准备好相关数据的SRR编号的TXT文件。运行代码即可。

prefetch -O output --option-file SRR_Acc_List.txt

2、链接下载

通过数据库查找对应SRR号可以获取数据链接。一般都显示在“Data access”界面下。

或者也可以使用SRA Toolkit中的srapath工具获取链接。

srapath SRR4045218

获取链接后可进行以下选择:
1、直接点击链接下载,但是会很慢;
2、使用wget工具进行下载,代码如下;

wget -c -t 0 -O  SRR4045218.sra https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos3/sra-pub-run-19/SRR4045218/SRR4045218.1

#-c -t 配合使用可以防止下载数据的过程中链接中断的问题,-O则可以指定下载路径和文件名。

3、aspera下载数据

aspera的使用方法就不在这里叙述了,无论是官网的使用说明或者其他博客上都会有很多,大家自己去看吧。我就只分享一下使用的代码。
下载单个数据:

ascp -T -i <path>/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR620/SRR6208854/SRR6208854.sra ./


批量下载数据;准备链接索引文件(sra_list.txt),运行以下代码:

ascp -T -i <path>//asperaweb_id_dsa.openssh -k 1 -l 200m --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp --file-list ./sra_list.txt ./

4、grabseqs下载数据

第四种下载方式的优势在于可以直接将下载的sra数据直接转换为fastq文件。该软件基于python3,可使用pip安装。

#安装
pip3 install grabseqs
#下载数据
grabseqs sra -t 6 SRR000000 SRP000000 PRJNA000000

到这里主要的方法就介绍完了,但是需要注意的是.sra格式是无法直接使用的,需要转换为fastq格式。一般使用fastq-dump --gzip --split-files SRR000000.sra进行转换。

5、其他工具辅助下载

科研就是去认知本质,不断进步。我们有了这么多的工具进行数据下载,但我们任然可以进行优化,更方便快捷的使用以利于更好的得到实验结果。比如使用爬虫爬取链接,自动生成索引文件,自动进行下载转换等。
学无止境,勇于尝试,才能不断突破。

最后
终于是写完了我研究生生活的第一篇文章,拖了三天,最后在中秋佳节写完了。身份的突然转换,总是让我有些迷茫。加油吧!彩虹总是在风雨之后才会显现!!!

SRA数据下载方法总结相关推荐

  1. SRA数据下载的3种方法

    第一步如何找到sra? 先去看文章 文章有对应的gse号,在geo里输入gse号.          翻页到最下面找到srp号         ####在sra网站搜索srp号 https://tra ...

  2. SRA数据下载(通过EBI-ENA数据库,使用ASpera)

    SRA数据下载(通过EBI-ENA数据库,使用ASpera) 这是本人的第一篇文章,欢迎浏览提问,我会在最快时间内答复,谢谢大家. 本文主要是针对新手下载SRA数据过程,我本人已亲自实践有效.按照本文 ...

  3. NCBI中SRA数据下载

    NCBI中SRA数据下载 hs6605015 2020-08-02 14:35:34  1170  收藏 8 版权 应用场景: 如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要 ...

  4. 如何下载生物数据(四):SRA数据下载

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 应用场景: 如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要测试一些软件,或者想重复文章的内 ...

  5. MODIS数据下载方法

    MODIS数据下载方法 1.安装火狐浏览器,并添加以下组件 2.在组件DownThemAll!中打开"选项",点击"新建",按照下图输入下载格式,并点击&quo ...

  6. 如何linux下载sra数据,下载sra数据

    今天又要开始摸鱼了.记录下下载sra数据的历程.曲折啊. 下载sra files的目的是为了获得相应的fastq或sam files,进而进行分析. 第1选择 -- Aspera Connect 如果 ...

  7. Sentinel2 哨兵2数据下载方法

    Sentinel2 哨兵数据是免费的卫星数据,网上可以下载的地方也比较多,但是不是所有下载方式都好用,这里列举了三个比较好下载的地方. 一. USGS下载 这个是下载比较方便的,能够同时在线下载多景数 ...

  8. CALIPSO数据下载方法与可视化

    集结号 大气.海洋.陆地遥感交流QQ群:831106035.欢迎大家的加入,群内可以讨论与大气.陆地.海洋-遥感相关的问题,可以分享与上述兴趣相关的资源.祝大家学习愉快. 引言 CALIPSO (Cl ...

  9. GEO数据库数据下载方法总结

    GEO数据下载 GEO是生信分析经常用到的数据库.经常需要从中获取表达矩阵,平台信息,meta信息等,本博文总结了几种下载GEO数据的方法,各有优劣,实际应用过程中自行选择适合自己的. 方法一:直接从 ...

最新文章

  1. C++:将char*指针强制转换成一个指向结构体的指针
  2. Dockerfile中的保留字指令讲解
  3. Failed to get response from /vue-cli-version-marker
  4. .NET6之MiniAPI(十五):跨域CORS(下)
  5. 轮子一定要是圆的吗?
  6. 开始菜单下的计算机怎么能看到盘符
  7. html5人脸登录,基于HTML5 的人脸识别活体认证
  8. 哪些学校考研计算机自命题,计算机考研自主命题学校
  9. ABAP学习笔记-基础语法-06-流程控制(01)-条件语句
  10. 入门神经网络优化算法(六):二阶优化算法K-FAC
  11. MySQL数据库存储的字符显示是问号??
  12. 课程向:深度学习与人类语言处理 ——李宏毅,2020 (P9)
  13. 感觉心上有一阵秋风吹过
  14. 【Navicat】Cannot load OCI DLL, 87
  15. 红旗linux9支持软件,红旗linux系统下载|红旗Linux操作系统9.0正式版下载(c语言编写) 最新版_数码资源网...
  16. 什么是证书透明度(Certificate Transparency,CT)?
  17. 微信小程序:多功能起名查重工具
  18. 献给曾经爱过和正在爱的你
  19. Bootstrap学习1:bootstrap4.0基础
  20. 即时通讯(IM)开源项目OpenIM重构版本发布- v2.0.0

热门文章

  1. TP-Link 路由器被曝严重漏洞:无需密码即可登录
  2. 按键精灵在输入框中输入文本
  3. 奥数 python_从小学奥数题到Python
  4. 蓝桥杯web组_用户名片
  5. 年轻人又多了一条赚钱路子:月薪5k,Python搞副业月入过万!
  6. API 网关服务:Spring Cloud Zuul(二):路由详解、Cookie 与头信息
  7. SDN-Mininet中流表应用实战
  8. b站(BiliBili)图床失效问题
  9. [ 代码审计篇 ] Fortify 安装及使用详解(一)Fortify 下载安装并设置语言为中文导出中文报告
  10. msys2 vscode go 环境搭建