RNA-seq——快速下载SRA数据、解决fq文件中测序质量全为 ‘?‘ 的问题
写在前面——在学习RNA-seq时,需要从网上下载公开数据集来上手分析,大部分教程都很古老,其中在ncbi中ftp的下载链接已经不存在了,甚至可以直接下载fastq文件。但是,直接下载的fastq文件做fastqc之后结果为一条直线,因为文件里的测序质量都是30,要想下载带正常质量数据的文件需要换一种方法。
RNA实战:http://www.bio-info-trainee.com/2218.html
sra数据如何寻找:
- 查找对应的GSE:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177
可以直接复制链接,然后在对应的文章中找到GSE号,把链接中的GSE修改一下即可。
- SRA Run Selector:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA217298&o=acc_s%3Aa
点击进入之后,可以找到我们做RAN-seq的数据,这些数据一般都比较大。点击Run这一列的名字,即可跳转到对应的下载界面。
sra数据如何下载(例如SRR957678):
方法一:
- 直接下载对应的SRR957678.fastq.gz
- 存在的问题:测序质量均为?,fastqc结果为一条直线
方法二:需要在Linux中使用
- 使用aspera:https://www.jianshu.com/p/fed19a8821eb
注意:安装aspera不能在root账户下,需要新建一个用户。 - 使用sratoolkit:https://www.jianshu.com/p/d1abdced8bcd
- vdb-config --interactive:https://www.jianshu.com/p/88b2852d4573、
conda install sra-tools# 如果下载完之后无法使用prefetch,可能需要更新一下sra-tools
conda update sra-tools
安装完sratoolkit可以直接使用prefetch进行下载,速度挺快的
prefetch SRR957678
RNA-seq——快速下载SRA数据、解决fq文件中测序质量全为 ‘?‘ 的问题相关推荐
- 如何linux下载sra数据,下载sra数据
今天又要开始摸鱼了.记录下下载sra数据的历程.曲折啊. 下载sra files的目的是为了获得相应的fastq或sam files,进而进行分析. 第1选择 -- Aspera Connect 如果 ...
- 干货分享 | Windows系统下载SRA数据方法——生信小白亲测可行
在开展二代测序相关课题研究时,经常需要上传或者下载SRA数据库中的数据,对熟悉Linux系统.懂代码的同学们来说是非常容易的事情.但像小编这一类看到代码两眼一抹黑的小白就有点难度了,尤其电脑还是Win ...
- 批量下载sra文件linux,Linux下从NCBI批量下载SRA数据的sra和aspera方法
Minus_yao 2018.04.25 yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...
- Linux下从NCBI批量下载SRA数据的sra和aspera方法
Minus_yao 2018.04.25 yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...
- 使用fastq-dump下载SRA数据
使用fastq-dump下载SRA数据 环境和配置请见系列博文 1.下载: fastq-dump -Z DRR047093 然后会显示信息:如果文件过大会有很多 可以显示制定条数 fastq-dump ...
- 直接快速下载NLTK数据
直接快速下载NLTK数据 直接下载NLTK的数据速度很慢,这里提供NLTK数据集,直接下载即可.或者选择下列百度云下载: 链接:https://pan.baidu.com/s/17ZgkoQeMosW ...
- aspera下载sra文件linux,Aspera Connect,高速下载sra数据
一.下载安装Aspera Connect Linux系统下的Aspera Connect安装(Windows下的Aspera Connect安装参考). 查看最新版本的Aspera - High-sp ...
- html表格导入wps,怎么快速将网页数据导入WPS表格中?
在日常学习办公中,我们经常用到WPS这款软件,那么怎么快速将网页数据导入WPS表格中呢?下面小编就给大家详细讲解一下,快来看看吧! 一.新建文本文档,命名为<学生参赛信息.txt>. 1. ...
- K8S客户端Kubectl无法下载问题的解决办法-到中科大USTC下载
K8S客户端Kubectl无法下载问题的解决办法-到中科大USTC下载 存在问题: 国外网站访问太慢,kubectl如何下载?(官方的文件位于googleapis网站上) 解决思路: 1.到国内中科大 ...
最新文章
- 使用CSS 3创建不规则图形
- 18DOM之节点操作
- tmux的使用方法和个性化配置
- ARM指令集、Thumb指令集、Thumb-2指令集
- 压缩感知(Compressive Sensing)学习之(一)
- PHP替换文本文件其中一行,使用PHP替换文本文件中的行
- [2-sat专练]poj 3683,hdu 1814,hdu 1824,hdu 3622,hdu 4115,hdu 4421
- arraylist删除指定元素_揭开ArrayList的外衣看本质
- python nltk —— 文本预处理
- springboot12 MVC自动配置原理
- 10.1综合强化刷题 Day2 morning
- RPN Calculator for mac(RPN计算器)
- 聚类算法之密度聚类方法
- 讲讲NVivo11的版本细节
- 利用com.googlecode.libphonenumber解析手机号归属地
- 音视频剪辑 DIY:用 Python 快速入门音视频剪辑
- 字节二面、三面面经及内推
- 钉钉 服务器 消息推送,钉钉消息推送配置
- MathType公式编辑器数学公式、希腊字母和常用操作快捷键[待续ing]
- sdcc man阅读笔记(四)——存储类型关键字