NCBI SRA数据预处理
SRA数据的的处理流程大概如下
一、SRA数据下载、
NCBI 上存储的数据现在大都存储为SRA格式。
下载以后就是以SRA为后缀名。
这里可以通过三种方式下载SRA格式的数据。
1.通过http方式,2.通过ftp方式,3.通过Aspera
Aspera可以在NCBI网站上下载。
参阅:http://www.ncbi.nlm.nih.gov/books/NBK47540/
二、SRA格式转换成FASTQ格式
./fastq-dump -A SRR058977 ~/project/yanzi/data/GEO/SRA/SRR058977.sra
fastq-dump可以在ncbi官方网站下载,这里面包含一系列的转换工具;
参阅:http://www.ncbi.nlm.nih.gov/books/NBK56560/
http://eutils.ncbi.nih.gov/Traces/sra/?view=software
转换成FASTQ,SFF,lllumina native,AB SOLiD native等格式;
另,转换FASTQ以后要转换成FASTA 命令如下:
awk '{if(FNR%4==1) print ">",$0; else if(FNR%4==2) print $0;}' a.fastq >a.fasta
————————----------------------------------------------------------------
以上部分为预处理部分:
当然我做的方向是比对方向,就可以用fasta做比对工作了。
………………………………………………………………………………………………………………………………………………………………………………………………
后面还可以做其他反面的研究:
3.去接头(此步要注意是否有接头,一般RNA-SEQ数据应该是没有接头的)
4.用tophat寻找可变剪切
tophat -r 42 -G genome.fa -o PF genomeIndex SRR058977.fastq
5.用cufflinks找不同组织中的差异
cuffdiff genomeAnnotation.gff ../BF/accept.bam ./accept.bam
来源:http://blog.sciencenet.cn/blog-565558-626137.html
…………………………………………………………………………………………………………………………………………………………
可能会用到的修改目录权限的linux命令
Linux改变分区权限(简单好用版)
原理:
1.在Linux和Unix世界里,一切都是以文件的形式存在的。文件夹是文件,文件是文件,设备也是文件。
2.分区在挂载后,会在 /media/ 下以文件夹的形式显现
3.chmod用于修改权限 而chmod ugo+rwx 用于给所有的用户和用户组添加所有的权限
步骤:
1.假设需要修改权限的分区名为x
2.挂载x
3.赋权
代码:
sudo chmod ugo+rwx /media/x
转载于:https://www.cnblogs.com/suncoolcat/p/3283656.html
NCBI SRA数据预处理相关推荐
- 在linux系统下怎么下载sra数据,NCBI sra数据下载软件安装
引用网址: 1.SRA Toolkit 的安装 cd /opt/ wget ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current- ...
- NCBI下载SRA数据的4种方法
作为生命科学的从事者,不论是老师或者学生都应该用过NCBI((National Center for Biotechnology Information Search database,一个综合性的生 ...
- 批量下载sra文件linux,Linux下从NCBI批量下载SRA数据的sra和aspera方法
Minus_yao 2018.04.25 yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...
- NCBI中SRA数据下载
NCBI中SRA数据下载 hs6605015 2020-08-02 14:35:34 1170 收藏 8 版权 应用场景: 如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要 ...
- 批量下载sra文件linux,NCBI下载SRA数据的4种方法
作为生命科学的从事者,不论是老师或者学生都应该用过NCBI((National Center for Biotechnology Information Search database,一个综合性的生 ...
- linux 下载sra数据库,NCBI下载SRA数据和之后的数据处理
一,下载该软件 wget http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz ta ...
- 下载NCBI的SRA数据 详细教程
SRA(Sequence ReadArchive)数据库是NCBI(National Center for Biotechnology Information)旗下用于存储高通量测序数据的子库.来自世 ...
- Linux下从NCBI批量下载SRA数据的sra和aspera方法
Minus_yao 2018.04.25 yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...
- GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX2159543
1.首先,进入GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX2159543 2.然后在GEO profile中搜索SRX2159543 点击:如下图所示: 点击Downloa ...
最新文章
- html input file 修改按钮文字_html单选按钮默认选中怎么做?input标签的单选按钮用法实例...
- c语言else匹配问题
- element布局容器大小_Flutter完整开发实战详解(十六、详解自定义布局实战)
- pythontry参数_Python try except异常处理详解(入门必读)
- Django ORM models操作
- SLAM学习笔记-------------(二)初识SLAM
- 干货! IT项目管理过程详解(资料下载)
- MathType求和符号中的黑三角该如何消除
- 阿里云2核4G云服务器租用CPU内存、公网带宽和系统盘配置
- Android 手写和笔锋研究资料
- 适合Python新手的爬虫练习:网易LOFTER图片爬虫(一)
- 记在2019,winter is coming
- 西门子1200PLC的MODBUS通信
- csp-202203
- ViewPager2页面指示器(圆形)
- 词霸天下---1~2词根【仅供学习使用】
- 阿里腾讯外包Java怎样_阿里Java岗、腾讯后台开发岗面经(拿到AT双Offer)
- UI设计工作范围包括什么 都需要学习哪些技能
- linux上传文件put,详解Linux ftp 命令行中下载文件get与上传文件put的操作方法
- 小学生用计算机好吗,小学生用点读机好还是平板电脑好