Trinity使用流程
原文地址:http://www.plob.org/2014/12/22/8826.html
1:分析流程图如下
2: 首先就是将样本的reads合并在一起命令如下:
1
|
cat 1M_READS_sample/*.left.fq > reads.ALL.left.fq
|
2
|
cat 1M_READS_sample/*.right.fq > reads.ALL.right.fq
|
3:开始拼接
1
|
$TRINITY_HOME/Trinity.pl --seqType fq --JM 10G --left reads.ALL.left.fq --right reads.ALL.right.fq --SS_lib_type RF --CPU 6 --seqType fq —-output ./trinity_out_dir
|
输出文件:Trinity.fasta
4:拼接统计
1
|
$TRINITY_HOME/util/TrinityStats.pl trinity_out_dir/Trinity.fasta>./assembly_report.txt
|
输出文件:assembly_report.txt
5:比对reads评估表达量(每个样本都需要单独比对)
1
|
$TRINITY_HOME/util/align_and_estimate_abundance.pl --transcripts Trinity.fasta --seqType fq --left reads_1.fq --right reads_2.fq --est_method RSEM --aln_method bowtie --trinity_mode —prep_reference
|
比对输出:bowtie.csorted.bam
RSEM输出:
RSEM.isoforms.results : EM read counts per Trinity transcript
RSEM.genes.results : EM read counts on a per-Trinity-component (aka... gene) basis, gene used loosely here.
过滤比对:
1
|
<span class= "s1" >$TRINITY_HOME/util/filter_fasta_by_rsem_values.pl </span><span class= "s1" >--rsem_output=/path/to/RSEM.isoforms.results[,...] --fasta=/path/to/Trinity.fasta --output=/path/to/output.fasta</span> <span class= "s5" >--fpkm_cutoff=1200</span>
|
过滤值需要根据需求自己设定。
6:差异表达分析(edgeR)
假定有四个样本,转录本定量输出为:
LOG.isoforms.results
DS.isoforms.results
HS.isoforms.results
PLAT.isoforms.results
注意:--samples_file为样本分组信息文件 group.txt ,例如:
Throat sample2.sam
Saliva sample3.sam
Throat sample4.sam
Vaginal sample5.sam
--contrasts 为样本不同条件下比较compare.txt:
Throat Saliva
Vaginal Saliva
Throat Vaginal
7:提取最好的OFR
1
|
$TRINITY_HOME/trinity-plugins/transdecoder/TransDecoder -t transcripts.fasta -m 100 —search_pfam /path/to/pfam_db.hmm to search —CPU 6
|
输出文件:
- Trinity.fasta.transdecoder.pep
- Trinity.fasta.transdecoder.cds
- Trinity.fasta.transdecoder.bed
- Trinity.fasta.transdecoder.gff3
8:功能注释
下载的软件:Trinotate、Trinity、sqlite、NCBI Blast、HMMER、signalP v4、tmhmm v2、RNAMMER
比对数据库:SwissProt、Uniref90、Pfam domains
标准化数据:
1
|
makeblastdb - in uniprot_sprot.fasta -dbtype prot
|
2
|
makeblastdb - in uniref90.fasta -dbtype prot
|
3
|
hmmpress Pfam-A.hmm
|
blast比对(比对的数据库可以换成nr/Uniref90)
# search Trinity transcripts
1
|
blastx -query Trinity.fasta -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastx.outfmt6
|
# search Transdecoder-predicted proteins
1
|
blastp -query transdecoder.pep -db uniprot_sprot.fasta -num_threads 8 -max_target_seqs 1 -outfmt 6 -evalue 1e-5 > blastp.outfmt6
|
功能域
1
|
hmmscan --cpu 8 --domtblout TrinotatePFAM.out Pfam-A.hmm transdecoder.pep > pfam.log
|
信号肽
1
|
signalp -f short -n signalp.out transdecoder.pep
|
跨膜结构
1
|
tmhmm --short < transdecoder.pep > tmhmm.out
|
识别rRNA
1
|
$TRINOTATE_HOME/util/rnammer_support/RnammerTranscriptome.pl --transcriptome Trinity.fasta --path_to_rnammer /usr/bin/software/rnammer_v1.2/rnammer
|
输出:Trinity.fasta.rnammer.gff
9:Load transcripts and coding regions
1
|
$TRINITY_HOME/util/support_scripts/get_Trinity_gene_to_trans_map.pl Trinity.fasta >Trinity.fasta.gene_trans_map
|
2
|
3
|
Trinotate Trinotate.sqlite init --gene_trans_map Trinity.fasta.gene_trans_map --transcript_fasta Trinity.fasta --transdecoder_pep transdecoder.pep
|
10:Output an Annotation Report
1
|
Trinotate Trinotate.sqlite LOAD_swissprot_blastp blastp.outfmt6
|
2
|
Trinotate Trinotate.sqlite LOAD_swissprot_blastx blastx.outfmt6
|
3
|
Trinotate Trinotate.sqlite LOAD_pfam TrinotatePFAM.out
|
4
|
Trinotate Trinotate.sqlite LOAD_tmhmm tmhmm.out
|
5
|
Trinotate Trinotate.sqlite LOAD_signalp signalp.out
|
6
|
Trinotate Trinotate.sqlite report >trinotate_annotation_report.xls
|
输出文件:trinotate_annotation_report.xls
原文来自:http://blog.sina.com.cn/s/blog_83f77c940102v7xu.html
Trinity使用流程相关推荐
- 使用Trinity进行转录组组装
Trinity Trinity是Broad Institute和Hebrew University of Jerusalem开发的RNA-Seq数据 转录组组装工具,包括三个模块, Inchworn( ...
- Trinity转录组无参组装
软件trinity使用流程 1. 数据下载 从NCBI的SRA下载原始下机数据,选择双端测序的Pair-end,但是一般只有一个文件,需要进行格式转换与解压: 2. 安装软件 本次全部使用conda进 ...
- 基于Salmon的转录组批量定量流程和差异分析
继续前文:基于Salmon的转录组定量流程 循环定量多个样品的表达量 整理样本信息表,命名为sampleFile,内容如下: Samp conditions individual untrt_N613 ...
- Trinity的安装与使用
Trinity是由 Broad Institute开发的,用于转录本的de novo拼接,主要由三个软件模块组成:Inchworm, Chrysalis and Butterfly,能处理大型的RNA ...
- Trinity简介(1)--用于无参考基因组的转录组de novo组装
一. Trinity简介 Trinity,是由 the Broad Institute 开发的转录组de novo组装软件,由三个独立的软件模块组成: Inchworm,Chrysalis和Butte ...
- 【独家】对话Trinity创始人李一灵:智能经济的基石
点击上方 "蓝色字" 可关注我们! 记者:Clover 提到Trinity,大部分人首先想到的可能就是黑客帝国这部经典科幻片了.影片中Trinity的身份以及影片的内容想必大家也都 ...
- 转录组分析流程|数据处理与De novo组装(一)
title: 转录组分析流程|数据处理与De novo组装(一) tags: - 转录组组装 - 教程 - 软件 - Trinity - Rcorrector - Trimmomatic catego ...
- 淘宝获取单笔订单信息服务端调用API及流程
淘宝获取单笔交易接口(文档地址):https://open.taobao.com/api.htm?docId=54&docType=2 调用接口所需依赖(文档地址):https://devel ...
- 用伪代码模拟洗衣机的运转流程
今天的软导课又学到了不少"骚操作",其中就包括Pseudocode和Top-down design. 不如现在就借着介绍洗衣机的运转流程向大家介绍一下这两个简单的东西. 题目如下 ...
最新文章
- 存在即合理:基于云计算的EMR
- 丁磊:噢买尬,买它,华少别抢话
- Spring JMS
- eureka/zookeeper/consul 三个注册中心的异同点
- Pentest Box -windows平台的linux bash,集成了很多测试工具
- Android 置Activity全屏和无标题
- 在centos 7 下安装图形界面
- Pyomo 优化建模
- 火了 2 年的服务网格究竟给微服务带来了什么?(转载)
- Python中猜数字游戏
- CDMA2000中的Walsh码,PN码,短码序列的初相位偏置(PN OFFSET)之間的差別與關係(1)
- 图像处理: AlphaBlend
- 深刻剖析快速排序为什么不稳定?
- JavaScript实现涂鸦笔
- 电机开环控制与闭环控制
- 兼容IE9的文件上传
- 如何批量新建文件夹,批量新建文件夹并命名
- C++ STL set容器
- 基于Winform开发S7.net协议 与Smart-200PLC通讯
- 浪潮服务器开机板载卡显示FF,浪潮服务器安装操作系统简要步骤说明
热门文章
- php表格单元格怎么实现排序,excel表格数据怎么自动排列-excel表格如何实现自动排序...
- 【MySQL】数据库配置
- IDEA太强悍了!java导出excel合并单元格边框设置
- 机器视觉-相机镜头光源介绍及选型-3.光源分类
- SSM网约车管理系统毕业设计源码051630
- jsf取js变量_JSF页面中的JS取得受管bean的数据(受管bean发送数据到页面)
- ossbrowser
- C语言中的结构体,结构体中数组初始化与赋值
- 结构体类型的变量的初始化
- AutoHotKey的那些事儿:(一)、AutoHotkey常用命令