StringTie是約翰·霍普金斯大學计算机生物中心开发的一款转录组组装软件,在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升,也是目前有参考基因组转录组主流的组装软件。

软件的下载

wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.6.Linux_x86_64.tar.gz

tar zxvf stringtie-1.3.6.Linux_x86_64.tar.gz

StringTie 使用说明:新版本更新之后去掉了一些参数

stringtie [-G ] [-l ] [-o ] [-p ]

[-v] [-a ] [-m ] [-j ] [-f ]

[-C ] [-c ] [-g ] [-u]

[-e] [-x ] [-A ] [-h] {-B | -b }

选项:

--version : 输出软件的版本信息

-G 参考序列的基因注释文件 (GTF/GFF3)

-l 输出转录本的名称前缀 (default: STRG)

-f 最少转录本的比例 (default: 0.1)

-m 组装转录本的最小长度 (default: 200)

-o 组装转录本的GTF注释文件 (default: stdout)

-a 连接位点锚定序列的最小长度 (default: 10)

-j 连接位点的最小覆盖度 (default: 1)

-t 基于覆盖度对预测的转录本进行修正 (default: coverage trimming is enabled)

-c 组装转录本的reads最小覆盖度(default: 2.5)

-v 输出log 信息

-g 比对上的reads 间距大于阀值则新城一个新的转录束 (default: 50)

-C 输出参考转录本中被reads 覆盖到的转录本

-M 转录束允许多比对reads覆盖的最大占比 (default:0.95)

-p 线程(CPU)数 (default: 1)

-A 基因丰都输出文件

-B 在输出的GFT同目录下输出Ballgown table 文件

-b 在 目录下输出Ballgown table 文件

-e 只对参考转录本进行丰都评估 (requires -G)

-x 不在参考序列区域组装任何的新转录本

-u 多比对校正 (default: correction enabled)

-h 输出软件的帮助信息

软件的使用

如果是只需要对已知的基因进行定量使用下面的命令

stringtie -p 18 -G Homo_sapiens.GRCh38.89.protein_coding.gtf -B -e -o Ctrl-1.gtf -A Ctrl-1_abundance.txt -l Ctrl-1 Ctrl-1.bam

使用的参数说明

-p 设置运行的线程数

-G 设置GTF基因组注释文件

-B 在GTF的输出目录下输出ballgown table文件,用于使用ballgown table进行差异表达分析

-e 只对参考转录本进行丰度的计算,需要提供GTF注释文件

-o 输出生成的GTF注释文件

-A 输出基因的丰度计算结果

-l 设置前缀名

最后接输入的bam文件,输入的bam文件是要排序之后的文件,一般是默认按照染色体顺序排序

如果是需要组装新的转录本使用下面的命令

stringtie CM11.bam -G CM.gtf -o CM11.gtf -f 0.3 -j 3 -c 5 -g 100 -s 10000 -p 24

使用的参数说明

-f 最少的转录本比例

-j 连接位点的最小长度

-c 组装的转录本的最小read覆盖度

-g 比对上的reads 间距大于阀值则新城一个新的转录束

-s 新版已经没有了这个参数,主要当作组装转录本的时候的一个阈值

-p 线程数

比较新的版本才有merge功能,

转录本合并模式使用说明:

stringtie --merge [Options] { gtf_list | strg1.gtf ...}

选项

-G 参考转录本的注释信息 (GTF/GFF3)

-o 合并转录本的GTF输出文件 (default: stdout)

-m 合并转录本的最小长度(default: 50)

-c 合并转录本的最低覆盖度(default: 0)

-F 合并转录本的最小FPKM值(default: 1.0)

-T 合并转录本的最小TPM值(default: 1.0)

-f isoform 最小比例(default: 0.01)

-g 转录本见GAP长度小于阀值则合并两转录本 (default: 250)

-i 允许合并转录本中有内含子保留; by default

-l 输出的转录本名称前缀 (default: MSTRG)

使用方法如下:

需要先将单个样品得到的gtf放到一个mergelist.txt文件里面,然后使用--merge参数即可,也可以设置-m,-c,-F,-T以及-f等参数对组装后的转录本在merge时进行过滤,同时也可以加入-G 参数输入参考的gtf注释文件

stringtie --merge -p 20 -o stringtie_merged.gtf mergelist.txt

有参组装新转录本cufflinks_转录组组装软件stringtie相关推荐

  1. 有参组装新转录本cufflinks_转录本组装软件StringTie的使用说明

    其中StringTie 在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升. StringTie 使用说明: stringtie [-G ] [-l ] [-o ] [-p ...

  2. 有参组装新转录本cufflinks_RNA-Seq流程(cutadapt-tophat2-cufflinks)

    1.cutadapt去接头 #cut NAT sample #-u 20(正值u表示切除R1的前20个碱基) -u -30(负值u表示切除R1的前20个碱基)/ #-U 20(正值U表示切除R2的前2 ...

  3. 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列片段(即read),并根据reads 之间的重叠区域对片段进行拼接,先拼接成较长的连续 ...

  4. 应用第二代测序技术的转录组组装

    目录 Next-generation transcriptome assembly 应用第二代测序技术的转录组组装... 2 第一部分:总体介绍挑战与机遇... 2 第二部分:实验提取与数据分析... ...

  5. 使用Trinity进行转录组组装

    Trinity Trinity是Broad Institute和Hebrew University of Jerusalem开发的RNA-Seq数据 转录组组装工具,包括三个模块, Inchworn( ...

  6. 转录组组装软件--Bridger安装使用和报错解决方案

    @转录组组装软件----Bridger安装注意事项和使用 #前言 在很多的文章中都看到了关于转录组组装软件–Bridger的推荐,但是找遍了很多平台都没有找到详细的安装教程,众所周知,安装软件都需要去 ...

  7. 中国科学家研发新的全基因组组装算法

    重磅!中国科学家研发新的全基因组组装算法 2019-12-10 00:01 北京时间12月10日0时,<自然-方法学>在线发表了第一个能够跟上基因组测序产生速度的组装算法. 这篇论文只有两 ...

  8. Trinity进行转录组组装(2))

    1. Trinity进行转录组组装 Trinity进行转录组组装的典型命令如下: $ /opt/biosoft/trinityrnaseq_r20131110/Trinity.pl --seqType ...

  9. 计算平均指令时间_技术人员正在组装新计算机。在将主板装入机箱之前通常先安装哪两个组件?(选择两项。)...

    展开全部 技术人员正在组装新2113计算机.在将主板装入机5261箱之前通常先安装CPU和内存4102两个组1653件. cpu的主要功能: 1.处理指令 这是指控制程序中指令的执行顺序.程序中的各指 ...

最新文章

  1. leetcode解题文件夹
  2. NOIP2013普及组 T2 表达式求值
  3. 逆向工具之IDA的使用
  4. python字典的常见操作_Python 字典(Dictionary) 基本操作
  5. [构造训练]CF1227G Not Same,CF1375H Set Merging,CF1364E X-OR
  6. 嵌入式linux 试卷,嵌入式Linux模拟试卷
  7. MyEclipse could not redeploy(不能重新部署)的解决办法
  8. 教大家防止Jar包被反编译
  9. 神经网络高维互信息计算Python实现(MINE)
  10. Struts2拦截器详解
  11. HDU-1548 A strange lift
  12. thinking in java 4
  13. chrome浏览器的性能测试--本文引用自 百度百科http://baike.baidu.com/view/1835504.htm
  14. PFC电源设计与电感设计计算学习笔记
  15. Mybatis狂神说完整笔记
  16. 计算机c盘是内存还是外存,rom是内存还是外存?
  17. Js获取上传文件的绝对路径时总是的到C:\fakepath\+文件名称 解决方案
  18. 风速传感器的安装要求是什么?安装要注意这三点
  19. 汉明码生成过程图文详解
  20. Writing an LLVM Pass

热门文章

  1. 中秋之际,我想给月亮做一个智能化改造
  2. 有一个程序员男友是一种怎么样的体验?
  3. Valley Numer II(状压dp)
  4. shell的转义字符
  5. 非计算机专业学生怎么走上计算机技术之路?
  6. 在线CAD平台,MxCAD云图 2021.01.20更新,在线CAD软件
  7. Win10如何批量修改文件名,实现向后加固定的数字,001.jpg——999.jpg
  8. Windows系统下安装Cadence Sigrity 2022.1
  9. 如何解决微服务的数据一致性分发问题?
  10. could和may区别请求_英语教学:外教这样区分can,may,could