参考 http://ccb.jhu.edu/software/stringtie/index.shtml?t=manual​​​​​​​stringtie <aligned_reads.bam> [options]*

1. 分别对每个样本进行转录本预测

stringtie ${sample_id}.sorted.bam -o ${sample_id}.gtf -p ${threads} -G ${gtf} -B -l ${sample_id} # 可以批量处理,测序数据放在项目目录下不同的子文件夹下,以SRR数据为例,在项目文件夹下运行:
ls -d SRR*|while read id;do input=$id/$id'.sorted.bam'; output=$id/$id'.gtf' ;stringtie  -o $output -p ${threads} -G ${gtf} -B -l $id $input;echo $id ;done &

主要参数说明:

-G 参考基因组注释信息,GTF/GFF3格式,

-B enable output of Ballgown table files which will be created in the

    same directory as the output GTF (requires -G, -o recommended)

-l 生成的.gtf文件中transcript_id的前缀,默认为STRG,一般设置sample号。

注: .gtf注释数据要和比对时的索引基因组组要统一。hg38.refGene.gtf 不等同于Homo_sapiens.GRCh38.84.gtf,组装版本号也要一致。

2. 合并转录本

# 生成gtf.list文件
find ./SRR* -name *gtf > gtf.list# merge
stringtie --merge  -p ${threads} -G ${gtf}  -o total_merged.gtf -l merge gtf.list &

注:StringTie将GTF/GFF文件列表作为输入,并将这些转录本合并/组合成一组非冗余的转录本。这种模式用于新的差异分析管道,以生成跨多个RNA序列样本的一组全局统一转录本(异构体)。

3. 根据全局统一转录本重新计算各个样本中转录本的表达量。

for id in `ls -d SRR*`;do stringtie ${id}/${id}.sorted.bam -e -A ${id}/${id}_gene_abund.tab -B -p 50 -G total_merged.gtf -o ${id}/${id}.merged.gtf;done &

主要参数说明:

 ${id}/${id}.sorted.bam 各个样本的排好序的bam文件

-e only estimate the abundance of given reference transcripts (requires -G)

-A 输出的转录本丰度text文件名

-B enable output of Ballgown table files which will be created in the

    same directory as the output GTF (requires -G, -o recommended)

-G 注意后面的文件是 total_merged.gtf

注:这次是根据全局统一转录本来计算转录本丰度,一定要加-e 参数

4. 预测指定转录本的丰度

for id in `ls -d SRR*`;do stringtie ${id}/${id}.sorted.bam -e -A ${id}/${id}_gene_abund.tab -B -p 50 -G ${gtf} -o ${id}/${id}.merged.gtf;done &

注:即使是人的转录本也没能充分注释,一般用上面的流程1-3,如果只关注参考注释中的转录本,可以加-e参数,一步完成。${gtf}为制定的转录本注释数据,一般为参考基因组的注释信息。

5. 比较gtf文件

Usage:

gffcompare [-r <reference_mrna.gtf> [-R]] [-T] [-V] [-s <seq_path>]

    [-o <outprefix>] [-p <cprefix>]

    {-i <input_gtf_list> | <input1.gtf> [<input2.gtf> .. <inputN.gtf>]}

## 比较软件得到的gtf文件和参考gtf的差异# 单次比较
gffcompare -r -r ${gtf} -o ${id}/strtcmp ${id}/${id}.merged.gtf# 批量比较
ls -d SRR*|while read id;do gffcompare -r ${gtf} -o ${id}/strtcmp ${id}/${id}.merged.gtf;done &

Stringtie进行转录本组装和定量相关推荐

  1. 有参组装新转录本cufflinks_转录本组装软件StringTie的使用说明

    其中StringTie 在组装转录本的完整度,精度和速度方面都较以往的cufflinks 有很大的提升. StringTie 使用说明: stringtie [-G ] [-l ] [-o ] [-p ...

  2. 转录组分析_转录组分析 | 使用Stringtie对数据进行下游处理

    TCGA | GEO | 文献阅读 | 数据库 | 理论知识 R语言 | Bioconductor | 服务器与Linux 接前文: 转录组分析 | fastqc进行质控与结果解读 转录组分析 | 使 ...

  3. ballgown包进行基因差异表达分析

    ballgown包可以读入Stringtie 的转录组组装及定量数据,进行基因差异表达分析. 1. 数据读入 # if (!requireNamespace("BiocManager&quo ...

  4. mRNA数据分析专题

    欢迎关注"生信修炼手册"! mRNA是基因实时表达的产物,研究mRNA可以探究基因表达以及调控的规律:同时也可以用于发现基因结构的变化,比如可变剪切,融合基因等事件,本文整理了mR ...

  5. gff文件_GTF与GFF文件所有操作尽在这里

    一.格式介绍 (一)gtf文件.GTF 为General Transfer Format缩写,跟 GFF2格式类似.相信大家做转录组分析时候经常会看到Cufflinks或者Stringtie软件对转录 ...

  6. python基因差异分析_玉米RNA-seq测序数据差异基因分析

    原标题:玉米RNA-seq测序数据差异基因分析 huanying今天给大家分享一个非常棒的玉米转录组的流程分析.原文作者是cxge,首发于omicshare论坛,阅读原文可跳转至本文的帖子哦~ 软件及 ...

  7. Bulk-RNA-seq流程——从测序数据到count文件(AGSdata)

    2022-2-11 软件安装 conda的安装和配置 wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_6 ...

  8. 有参组装新转录本cufflinks_RNA-Seq流程(cutadapt-tophat2-cufflinks)

    1.cutadapt去接头 #cut NAT sample #-u 20(正值u表示切除R1的前20个碱基) -u -30(负值u表示切除R1的前20个碱基)/ #-U 20(正值U表示切除R2的前2 ...

  9. sailfish:不需要比对的转录本定量软件

    欢迎关注"生信修炼手册"! 传统的转录组定量分析都是基于比对的结果去定量,根据比对上基因/转录本的reads的数目来确定其表达量,是能够想到的最直接的定量方式.基于这样的策略,有很 ...

最新文章

  1. eclipse部分快捷操作
  2. Java集合 LinkedList的原理及使用
  3. AUTOSAR从入门到精通番外篇(三)-嵌入式中设计模式的艺术
  4. LeetCode(590)——N叉树的后序遍历(JavaScript)
  5. 【Oracle】手工建库时启动到nomount状态时错误ORA-09925,ORA-01017
  6. 【WC2008】【BZOJ1271】秦腾与教学评估(二分,前缀和,奇偶性乱搞)
  7. java与C++变量类型对应表
  8. 五:理解控件的运行机制(例:基于Control命名空间的简单控件)
  9. 《Http Client 官方文档》7. 高级主题
  10. thinkphp下nginx重写index.php
  11. PS学习笔记(一):基础知识
  12. U盘拷贝时提示文件过大
  13. android 华为 imei,华为手机EMUI系统查看S/N IMEI/MEID 产品识别码的方法
  14. 自制Beamer主题
  15. 项目文档的流程图,ER图,用例图
  16. ORACLE数据库日期更新到时分秒格式
  17. 配置hadoop时,Linux主机名称不要带有下划线
  18. Node.js知识点整理之----Buffer类
  19. 用Python制作翻译工具
  20. CP-net第三部分解读

热门文章

  1. python调用js库中的函数_Python 调用JS文件中的函数
  2. Java算法(两数之和)
  3. 23Command(命令)模式
  4. C#BindingSource用法、属性、事件
  5. 使用多个MQTT调试工具mqtt.fx连接同个服务器地址报错,只能连接一个,修改Client ID即可
  6. 卫星任务规划 单站多星
  7. 据我所知,这是第一个完整实现运动分割、动态目标追踪等的「开源」动态SLAM系统!...
  8. 面向动态环境基于点的语义SLAM系统
  9. 如何运行react创项目
  10. java 连接 pgsql