TransDecoder

TransDecoder识别转录本序列中的候选编码区,例如使用 Trinity 从头 RNA-Seq 转录本组装生成的编码区,或使用 Tophat 和 Cufflinks 基于与基因组的 RNA-Seq 比对构建的编码区。

TransDecoder 基于以下标准识别可能的编码序列:
1.在转录本序列中需要能够找到一个(满足)最小(限定)长度的ORF;
2.对数似然数得分大于0。(与GeneID软件计算得到的得分相类似);
3.第一阅读框的对数似然数打分同其它5个阅读框比较为最大值时;
4.如果候选的ORF完全被包含在其它候选ORF的框架内,那么报告最长的ORF。否则,一个单独的转录本会得到多个ORF的报告。(考虑到有操纵子、嵌合体等情况);
5.作为可选项,预测出的多肽在Pfam domain库中存在比对分值高于得分阈值之上的。
6.该软件主要由Broad Institute的Brian Haas和Commonwealth Scientific and Industrial Research Organisation的Alexie Papanicolaou维护。它被整合在其它相关的软件中:Trinity,PASA,EVidenceModeler和Trinotate。

TransDecoder相关使用方法来啦!!!

一、软件安装

直接从https://github.com/TransDecoder/TransDecoder/releases下载最新版的TransDecoder

二、软件使用

TransDecoder通过运行一个包含目的转录本序列的fasta文件来实现功能。简单的用法如下:

#Step 1: 提取最长的开放阅读框

TransDecoder.LongOrfs -t target_transcripts.fasta
默认情况下,TransDecoder.LongOrfs将识别长度至少为100个氨基酸的开放阅读框。可以通过-m参数来降低这个值,但是要知道随着最小长度的变短,ORF预测的假阳性率迅速增长。

#Step 2: (可选)
可选地,可以通过blast或者pfam搜索已知蛋白的同源序列来识别ORF。

#Step 3: 预测可能的编码区
TransDecoder.Predict -t target_transcripts.fasta [ homology options ]
候选编码区的最终集合可以在文件.transdecoder中找到。扩展名包括.pep,.cds,.gff3和.bed。

从有参考基因组的转录结果GTF文件预测编码区域:
1.需要有参转录组比对后拼接的转录本的GTF文件以及参考基因组序列:

cufflinks_gtf_genome_to_cdna_fasta.pl transcripts.gtf test.genome.fasta > transcripts.fasta

2 将GTF文件转化为GFF3文件:

cufflinks_gtf_to_alignment_gff3.pl transcripts.gtf > transcripts.gff3

3.接着就跟上面的步骤一样了:

TransDecoder.LongOrfs -t transcripts.fasta

4.最后生成一个基于有参基因组的编码区域注释文件:

cdna_alignment_orf_to_genome_orf.pl transcripts.fasta.transdecoder.gff3 transcripts.gff3 transcripts.fasta > transcripts.fasta.transdecoder.genome.gff3

三、输出文件说明
longest_orfs.pep : 所有达到最小长度标准的ORF, 不管是否编码
longest_orfs.gff3 : 在目的转录本中发现的所有ORF的位置
longest_orfs.cds : 所有检测到的ORF的核酸编码序列
longest_orfs.cds.top_500_longest : 前500个最长的ORF,用于训练一个编码序列的马尔科夫模型
hexamer.scores : 每个k-mer的对数似然得分 (coding/random)
longest_orfs.cds.scores : 每个ORF同6个阅读框间对数似然得分的总和
longest_orfs.cds.scores.selected : 根据得分标准所选出的ORF
longest_orfs.cds.best_candidates.gff3 : 转录本中选出的ORF的位置

然后,最后的输出文件在你当前的工作目录中。
transcripts.fasta.transdecoder.pep : 最终候选ORF的蛋白质序列;所有较长ORF中的较短的候选序列已被移除。
transcripts.fasta.transdecoder.cds : 最终候选ORF的编码区的核酸序列。
transcripts.fasta.transdecoder.gff3 : 最终被选中的ORF在目的转录本中的位置
transcripts.fasta.transdecoder.bed : 用来描述ORF位置的bed格式文件,最好用GenomeView或IGV来查看。

END

图图云平台-永久免费绘图工具
https://www.cloudtutu.com/

TransDecoder相关推荐

  1. TransDecoder识别转录本中编码区并预测蛋白

    TransDecoder可以识别转录本序列中的编码区域,如:Trinity从头组装.Tophat和Cufflinks将RNA-Seq比对到基因组转录本结果 TransDecoder 基于以下标准识别可 ...

  2. 转录组分析流程|TransDecoder预测转录本的开放阅读框(二)

    使用TransDecoder预测CDS TransDecoder按照其官网的说明,主要用于识别转录本序列中的潜在的编码区域,也就是预测CDS.转录本可以由RNA-Seq数据通过Trinity组装来的, ...

  3. 使用TransDecoder寻找转录本中的编码区

    TransDecoder能够从转录本序列中鉴定候选编码区.这些转录本序列可以来自于Trinity的从头组装,或者来自于Cufflinks或者StringTie的组装结果. 软件安装 从https:// ...

  4. Trinotate-转录组注释

    http://trinotate.github.io/ 装软件: Trinotate TransDecoder sqlite BLAST+ HMMER 转载于:https://www.cnblogs. ...

  5. Trinity进行转录组组装(2))

    1. Trinity进行转录组组装 Trinity进行转录组组装的典型命令如下: $ /opt/biosoft/trinityrnaseq_r20131110/Trinity.pl --seqType ...

  6. DenseCLIP:Language-Guided Dense Prediction with Context-Aware Prompting

    DenseCLIP:Language-Guided Dense Prediction with Context-Aware Prompting 论文地址:https://arxiv.org/pdf/2 ...

  7. pasa_example

    #陈老师的样例数据 ln -s /opt/00.incipient_data/data_for_genome_assembling/assemblies_of_Malassezia_sympodial ...

  8. Trinity介绍与使用(一)

    Trinity 原文地址:http://www.plob.org/2014/12/22/8826.html 1:分析流程图如下 2: 首先就是将样本的reads合并在一起命令如下: 1 cat 1M_ ...

  9. Trinity使用流程

    原文地址:http://www.plob.org/2014/12/22/8826.html 1:分析流程图如下 2: 首先就是将样本的reads合并在一起命令如下: 1 cat 1M_READS_sa ...

最新文章

  1. asp.net core 创建允许跨域请求的api, cors.
  2. 有源汇上下界最小费用可行流 ---- P4043 [AHOI2014/JSOI2014]支线剧情(模板)
  3. 学嵌入式Linux软件开发需要的知识
  4. js简单手动(自动)切换
  5. 如何备考上海市高等学校计算机一级,如何备考全国计算机一级等级考试
  6. 信息学奥赛一本通(C++)在线评测系统——基础(一)C++语言——1067:整数的个数
  7. lepus监控oracle数据库_一文看懂lepus天兔数据库监控系统如何搭建
  8. 编写字符串反转函数 .
  9. 复数乘法_初学讲义之高中数学十八:复数
  10. 软件测试系统学习流程和常见面试题
  11. QNX Hardware connection
  12. python常用代码总结-python个人总结
  13. 十个JDBC的最佳实践
  14. 英伟达显卡控制面板没有显示设置的三种解决方法
  15. Opening My World——ESRI用户大会有感
  16. Excel·VBA破解密码
  17. 路由交换实验一——CISCO路由器的基本配置
  18. OpenCV 局部自适应对比度增强ACE算法
  19. Altium Designer使用介绍和界面介绍
  20. 安卓开发基础知识-补习9

热门文章

  1. redis灵魂拷问:如何使用stream实现消息队列
  2. Hive MetaStore 在快手遇到的挑战与优化
  3. 干货 | 45张图庖丁解牛18种Queue,你知道几种?
  4. 玩转不同业务场景,这些RabbitMQ特性会是得力助攻
  5. 高并发的场景下,不能不说的限流算法
  6. 详细!快速入门指南!Docker!
  7. 研发管理工具之迭代管理测评:PingCode VS Jira
  8. 7个值得推荐的优质软件,让人忍不住体验!
  9. 生态伙伴 | 身边的法律人都在用的「觅律搜索」入驻飞书啦!
  10. 军工企业敏捷项目管理