• 折叠转录本

    • 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余)
    • PacBio分析软件:

      • TAMA:https://github.com/GenomeRIK/tama

        • TAMA简介

          • TAMA(T ranscriptome A nnotation by M odular A lgorithms 是一款设计用于处理 Iso Seq 数据和其他长 reads 转录本数据,该软件 2019 年 在预印本在线期刊( bioRxiv )发表 。
            Illuminating the dark side of the human transcriptome with TAMA Iso Seq analysis:https://www.biorxiv.org/content/10.1101/780015v1
          • 三个主要应用:

            • 1 TAMA Collapse (折叠冗余转录本
            • 2 TAMA Merge
            • 3 TAMA GO
        • 下载:

          • git clone https://github.com/GenomeRIK/tama
        • 安装:直接使用,无需编译
        • 依赖环境:Python2、Biopython
        • 使用命令:

          • python /path-to-tama/tama_collapse.py -b BAM -s flnc.fasta.sorted.bam -f hg38.fa -x no_cap -e longest_ends -p isoform > tama.collapse.log
          • 参数说明
        • 结果展示

          • 文件
          • 正链基因,右边相同,左边折叠;负链基因,左边相同,右边折叠
      • cDNA_Cupcake:https://github.com/Magdoll/cDNA_Cupcake

        • 简介:

          • cDNA_Cupcake是用于分析测序数据的 Python 和 R 脚本的集合,主要用于 cDNA
          • 典型应用:

            • 1 折叠转录本;
            • 2 合并多样本结果
            • 3 饱和度曲线
            • 4 鉴定融合基因
        • 下载:

          • git clone https://github.com/Magdoll/cDNA_Cupcake.git
        • 安装:

          • cd cDNA_Cupcake
          • git checkout origin/Py2_v8.7.x
          • python setup.py build
          • python setup.py install
        • 使用命令:

          • python /path to cDNA_Cupcake/cupcake/tofu/collapse_isoforms_by_sam.py
          • --input flnc.fasta s flnc.fasta.sorted.sam
          • --min coverage 0.99 min identity 0.95
          • --max_5_diff 1000 max_3_diff 100
          • -o prefix
          • 参数说明:

        • 结果展示:

          • 结果文件
  • 基因/转录本鉴定
    • SQANTI3:https://github.com/ConesaLab/SQANTI3
      Corrigendum: SQANTI: extensive characterization of long read transcript sequences for quality control in full length transcriptome identification and quantification:https://genome.cshlp.org/content/28/7/1096

      • 简介:

        • SQANTI3是SQANTI 工具(发布)的最新版本,该工具合并 SQANT 1 和 SQANTI2 中的功能并添加新的功能 ,用于全长转录本的深度表征 。
        • 主要应用:

          • 1 sqanti3_qc.py (执行转录本的深度表征
          • 2 sqanti3_RulesFilter.py (基于机器学习算法过滤假阳性转录本
      • 下载:

        • git clone https://github.com/ConesaLab/SQANTI3.git
      • 安装:

        • 1 export PATH=$HOME/anacondaPy37/bin:$PATH
        • 2 conda update conda
        • 3 cd SQANTI3
        • 4 conda env create f SQANTI3.conda_env.yml
        • 5 wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/gtfToGenePred P
      • 使用命令:

        • ## step1: qc

          • export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
          • source activate SQANTI3.env
          • python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_qc.py
          • test_chr13_seqs.fasta Homo_sapiens.GRCh38.86.chr13.gtf Homo_sapiens.GRCh38.dna.chromosome.13.fa
          • --fl_count chr13_FL.abundances.txt -o Sample
          • 参数说明

        • ## step2: filter

          • export PATH=/local_data1/rna_training/liwei/software/anaconda3/bin:$PATH
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/sequence/
          • export PYTHONPATH=$PYTHONPATH:/local_data1/rna_training/liwei/software/cDNA_Cupcake-9.1.1/
          • source activate SQANTI3.env
          • python /local_data1/rna_training/liwei/software/SQANTI3/sqanti3_RulesFilter.py
          • Sample_classification.txt Sample_corrected.faa Sample_corrected.gtf
          • 参数说明
      • 结果展示:

        • 结果文件
          https://github.com/ConesaLab/SQANTI3
    • TAPIS:https://bitbucket.org/comp_bio/tapis/src/master/(没有更新,存在bug不推荐)
  • 实操分析
    • SQANTI3测试数据(example文件夹)

      • 文件
    • 补充:SQANTI3 sqanti3_qc.py )分析的第一个输入文件来源于 collapse 之后的结果( gmap.collapsed.rep.fa

2020.12.03丨全长转录组之基因和转录本鉴定相关推荐

  1. 全长转录组之基因和转录本鉴定

    折叠转录本 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余) PacBio分析软件: TAMA:https://github.com/GenomeRIK/tama TAMA简介 ...

  2. 2020.8.26丨全长转录组测序产品概述

    知识点梳理 全长转录组 测序发展史 测序原理 Sanger测序:毛细管电泳测序 illumina测序:制备文库.桥式PCR.可逆终止边合成边测序 SMRT测序:边合成边测序 二代拼接与组装 二代测序: ...

  3. 2020.10.08丨全长转录组之参考基因组比对

    比对软件介绍 目的:定位Iso-Seq分析得到的全长转录本在基因组中的位置,从而得到转录本结构和可变剪切等信息. 推荐比对软件:GMAP,minimap2,deSALT 参考网址:https://gi ...

  4. 2020.12.10丨cufflinks 简介及使用说明

    一. 简介 Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序.主要用于基因表达量的计算和差异表达基因的寻找. Cufflin ...

  5. TensorFlow GAN项目程序回顾2020.12.03

    1.前言 GAN项目被我搁置一旁很久了,最近想回顾一下写过的程序,看看能不能发现一些错误或是从中得到一些新的灵感和启发. 2.程序回顾 废话不多说,直接上代码,我只挑一些比较重要的进行分析. Tens ...

  6. Leetcode 2020/12/03打卡 204计算质数(简单)

    204. 计数质数 == 万一我侵犯了您的权利,联系我,我必删 统计所有小于非负整数 n 的质数的数量. 示例 1: 输入:n = 10 输出:4 解释:小于 10 的质数一共有 4 个, 它们是 2 ...

  7. 【2020.12.03提高组模拟】袋鼠

    题目 题目描述 你知道吗?乌拉圭的人口有345.7万,同时,仅澳大利亚就有4700万只袋鼠. 袋鼠决定入侵乌拉圭.袋鼠们将在平原上布阵,平原被划分成 n×mn \times mn×m 的网格. 每个格 ...

  8. 掌握三代全长转录组测序,看这一篇就够了!

    "三代转录组"是什么?对于混迹在科研领域的一员,如果现在还不了解全长转录组测序,恐怕都不好意思说自己了解高通量测序了呢! 今天小编总结了一些三代全长转录组测序的相关问题,给大家来一 ...

  9. 2020.8.28丨转录组、全转录组产品概述和应用方向

    知识点梳理 转录调控是基因表达调控的一种重要方式 转录水平调控 翻译水平调控 翻译后水平调控 转录调控测序研究热点 RNA分类 转录组研究 概念 转录组(transcriptome): 特定组织或细胞 ...

最新文章

  1. 机器学习拓展知识(数学/统计/算法)
  2. 工具用途_机械加工中研磨加工刀具(砂轮)﹑治工具及其用途
  3. ThinkPHP 学习笔记 ( 一 ) 项目部署:应用部署方式与模块分组部署方式
  4. window linux IPC ftok BY_HANDLE_FILE_INFORMATION
  5. 信息学奥赛C++语言: 素数回文数的个数
  6. DotNet Core 2.0部署后外网IP访问
  7. 嵌入式Linux系统编程学习之二十六多线程概述
  8. 什么是软件测试资产,观点:当前是国内推广软件资产管理的最佳时期
  9. mysql 事务回滚_简短截说阐述redis中事务的使用
  10. onmouseover+onmouseout :表格隔行变色
  11. Vue前端路由~满满的干货
  12. python enumerate的详解
  13. 手把手教你逆向分析 Android 程序
  14. ObReferenceObjectByName vs IoGetDeviceObjectPointer
  15. 数据结构学习-Java实现复数类
  16. Eclipse安装教程
  17. linux 内核配置详解
  18. 对话机器学习大神Yoshua Bengio(下)
  19. Mixed supervision for surface-defect detection: from weakly to fully supervised learning:表面缺陷检测的混合监督
  20. 创建个人网页,创建个人网址。

热门文章

  1. ModuleNotFoundError: No module named ‘maad‘
  2. java同步异步区别_同步请求和异步请求的区别
  3. 一行代码教你撩妹手到擒来~html+css+js烟花告白3D相册(含音乐+可自定义文字)
  4. java生成验证码的三种方法
  5. 一个java的小型WEB项目一个页面(IDEA + 前后端代码)--一些基本配置 分为三篇(第1篇)
  6. 信号处理中简单实用的方法——寻找信号中的峰值和谷值
  7. Linux养成计划(一)
  8. 女性服装数据分析(电商数据)版本1
  9. 架构的本质是管理复杂性,微服务本身也是架构演化的结果
  10. Win10 Edge浏览器 应用商店 IE浏览器 无法访问页面 0x8000FFFF 问题解决