• 比对软件介绍

    • 目的:定位Iso-Seq分析得到的全长转录本在基因组中的位置,从而得到转录本结构和可变剪切等信息。
    • 推荐比对软件:GMAP,minimap2,deSALT
      参考网址:https://github.com/Magdoll/cDNA_Cupcake/wiki/Best-practice-for-aligning-Iso-Seq-toreference-genome:-minimap2,-deSALT,-GMAP,-STAR,-BLAT

      • GMAP

        • GMAP(a Genomic Mapping and Alignment Program),是一款针对mRNA和EST序列的基因组定位和比对程序。该软件2005年在Bioinformatics 杂志正式发表,一直持续更新升级,目前最新版是Version 2020-06-30。PacBio测序技术出现后,GMAP常用于Iso-Seq全长转录本的比对,在该应用中引用量最高。
        • 2005年发表文献:GMAP: a genomic mapping and alignment program for mRNA and EST sequences.https://academic.oup.com/bioinformatics/article/21/9/1859/409207
        • 2016年发表文献:GMAP and GSNAP for Genomic Sequence Alignment: Enhancements to Speed, Accuracy, and Functionality.https://link.springer.com/protocol/10.1007%2F978-1-4939-3578-9_15
        • 下载:wget http://research-pub.gene.com/gmap/src/gmap-gsnap-2020-06-30.tar.gz
        • 安装:tar -zxvf gmap-gsnap-2020-06-30.tar.gzcd gmap-2020-06-30./configure --prefix=$PWDmake && make install
        • 测试:(显示帮助信息)./gmap-2020-06-30/bin/gmap
        • 使用:

          • 创建索引

            • gmap_build -D path -d dbname -k kmer EndFragment
            • 参数说明:-D 创建索引的存放路径(默认存放在安装路径下的share文件夹);-d 创建索引的名字;-k 创建索引的kmer值,默认值为15。
          • 序列比对

            • gmap -D ./gmapdb -d hg38 -n 0 -t 8 -z sense_force -f samse flnc.fasta >flnc.fasta.sam 2> flnc.fasta.sam.log
            • 参数说明:-D 创建索引的存放路径(默认存放在安装路径下的share文件夹);-d 创建索引的名字;-n 设置0,表示同时输出linear alignment和chimeric alignment;-t 线程数;-z 设置cDNA方向;-f 指定输出文件的格式;samse = SAM format (without setting paired_read bit)
      • Minimap2

        • Minimap2是李恒18年用C语言开发的一种通用序列比对程序,可将DNA或mRNA序列与大型参考数据库进行比对。典型的应用包括:1)PacBio或ONT基因组reads比对;2)发现长reads之间的重叠;3)针对PacBio Iso-Seq或Nanopore cDNA的剪切比对;4)用于二代单端和双端数据比对。该软件2018年在Bioinformatics 杂志正式发表。(2019年IF=5.6)
          参考文献网址:https://academic.oup.com/bioinformatics/article/34/18/3094/4994778
        • 下载:wget https://github.com/lh3/minimap2/releases/download/v2.17/minimap2-2.17_x64-linux.tar.bz2安装:tar -jxvf minimap2-2.17_x64-linux.tar.bz2(注:解压后得到预编译二进制文件,可直接使用,无需安装)测试:(显示帮助信息)./minimap2-2.17_x64-linux/minimap2
        • 使用

          • step1:创建索引(可选)minimap2 -d hg38.mmi hg38.fa##
          • step2:序列比对minimap2 -t 10 -ax splice -uf --MD --secondary=no -C5 -O6,24 -B4 hg38.mmi flnc.fasta >flnc.fasta.sam 2> flnc.fasta.sam.log

            • 参数说明:-t 线程数;-ax 不同的数据类型指定不同的模式;Iso-Seq数据选择splice;-uf 对于Iso-Seq数据,只考虑转录链;--MD 输出MD标签;--secondary=no 输出最好的比对结果;-C5 识别非典型的GT-AG剪切位点,灵敏度更高;-O6,24 -B4 可以找到更多外显子;输出格式可支持sam和paf格式。
      • deSALT

        • deSALT(de Bruijn graph-based Spliced Aligner for Long Transcriptome reads) ,是哈尔滨工业大学王亚东团队开发的一款专门针对于转录组长reads的剪切比对软件。原理:采用两遍比对方法,构造基于德布莱英图(De Bruijn graph)的比对骨架以推断外显子,并使用它们来生成剪接的参考序列以产生精确的比对,更好的解决小外显子、测序错误等技术问题。该软件2019年在Genome Biology 杂志正式发表。(2019年IF=12.1)
          参考文献网址:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1895-9
        • 下载:wget https://github.com/ydLiu-HIT/deSALT/archive/v1.5.5.tar.gz
        • 安装:tar -zxvf v1.5.5.tar.gzcd deSALT-1.5.5/src/deBGA-master/makecd ..make
        • 测试:(显示帮助信息)./deSALT
        • 使用:

          • step1:创建索引deSALT index hg38.fa hg38.deSALT.index
          • step2:序列比对deSALT aln hg38.deSALT.index flnc.fasta -t 12 -x ccs -O6,24 -M4 -T -o flnc.fasta.sam

            • 参数说明:-t 线程数;-x 指定reads类型,ccs\clr\ont1d\ont2d;-O6,24 -M4 对于CCS序列,可以使用此参数,减少错配和gap,提升准确度;-T 根据转录链发现剪切位点(针对Iso-Seq和Direct RNA-seq数据)。
  • 比对软件比较
    • gmap、minimap2比较

      • 比较来源于2018年minimap2发表的文章,文章认为GMAP资源消耗较大,对noisy reads比对效果不佳
    • gmap、minimap2、deSALT三者比较

      • 比较来源于2019年deSALT发表的文章,文章认为deSALT的比对率更高、可以更好的解决小外显子精确比对问题
      • 三者比较参考文献

        • 网址:https://github.com/Magdoll/cDNA_Cupcake/wiki/Best-practice-for-aligning-Iso-Seq-toreference-genome:-minimap2,-deSALT,-GMAP,-STAR,-BLAT

2020.10.08丨全长转录组之参考基因组比对相关推荐

  1. 2020.8.26丨全长转录组测序产品概述

    知识点梳理 全长转录组 测序发展史 测序原理 Sanger测序:毛细管电泳测序 illumina测序:制备文库.桥式PCR.可逆终止边合成边测序 SMRT测序:边合成边测序 二代拼接与组装 二代测序: ...

  2. 2020.12.03丨全长转录组之基因和转录本鉴定

    折叠转录本 分析目的:基于基因组比对结果,将相似的多转录本折叠成单个转录本(去冗余) PacBio分析软件: TAMA:https://github.com/GenomeRIK/tama TAMA简介 ...

  3. 2020.9.9丨微生物多样性、宏基因组测序原理

    微生物多样性测序原理及案例解析 研究对象 人类:口腔.皮肤.粪便.肠道... 动物:瘤胃.肠道- 植物:菌根.内生菌... 历代测序原理 一代测序 双脱氧链终止法 正常的DNA碱基是四种脱氧核糖核苷酸 ...

  4. 2020.8.28丨转录组、全转录组产品概述和应用方向

    知识点梳理 转录调控是基因表达调控的一种重要方式 转录水平调控 翻译水平调控 翻译后水平调控 转录调控测序研究热点 RNA分类 转录组研究 概念 转录组(transcriptome): 特定组织或细胞 ...

  5. 2020.10.21【转载】丨GWAS全基因组关联分析流程

    感谢CSDN用户 追梦生信人 梳理了GWAS全基因组关联分析的整个流程,并提供了基本的命令,用到的软件包括BWA.samtools.gatk.Plink.Admixture.Tassel等,在此分享出 ...

  6. 微生物组-宏基因组分析第9期(报名直播课免费参加线下2020.10本年最后一期)

    福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析.宏基因组.Python课程和转录组的线上直播课.报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 ...

  7. 宏基因组分析第9期(报名直播课免费参加线下2020.10本年最后一期)

    福利公告:为了响应学员的学习需求,经过易生信培训团队的讨论筹备,现决定安排扩增子16S分析.宏基因组.Python课程和转录组的线上直播课.报名参加线上直播课的老师可在1年内选择参加同课程的一次线下课 ...

  8. 使用二代矫正三代全长转录组数据

    使用二代矫正三代全长转录组数据 (2017-11-02 10:09:45) 转载▼   分类: 三代 1:纠正的工具有很多,我看到的文献分别有proovread与LoRDEC 2:在文献中A surv ...

  9. RNA-seq最新利器——全长转录组测序

    RNA-seq最新利器--全长转录组测序 1.三代测序技术PacBio SMRT Sequencing 2005年以来,转录组测序和研究的主流是基于NGS,即所谓的二代测序技术,虽然二代测序技术极大地 ...

最新文章

  1. KDD2020接受论文列表已公开!338篇优秀论文汇总!
  2. 正则表达式懒惰贪婪和replace函数
  3. apache配置支持mysql_Apache Kylin | 建立 JDBC 数据源
  4. python基础教程学习笔记十二
  5. PAT(乙级)1014
  6. java中判断一个字符在字符串中出现的次数
  7. Java FlameGraph 火焰图
  8. mysql日志监控 zabbix_zabbix监控mysql哪些性能
  9. (转)深入理解Javascript闭包(closure)
  10. mysql数据库优化课程---12、mysql嵌套和链接查询(查询user表中存在的所有班级的信息?)...
  11. win7系统不能加入工作组计算机,技术员教你解决win7系统工作组计算机无法访问的修复办法...
  12. redhat linux 设置ip,REDHAT LINUX企业版更改IP地址,网关,DNS和MAC地址----字符界面
  13. 批量检查pdb数据库某些蛋白质的pdb文件是否存在
  14. winform 打印快递电子面单_c#对接电子面单打印平台
  15. 世界十大工业自动化公司排名
  16. multiprocessing.pool详解
  17. 转SISD、MIMD、SIMD、MISD计算机的体系结构的Flynn分类法
  18. 计算机通讯技术的专业有哪些,通信类包括哪些专业
  19. perl对日志进行压缩备份小程序
  20. Win32:一个全新的、被忽视的桌面互联网内容平台

热门文章

  1. 综合案例之学成在线首页
  2. (一)软件开发背景 - 天津市政府采购中心网
  3. 简智音科技:抖音与快手相比,谁的前景更好?
  4. 2020年计算机网络王道_2020年8种最大的网络安全威胁
  5. 云虎拜年,好运连连!虎年限定三件套来啦
  6. LeetCode-86
  7. 解决echarts在平移和缩放中国地图后,下钻到下一级具体省份地图时生成的地图不在容器中间,会跑到容器外面去。
  8. 写了个自动批改小孩作业的代码
  9. WSL登录失败:未授权用户再次计算机上的请求登录类型
  10. ⚡️狂神Linux学习笔记