原标题:生信实操|一个生信素人的上道经验分享-转录组测序(可变剪接篇)

转录组测序技术(RNA-seq)作为目前二代测序领域最普遍的技术手段,自从转录组测序问世以来,已经开发了数百种分析工具。根据转录组分析内容可大致将其分析流程分为比对,转录本组装,差异表达分析和差异基因注释。目前,分析的每一步都有很多软件,其软件的性能和分析效率不尽相同。

对于转录组分析的第六步——绘图,主要介绍转录组分析中常见的图形绘制。下面小编来介绍转录组分析的第七步——可变剪接吧~可变剪接是指mRNA前体会通过不同的剪接方式产生不同的转录本,而不同的转录本会生成不同蛋白质进而影响生物学功能。可变剪接主要分为五种类型,分别为:外显子跳跃、5‘端可变剪接,3’端可变剪接,外显子互斥和内含子滞留。

目前分析可变剪接的软件有Asprofile,MISO,leafcutter和SpliceGrapher等。本文主要介绍SpliceGrapher的使用方法。

一、 软件介绍

SpliceGrapher是一个python包,主要使用RNA-seq数据创建剪接图。SpliceGrapher以基因模型和RNA-seq数据比对结果作为输入,预测的剪接图作为输出。SpliceGrapher可以在Linux和Mac OSX下的命令行上运行(http://splicegrapher.sourceforge.net/)。

二、 软件安装

下载:

使用下方链接下载SpliceGrapher。

https://sourceforge.net/projects/splicegrapher/

解压:

安装:

安装成功:

三、 软件使用

SpliceGrapher的使用主要分为四步:

1. 创建剪接位点的模型文件

主要通过以下步骤创建剪接位点的分类器,分别为:为剪接位点生成训练集,为每个剪接位点的分类器选择最佳参数,创建结果文件,用于鉴定剪接位点。

生成模型文件为classifiers.zip。

2. 过滤比对结果文件

本步主要使用步骤一生成的模型文件和比对文件,格式为SAM文件。若待分析物种为常见物种,则可在SpliceGrapher软件classifiers文件中自带的模型文件。使用sam_filter.py过滤比对结果。

3. 预测可变剪接

本步骤是SpliceGrapher的预测模块。本步使用步骤二生成的过滤后的SAM文件和cfg文件。

本步骤可预测指定基因的可变剪接也可预测整个基因组的可变剪接,具体操作如下:

预测单基因可变剪接时,生成的结果文件为*.gff。生成文件内容如下:

预测整个基因组可变剪接时,生成指定前缀的文件夹,文件夹内包含多个子文件夹,以染色体编号命名,每个子文件夹内包含该染色体中发生可变剪接的各个基因的gff文件。其文件夹格式如下:

|--predicted

|---chr*

|-----*.gff

4. 对可变剪接绘图

本步骤是SpliceGrapher的绘图模块,主要用于可视化可变剪接情况。本步使用步骤三生成的gff文件。

生成结果图片如下:

经验总结

SpliceGrapher软件是由多个python脚本组成的,所需python版本为2.5以上,建议小伙伴使用SpliceGrapher软件的脚本时使用python2进行调用。在运行步骤一构建分类模型时,需要安装PyML模块,具体安装方法可参考http://pyml.sourceforge.net/tutorial.html。在运行步骤二时,输入文件为SAM格式,如需使用BAM文件,可使用samtools软件将BAM文件转为SAM文件即可。除了本文介绍的功能外,SpliceGrapher还有很多其他功能,具体使用方法可参考http://splicegrapher.sourceforge.net/userguide.html。至此,转录本分析的第七步——可变剪接预测的操作过程就介绍完了,希望对大家有所帮助。请小伙伴们期待下一期 生信素人的上道经验分享吧~

注:此推文未经许可禁止转载!返回搜狐,查看更多

责任编辑:

linux可变剪切分析,生信实操|一个生信素人的上道经验分享-转录组测序(可变剪接篇)...相关推荐

  1. r语言 转录本结构及丰度_生信实操|一个生信素人的上道经验分享转录组测序(绘图篇)...

    转录组测序技术(RNA-seq)作为目前二代测序领域最普遍的技术手段,自从转录组测序问世以来,已经开发了数百种分析工具.根据转录组分析内容可大致将其分析流程分为比对,转录本组装,差异表达分析和差异基因 ...

  2. linux可变剪切分析,可变剪切的意义和重要性

    欢迎关注"生信修炼手册"! 可变剪切differential splicing,也叫做选择性剪切alternative splicing, 指的是在mRNA前体到成熟mRNA的过程 ...

  3. linux可变剪切分析,SUPPA2进行可变剪切定量

    SUPPA2是一款通过转录本定量来获取可变剪切定量结果的软件.转录本的定量方式有很多,例如count,FPKM, TPM等,作者建议使用TPM,因为先均一化了基因的长度,然后均一化了测序的深度.同时建 ...

  4. linux可变剪切分析,SUPPA 可变剪切分析

    SUPPA是一款通过转录本定量来获取可变剪切定量结果的软件.转录本的定量方式有很多,例如count,FPKM, TPM等,作者建议使用TPM,因为先均一化了基因的长度,然后均一化了测序的深度.同时建议 ...

  5. 使用leafcutter 做可变剪切分析流程

    本博客的主要目的是把本次使用Leafcutter做可变剪切的分析流程记录一下,以方便后续分析或者分享给别人. Leafcutter的文章发表在了NG上,有感兴趣的可以看原文. #批量改文件的名字 #A ...

  6. 去年一个百万级的小软件项目经验分享,20来个功能模块,项目不太好做有些棘手

    别人总觉得是在显吧,干脆把这个项目认为是小项目了,不知道把这个项目是小了,别人会不会又觉得又显吧了?说大也不行.说小也不行,也的确没招了. 我想主要把项目里遇到的问题分享给大家一起探讨,也并不是为了什 ...

  7. 去年一个百万级的小软件项目经验分享,20来个功能模块,项目不太好做有些棘手...

    别人总觉得是在显吧,干脆把这个项目认为是小项目了,不知道把这个项目是小了,别人会不会又觉得又显吧了?说大也不行.说小也不行,也的确没招了. 我想主要把项目里遇到的问题分享给大家一起探讨,也并不是为了什 ...

  8. 网易互联网产品运营管培生面试经历--从群面到终面面试经验分享

    一.网申.在线测评        网易刚刚开始2016校招的时候我就去网申了,快9月中旬的时候改了一次志愿顺序.10月8日收到了网易的短信通知,说通过了简历筛选环节,邀请我参加在线测评.   在线测评 ...

  9. 一个程序员转产品经理的经验分享

    本文非原创,故事的主人公不是我,是来自一位知友Robert Struggle的高赞分享. 一个乐观派的程序员转了产品经理,并把自己的经历分享给同样有想法,想转岗的程序员们. 一个程序员转岗到产品经理, ...

  10. 互联网寒冬:一个月经历的所有面试题经验分享-------如何提高页面性能?

    前言   uu们,大家好,我是你们的前端小伙伴栗子,2年web前端开发经验.base成都.最近经过一系列的紧密结合的面试,成功的拿到了自己比较向往的offer.同时在面试的时候,也不断的总结了我在面试 ...

最新文章

  1. 微软发布代码智能新基准数据集CodeXGLUE,多角度衡量模型优劣
  2. 2021年图灵奖,花落高性能计算先驱、田纳西大学教授Jack Dongarra
  3. 文巾解题 342. 4的幂
  4. SpringBoot webmvc项目导出war包并在外部tomcat运行产生的诸多问题以及解决方案
  5. java jxl创建多个sheet,使用jxl导出excel时怎么创建多个sheet | 学步园
  6. github上面图片不显示
  7. Codeforces Round #632 (Div. 2) F. Kate and imperfection 数论 + 贪心
  8. 2020 China Collegiate Programming Contest Qinhuangdao Site 补题部分
  9. 外设驱动库开发笔记1:AD56xx系列DAC驱动
  10. “超人”助阵,IE静音很简单
  11. 图像处理-形态学运算
  12. 【生信进阶练习1000days】day11day12-GEO data mining
  13. 3.什么叫计算机网络的体系结构,什么是计算机网络体系结构?
  14. 机器学习笔记 - 什么是支持向量回归(SVR)?
  15. 什么是php递归算法_PHP递归算法实例解析
  16. java导出可运行文件格式,|java导出excel,excel打不开,报文件格式无效,怎么解决!...
  17. 《当幸福来敲门》观后感
  18. python 三次根号_开3次方根(多次方根)的代码:二分法,python
  19. MySQL查询与数据库设计 #万能公式 #思维导图 #MySQL查询 #数据库设计规范 #第二部分
  20. Docker 的数据管理(Dockerfile的概述和构建)

热门文章

  1. knn代码实现+可视化
  2. 网站站长统计分析CNZZ
  3. 前端JSON格式化显示
  4. 【20保研】山东师范大学信息科学与工程学院2019年 “优秀大学生暑期夏令营”活动公告...
  5. 深思考AI机器人-巧思首登央视  “以一当十”接受宫颈癌病理专家检验
  6. 结构为王——确定分析思路(数据分析方法论)
  7. LeetCode 刷题: Fizz Buzz
  8. 一级域名怎么申请二级域名?
  9. 秦九韶算法(java实现)
  10. 滤波器测试系统|矢量网络分析仪滤波器测试软件NSAT-1000