linux可变剪切分析,生信实操|一个生信素人的上道经验分享-转录组测序(可变剪接篇)...
原标题:生信实操|一个生信素人的上道经验分享-转录组测序(可变剪接篇)
转录组测序技术(RNA-seq)作为目前二代测序领域最普遍的技术手段,自从转录组测序问世以来,已经开发了数百种分析工具。根据转录组分析内容可大致将其分析流程分为比对,转录本组装,差异表达分析和差异基因注释。目前,分析的每一步都有很多软件,其软件的性能和分析效率不尽相同。
对于转录组分析的第六步——绘图,主要介绍转录组分析中常见的图形绘制。下面小编来介绍转录组分析的第七步——可变剪接吧~可变剪接是指mRNA前体会通过不同的剪接方式产生不同的转录本,而不同的转录本会生成不同蛋白质进而影响生物学功能。可变剪接主要分为五种类型,分别为:外显子跳跃、5‘端可变剪接,3’端可变剪接,外显子互斥和内含子滞留。
目前分析可变剪接的软件有Asprofile,MISO,leafcutter和SpliceGrapher等。本文主要介绍SpliceGrapher的使用方法。
一、 软件介绍
SpliceGrapher是一个python包,主要使用RNA-seq数据创建剪接图。SpliceGrapher以基因模型和RNA-seq数据比对结果作为输入,预测的剪接图作为输出。SpliceGrapher可以在Linux和Mac OSX下的命令行上运行(http://splicegrapher.sourceforge.net/)。
二、 软件安装
下载:
使用下方链接下载SpliceGrapher。
https://sourceforge.net/projects/splicegrapher/
解压:
安装:
安装成功:
三、 软件使用
SpliceGrapher的使用主要分为四步:
1. 创建剪接位点的模型文件
主要通过以下步骤创建剪接位点的分类器,分别为:为剪接位点生成训练集,为每个剪接位点的分类器选择最佳参数,创建结果文件,用于鉴定剪接位点。
生成模型文件为classifiers.zip。
2. 过滤比对结果文件
本步主要使用步骤一生成的模型文件和比对文件,格式为SAM文件。若待分析物种为常见物种,则可在SpliceGrapher软件classifiers文件中自带的模型文件。使用sam_filter.py过滤比对结果。
3. 预测可变剪接
本步骤是SpliceGrapher的预测模块。本步使用步骤二生成的过滤后的SAM文件和cfg文件。
本步骤可预测指定基因的可变剪接也可预测整个基因组的可变剪接,具体操作如下:
预测单基因可变剪接时,生成的结果文件为*.gff。生成文件内容如下:
预测整个基因组可变剪接时,生成指定前缀的文件夹,文件夹内包含多个子文件夹,以染色体编号命名,每个子文件夹内包含该染色体中发生可变剪接的各个基因的gff文件。其文件夹格式如下:
|--predicted
|---chr*
|-----*.gff
4. 对可变剪接绘图
本步骤是SpliceGrapher的绘图模块,主要用于可视化可变剪接情况。本步使用步骤三生成的gff文件。
生成结果图片如下:
经验总结
SpliceGrapher软件是由多个python脚本组成的,所需python版本为2.5以上,建议小伙伴使用SpliceGrapher软件的脚本时使用python2进行调用。在运行步骤一构建分类模型时,需要安装PyML模块,具体安装方法可参考http://pyml.sourceforge.net/tutorial.html。在运行步骤二时,输入文件为SAM格式,如需使用BAM文件,可使用samtools软件将BAM文件转为SAM文件即可。除了本文介绍的功能外,SpliceGrapher还有很多其他功能,具体使用方法可参考http://splicegrapher.sourceforge.net/userguide.html。至此,转录本分析的第七步——可变剪接预测的操作过程就介绍完了,希望对大家有所帮助。请小伙伴们期待下一期 生信素人的上道经验分享吧~
注:此推文未经许可禁止转载!返回搜狐,查看更多
责任编辑:
linux可变剪切分析,生信实操|一个生信素人的上道经验分享-转录组测序(可变剪接篇)...相关推荐
- r语言 转录本结构及丰度_生信实操|一个生信素人的上道经验分享转录组测序(绘图篇)...
转录组测序技术(RNA-seq)作为目前二代测序领域最普遍的技术手段,自从转录组测序问世以来,已经开发了数百种分析工具.根据转录组分析内容可大致将其分析流程分为比对,转录本组装,差异表达分析和差异基因 ...
- linux可变剪切分析,可变剪切的意义和重要性
欢迎关注"生信修炼手册"! 可变剪切differential splicing,也叫做选择性剪切alternative splicing, 指的是在mRNA前体到成熟mRNA的过程 ...
- linux可变剪切分析,SUPPA2进行可变剪切定量
SUPPA2是一款通过转录本定量来获取可变剪切定量结果的软件.转录本的定量方式有很多,例如count,FPKM, TPM等,作者建议使用TPM,因为先均一化了基因的长度,然后均一化了测序的深度.同时建 ...
- linux可变剪切分析,SUPPA 可变剪切分析
SUPPA是一款通过转录本定量来获取可变剪切定量结果的软件.转录本的定量方式有很多,例如count,FPKM, TPM等,作者建议使用TPM,因为先均一化了基因的长度,然后均一化了测序的深度.同时建议 ...
- 使用leafcutter 做可变剪切分析流程
本博客的主要目的是把本次使用Leafcutter做可变剪切的分析流程记录一下,以方便后续分析或者分享给别人. Leafcutter的文章发表在了NG上,有感兴趣的可以看原文. #批量改文件的名字 #A ...
- 去年一个百万级的小软件项目经验分享,20来个功能模块,项目不太好做有些棘手
别人总觉得是在显吧,干脆把这个项目认为是小项目了,不知道把这个项目是小了,别人会不会又觉得又显吧了?说大也不行.说小也不行,也的确没招了. 我想主要把项目里遇到的问题分享给大家一起探讨,也并不是为了什 ...
- 去年一个百万级的小软件项目经验分享,20来个功能模块,项目不太好做有些棘手...
别人总觉得是在显吧,干脆把这个项目认为是小项目了,不知道把这个项目是小了,别人会不会又觉得又显吧了?说大也不行.说小也不行,也的确没招了. 我想主要把项目里遇到的问题分享给大家一起探讨,也并不是为了什 ...
- 网易互联网产品运营管培生面试经历--从群面到终面面试经验分享
一.网申.在线测评 网易刚刚开始2016校招的时候我就去网申了,快9月中旬的时候改了一次志愿顺序.10月8日收到了网易的短信通知,说通过了简历筛选环节,邀请我参加在线测评. 在线测评 ...
- 一个程序员转产品经理的经验分享
本文非原创,故事的主人公不是我,是来自一位知友Robert Struggle的高赞分享. 一个乐观派的程序员转了产品经理,并把自己的经历分享给同样有想法,想转岗的程序员们. 一个程序员转岗到产品经理, ...
- 互联网寒冬:一个月经历的所有面试题经验分享-------如何提高页面性能?
前言 uu们,大家好,我是你们的前端小伙伴栗子,2年web前端开发经验.base成都.最近经过一系列的紧密结合的面试,成功的拿到了自己比较向往的offer.同时在面试的时候,也不断的总结了我在面试 ...
最新文章
- 微软发布代码智能新基准数据集CodeXGLUE,多角度衡量模型优劣
- 2021年图灵奖,花落高性能计算先驱、田纳西大学教授Jack Dongarra
- 文巾解题 342. 4的幂
- SpringBoot webmvc项目导出war包并在外部tomcat运行产生的诸多问题以及解决方案
- java jxl创建多个sheet,使用jxl导出excel时怎么创建多个sheet | 学步园
- github上面图片不显示
- Codeforces Round #632 (Div. 2) F. Kate and imperfection 数论 + 贪心
- 2020 China Collegiate Programming Contest Qinhuangdao Site 补题部分
- 外设驱动库开发笔记1:AD56xx系列DAC驱动
- “超人”助阵,IE静音很简单
- 图像处理-形态学运算
- 【生信进阶练习1000days】day11day12-GEO data mining
- 3.什么叫计算机网络的体系结构,什么是计算机网络体系结构?
- 机器学习笔记 - 什么是支持向量回归(SVR)?
- 什么是php递归算法_PHP递归算法实例解析
- java导出可运行文件格式,|java导出excel,excel打不开,报文件格式无效,怎么解决!...
- 《当幸福来敲门》观后感
- python 三次根号_开3次方根(多次方根)的代码:二分法,python
- MySQL查询与数据库设计 #万能公式 #思维导图 #MySQL查询 #数据库设计规范 #第二部分
- Docker 的数据管理(Dockerfile的概述和构建)