SUPPA2 分析可变剪切(附详细代码)
SUPPA2 分析可变剪切
1、下载基因组转录本文件
以人类基因组转录本文件下载为例:
打开网站ensemble:http://asia.ensembl.org/index.html --> 点击 human
点击download dna fasta
点击划红线的部分,并下载到本地,之后上传到服务器中。
也可以在https://www.gencodegenes.org/mouse/ 网站中下载gtf文件和转录本fa文件
2、解压基因组转录本文件
gunzip Homo_sapiens.GRCh38.cds.all.fa.gz
3、转变为format文件
perl -lane 'if(/^>/){$id=(split/\./,$_)[0];print $id}else{print}' Homo_sapiens.GRCh38.cds.all.fa >Homo_sapiens.GRCh38.cds.all.format.fa
4、创建索引
#创建存放索引的文件夹
mkdir Homo_sapiens.GRCh38.cds.index#安装定量软件 salmon
conda install salmon#创建索引
salmon index -t Homo_sapiens.GRCh38.cds.all.format.fa -i Homo_sapiens.GRCh38.cds.index
5、使用salmon进行定量
#对单末端数据进行批量定量 (-r)ls *gz|cut -d"_" -f 1|sort -u |while read id;do(salmon quant -i /data/gs/data/data1/rawdata3/single/filter-adapters/single-porechop/nanofilt/salmon/Homo_sapiens.GRCh38.cds.index -l ISF --gcBias -r ./${id}_trimmed.fq.gz -o quants/${id}_output);done#对双末端数据进行批量定量
ls *gz|cut -d"_" -f 1|sort -u |while read id;do(salmon quant -i /data/gs/data/data1/rawdata3/single/filter-adapters/single-porechop/nanofilt/salmon/Homo_sapiens.GRCh38.cds.index -l ISF --gcBias -1 ${id}_1_val_1.fq.gz -2 ${id}_2_val_2.fq.gz -p 4 -o /data/gs/data/suppa/salmon_output/${id});done#这里定量的fq文件,是通过RNA-SEQ,过滤之后,得到的数据
#salmon也可以直接对sam/bam文件定量,参数为 -a
#salmon也可以直接使用fa文件进行定量,参数为 -t
#salmon使用索引进行定量,参与为 -i
6、提取salmon结果中的TPM值
multipleFieldSelection.py -i SRR*/quant.sf -k 1 -f 4 -o iso_tpm.txt
对tpm文件格式化:
perl -alne '{/(\|.*\|)\t/; ;s/$1//g;s/\|//g;print}' iso_tpm.txt > iso_tpm_formatted.txt
7、下载human的参考基因组注释gtf文件并处理为format格
式:(并解压)
http://ftp.ensembl.org/pub/release-100/gtf/homo_sapiens/
解压:
gunzip Homo_sapiens.GRCh38.100.gtf.gz
8、使用generateEvents命令根据基因组的gtf注释文件生成
所有的可变剪切事件,格式保存为ioe格式(这一步为检测
gtf文件中的可变剪切事件有哪些)
#安装SUPPA
conda install -c bioconda suppa#计算gtf文件中的as事件
suppa.py generateEvents -i Homo_sapiens.GRCh38.100.gtf -o 107190A.events -e SE SS MX RI FL -f ioe
将不同的可变剪切事件合并成一个结果
vim ioe.awk
# 在vim脚本中写入(按i,即可将vim转变为可编辑状态)
awk 'FNR==1 && NR!=1 { while (/^<header>/) getline; } 1 {print} ' *.ioe > ensembl_mm10.events.ioe(输出文件名,可以修改)
:wq 保存退出 vim脚本
chmod 755 ioe.awk
./ioe.awk
9、计算psi值,根据tpm和gtf的ioe文件
需要注意的是使用的转录本ID和gtf的转
录本ID应该是一致,数目不一样可能会有错误提示:
suppa.py psiPerEvent -i Homo_sapiens.GRCh38.100.events.ioe -e iso_tpm.txt -o SRR_events
10、差异可变剪切基因寻找
#1-56 这个数字为对照组的样本数量
#1-47 这个数字为实验组的样本数量
#这个数字根据自己的样本数据量设定
cut -f 1-56 SRR_events.psi > ./control.psi
cut -f 1-47 SRR1_events.psi > ./treat.psicut -f 1-56 iso_tpm_formatted.txt > ./control.tpm
cut -f 1-47 SRR1_tpm_formatted.txt > ./treat.tpmsuppa.py diffSplice -m empirical -gc -i /data/gs/data/data1/reference/gtf/Annotation/suppa/ensembl_mm10.events.ioe --save_tpm_events -p treat.psi control.psi -e treat.tpm control.tpm -o srr2_diffSplice
SUPPA2 分析可变剪切(附详细代码)相关推荐
- python爬取二手房信息_刚刚接触PythonR?教你爬取分析赶集网北京二手房数据(附详细代码)...
原标题:刚刚接触Python&R?教你爬取分析赶集网北京二手房数据(附详细代码) 源 /数据森麟文 /徐涛 前言: 本文主要分为两部分:Python爬取赶集网北京二手房数据&R对爬取的 ...
- c语言二分法_14个经典C语言算法你就不看一眼?(附详细代码)
今天,给大家讲一讲,单片机常用的14个C语言算法(附详细代码)哟! 一.计数.求和.求阶乘等简单算法 此类问题都要使用循环,要注意根据问题确定循环变量的初值.终值或结束条件,更要注意用来表示计数.和. ...
- php实现飘窗,JS实现网站图片飘窗效果,JavaScript悬浮广告(附详细代码)
原标题:JS实现网站图片飘窗效果,JavaScript悬浮广告(附详细代码) JS实现网站图片飘窗效果,Java悬浮广告,郑州SEO提供以下代码,仅供参考: 飘窗效果-丁光辉博客(www.dinggu ...
- 用html实现抽奖大转盘,【项目实战】用CSS实现一个抽奖转盘(附详细代码+思路)...
原标题:[项目实战]用CSS实现一个抽奖转盘(附详细代码+思路) 效果 基本是用CSS实现的,没有用图片,加一丢丢JS. 完全没有考虑兼容性. 首先画一个转盘 < htmllang= " ...
- 玩转树莓派---详解树莓派的系统烧录,基础使用及基于树莓派制作手势控制的小车(附详细代码及演示效果)
目录 一.写在前面 二.系统实现: Author:qyan.li Date:2022.6.10 Topic:详解树莓派的使用及基于树莓派制作手势控制的小车 Reference:如何给树莓派安装操作系统 ...
- Web前端:HTML最强总结 附详细代码
Web前端基础: Web前端:HTML最强总结 附详细代码 Web前端:CSS最强总结 附详细代码 Web前端:JavaScript最强总结 附详细代码 Web前端工具: Web前端: JQuery最 ...
- Opencv+Python学习记录9:掩膜(掩码)的使用(内附详细代码)
一,基本概念 OpenCV中的很多函数都会指定一个掩模,也被称为掩码,例如: 计算结果=cv2.add(参数1,参数2,掩模) 当使用掩模参数时,操作只会在掩模值为非空的像素点上执行,并将其他像素点的 ...
- hfss和python_利用Python与HFSS联合仿真设计一个微带天线(附详细代码)
原标题:利用Python与HFSS联合仿真设计一个微带天线(附详细代码) 我们知道HFSS是一款电磁仿真商用软件,用其进行天线的设计十分方便.而该软件也预留了可以运行脚本的接口,使用者可以使用脚本对软 ...
- Web前端:JavaScript最强总结 附详细代码 (带常用案例!)
Web前端基础: Web前端:HTML最强总结 附详细代码 Web前端:CSS最强总结 附详细代码 Web前端:JavaScript最强总结 附详细代码 Web前端工具: Web前端: JQuery最 ...
- Web前端:Bootstrap最强总结 附详细代码 (带常用案例!)
Web前端基础: Web前端:HTML最强总结 附详细代码 Web前端:CSS最强总结 附详细代码 Web前端:JavaScript最强总结 附详细代码 Web前端工具: Web前端: JQuery最 ...
最新文章
- 如何创建一个基础jQuery插件
- vim 命令大全(写的非常全和好)http://blog.csdn.net/woshixiaosimao/article/details/54312738...
- C语言核心技术——函数
- linux shell获取字符串第1个字符
- 3条原则,16个小点,帮你写出一个优秀的对外接口!
- 汕尾php培训,系统发生错误
- 数据挖掘原理与算法(第二版)
- GB35114 A级过检
- 深度剖析JAVA软件工程师
- 互联网和人工智能之间,主要是什么关系?
- swift3 下标subscript
- 基于JAVA+SpringMVC+Mybatis+MYSQL的学生签到管理系统
- 微信公众号订阅号留言点赞采集抓取爬虫
- 14. RDMA之Memory Window
- jquery-select2实现省市区三级联动(拓展SpringMVC后台方法)
- multisim仿真 74LS147D芯片
- python中arch模块_在Arch下安装pip
- java 好和不好的形容词 英语怎么说_为什么很多人译不好“It+is+a+形容词+名词+that从句”?...
- ESP8266开发之旅 基础篇⑥ Ticker——ESP8266定时库
- CCS使用教程06:在线仿真操作
热门文章
- 英国开创自我修复城市概念,利用无人机和机器人自动检测道路裂缝并进行修复
- Python | 计算给定数字的平方(3种不同方式)
- 一个简单的Mastermind Game
- Python 转义字符与原字符
- 实现花瓣登陆静态页面
- [AMV-GCNs Neurocomputing2021] Adaptive multi-view graph convolutional networks for skeleton-based ac
- 常用手持设备的use-agent头信息
- fast无线路由器设置服务器,Fast迅捷无线路由器怎么设置 Fast迅捷无线路由器设置方法【详细步骤】...
- OVM学习--持续更新
- SQL Server 备份还原教程