用Cufflinks计算差异表达
Cufflinks计算差异表达
Cufflinks包含了以下程序:
Cufflinks 使用经过Tophat比对好的SAM格式来拼接转录组(每一个样本都进行拼接),如果有基因组注释文件的话,效果会更好。这个步骤的目的在前面已经讲过,包括后面的cuffmerge,即为了更精确地确定转录组的所有转录本以及其所有的剪接变体,从而更精确的进行定量分析。
如果已经有了参考基因组和基因组注释文件,这个步骤和cuffmerge都可以跳过,也就是说
cuffquant/ cuffdiff 可以直接接受Tophat输出的文件进行定量分析,差别就是选项中的基因
组注释文件用你之前下载的基因组注释文件,而不是由cufflinks、cuffmerge生成的注释文
件,一般不推荐这么做。因为即使是研究比较深入的模式植物,每次转录组测序都会发现新
的转录本。
cuffmerge 将Cufflinks拼接的所有转录组整合起来
cuffquant v2.2.0 后出现的新功能,在之前的cuffmerge 和 cuffdiff 之间插入了一步,作用是计算每个样本的表达量(应该是raw count),产生一个中间文件,这个文件可以用cuffdiff 和cuffnorm分析,是一个可选步骤。
cuffdiff 可接受Tophat的输出/cuffquant的输出/或者跳过cuffquant
对每个处理都两两进行差异分析,分析哪些基因上调或者下调,显著性如何等,后面介绍。
cuffnorm 也是v2.2.0 后新出来的功能,不进行差异分析,只计算FPKM等值,进行标准化
下面脚本进行了从Cufflinks到cuffdiff的一个流程,绝大部分参数使用默认参数即可,其他参数请看官方手册,因为中间涉及几个不同程序,需要要搞清楚每个程序需要的输入文件和输出文件。
1.#运行Cufflinks,分别拼接每一个样本的转录组
2ls pwd
|grep ‘gz’|while read filename
3do
4cufflinks -p 4 -o “./KaTeX parse error: Expected '}', got 'EOF' at end of input: …e%%.*}_clout" "{filename%%.}/accepted_hits.bam"
5done
6#创建一个 assemblies.txt
7#运行cuffmerge,将所有样本拼接好的转录组合成一个
8#参数 -g 添加基因组注释文件,可选
9#参数 -s 为参考基因组 fasta格式
10cuffmerge -g Teatree.gff3 -s Teatree_Assembly.fas -o ./cuffmerge_out/-p 4 assemblies.txt
11#运行 cuffquant
12ls pwd
|grep ‘gz’|while read filename
13do
14cuffquant -p 4 -o "./cuffquant_result/KaTeX parse error: Expected '}', got 'EOF' at end of input: …t/merged.gtf "{filename%%.}/accepted_hits.bam”
15done
1#运行cuffdiff
1cuffdiff -p 4 -o ./cuffdiff_out -L T25_4h,T4_4h,T4_8h ./cuffmerge_out/merged.gtf
./cuffquant_result/SRR1747100-25du-4h-1_cqout/abundances.cxb
,./cuffquant_result/SRR1747101-25du-4h-2_cqout/abundances.cxb
./cuffquant_result/SRR1747102-4du-4h-1_cqout/abundances.cxb
,./cuffquant_result/SRR1747103-4du-4h-2_cqout/abundances.cxb
./cuffquant_result/SRR1747105-4du-8h-1_cqout/abundances.cxb
,./cuffquant_result/SRR1747107-4du-8h-2_cqout/abundances.cxb\
用Cufflinks计算差异表达相关推荐
- 【生信学习第一天】DEseq2 差异表达基因计算
一.介绍 分析来自 RNA-seq 的计数数据的一项基本任务是检测差异表达的基因.计数数据以表格的形式呈现,其中报告了每个样本已分配给每个基因的序列片段的数量.其他检测类型也有类似的数据,包括比较 C ...
- 2020.12.10丨cufflinks 简介及使用说明
一. 简介 Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序.主要用于基因表达量的计算和差异表达基因的寻找. Cufflin ...
- cufflinks 介绍使用
一. 简介 Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序.主要用于基因表达量的计算和差异表达基因的寻找. Cufflin ...
- Cufflinks的使用
一. 简介 Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序.主要用于基因表达量的计算和差异表达基因的寻找. 二. 安装 C ...
- 生物信息学习——cufflinks
原文地址:http://blog.sina.com.cn/s/blog_751bd9440102v72b.html 一. 简介 Cufflinks下主要包含cufflinks,cuffmerge,cu ...
- RNA 2. SCI文章中基于GEO的差异表达基因之 limma
01. 前言 目前随着测序成本的降低,越来越多的文章中都将使用基因的表达数据,那么就会涉及到差异基因,最基础的思路就是获得表达数据,根据临床信息进行分组,利用各种软件计算出差异表达基因,这里主要基于G ...
- HISAT2+StringTie+Ballgown安装及使用流程
HISAT2+StringTie+Ballgown安装及使用流程 2015年Nature Methods上面发表了一款快速比对工具hisat,作为接替tophat和bowtie的比对工具,它具有更快的 ...
- RNA-seq全流程分析
RNA-seq 数据处理记录(2) 原始数据的处理 去除adapter 找到接头序列 可以通过建库的试剂盒在Illumina官网查找,也可以通过trim_galore自动找到接头并去除. conda ...
- Nature重磅综述 |关于RNA-seq,你想知道的都在这
编译 |生信宝典,May 校对 |生信宝典 ▼生信学习的正确姿势(第三版) NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 ...
最新文章
- 使用指针判断数组是否为上三角矩阵
- 这个AI模型用最少的训练数据学习对象之间的关系
- 上交三月月赛[SJTU] 1105 path
- SQL Server 跨库同步数据
- oracle存储过程行转列,oracle 存储过程-动态行转列,解决。
- mysql字段分隔符拆分_MySQL里实现类似SPLIT的分割字符串的函数
- 不使用输入框如何实现下拉_使用INFINITE AJAX SCROLL实现下拉加载效果
- golang从简单的即时聊天来看架构演变
- PHP-MYSQL中文乱码问题.
- oracle创建用户和表空间,授权,oracle用imp导入dmp文件
- oracle替换字符串replace
- 01 安装STEP7软件和USB驱动
- HTML做一个学校网站(纯html代码)
- Solr 原理、API 使用
- wps文档设置页眉左右(奇偶页)不同内容
- 激活工业数据价值 2020年建成国家工业互联网大数据中心
- 理解PeopleSoft HRMS人力资源管理系统
- 软件测试需要学什么?零基础如何入门软件测试?
- ios python 越狱_iOS越狱--USB连接SSH
- 电平触发和边沿触发——数电第五章学习
热门文章
- 双螺杆挤出机有哪些系列
- My Dream Life
- 实现多个文件夹名同时重命名的操作
- leetcode 1646
- 7.8 css 学习
- Windows程序设计-09-COM技术
- MySQL分组查询,获取分组后数据
- Java EE 是什么?
- Transferability vs. Discriminability: Batch Spectral Penalization for Adversarial Domain Adaptation
- Elasticsearch:在 Java 客户端中使用 scroll 来遍历搜索结果 - Elastic Stack 8.x