欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!
基因学苑Q群:32798724
编者按
虽然短序列比对工具subread的使用没有bwa和hisat2流行,但是软件包中的featureCounts工具却使用比较广泛。尤其是在利用R语言进行RNAseq分析时,featureCounts几乎成为必须使用的工具。当然说的是R语言版本的featureCounts。

一、功能分类:
reads计数

二、软件官网:
http://subread.sourceforge.net/

三、软件介绍:
featureCounts是subread软件包中的一共工具,主要用来计算subread比对之后的结果进行reads计数,也就是每个区域有多少条reads比对上了。目前比较常用的reads计算工具有两款,一个是HTseq,另一款就是featureCounts。reads 记数主要用在RNAseq分析中。计算每个基因或者外显子上面的reads数,根据reads数目进行归一化处理,计算RPKM,FPKM,TPM等,然后进行差异比较分析。一般在利用R语言进行RNAseq数据分析时,输入文件基本上都是reads count结果。例如DEseq,DEseq2,edgeR,limma等R包,都需要输入这样的结果,不能直接输入归一化之后的结果,因为这些软件都需要使用自己归一化的方法。所以reads 记数这一步是非常重要的,因此我们单独拿出一节来介绍featureCounts软件,其实我觉得featureCounts的使用人数可能比subread还多。

四、下载安装:
wget https://jaist.dl.sourceforge.net/project/subread/subread-1.6.0/subread-1.6.0-Linux-x86_64.tar.gz
tar -zxvf subread-1.6.0-Linux-x86_64.tar.gz
五、软件使用:
-a 注释文件,也就是GTF或者GFF文件,通过这个文件才能区分出哪些区域为外显子;
-o 输出结果文件,同样会输出一个以该名字结尾的.summary统计文件;
-F 指定输入注释文件类型,包括GTF,GFF,SAF等;
-t 指定注释文件中功能类型,默认外显子exon
-g 指定注释文件中属性信息,默认为gene_id
-A 如果基因组与注释文件中染色体ID不同,可以通过-A指定一个别名文件,例如有些基因组直接用数字表示染色体号,有些使用chr前缀;
-f 计算级别,以基因还是外显子为单位进行计算;
-M 如何处理多重比对reads
-Q 比对质量值阈值,小于此值的reads不用于计算;
-G 参考序列文件

六、使用案例:
统计hisat2比对之后的bam文件

featureCounts -p -t exon -g gene_id -a annotation.gtf -o counts.txt mapping_results_PE.bam
七、注意事项:
1、注意多重比对reads分配问题;

生物信息百Jia软件(22):featureCounts相关推荐

  1. 生物信息百Jia软件(七):glimmer

    编者按 欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘! 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源,也介绍了<生物信息之独 ...

  2. 生物信息百Jia软件(六):prodigal

    编者按 欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘! 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源,也介绍了<生物信息之独 ...

  3. 生物信息百Jia软件(十七):flash

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 编者按 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源 ...

  4. 生物信息百jia软件(25):quast

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 去年这时候制定了一个计划,写100篇生物软件的教程推文,取名字"生物信息百jia软件",本来以为 ...

  5. 生物信息百Jia软件(28):canu

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 上一次介绍了三代拼接工具falcon,但是falcon这款无论是从安装还是使用都比较麻烦,对于新手是一个很大的考验, ...

  6. 生物信息百Jia软件(二十):lumpy

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 通哥点评 基因组结构变异SV的检测一直都是当前基因组研究中非常困难的课题,由于二代测序多长过短,因此无论在优化算法, ...

  7. 生物信息百Jia软件(十四):velvet

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 通哥点评 velvet是最早的用于二代测序的序列拼接工具,拼接效果还可以,不过我觉得不如SOAPdenovo效果好. ...

  8. 生物信息百Jia软件(21):hisat2

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 编者按 现在的软件更新实在太快了,光是转录组用来比对的软件就有很多,bowtie, tophat,star,现在又有 ...

  9. 阿里云POLARDB如何帮助百胜软件应对数据库的“巅峰时刻”

    POLARDB是阿里云自研的下一代关系型云数据库,100%兼容MySQL,存储容量最高可达100TB,性能最高提升至MySQL的6倍,适用于企业多样化的数据库应用场景.POLARDB采用存储和计算分离 ...

最新文章

  1. UNL(Ubiquitous Navigation Lab)
  2. centos6 rpm安装mysql_Centos6下rpm安装MySQL5.6
  3. 剑指offer系列之三十七:二叉树的深度
  4. Centos7 安装lnmp
  5. 漫步线性代数十九——快速傅里叶变换(上)
  6. 真相了!为什么华为不惜成本也要支持外置存储卡扩展?
  7. QT4.8.5 显示中文
  8. Maven : invalid item Maven: xxx in the dependencies
  9. IBM的漂浮机器人,被马斯克的火箭送去太空了
  10. 安卓逆向及JavaScript实战
  11. Linux Command diff 文件比较
  12. 荐书 | 9本心理治疗书籍推荐
  13. Ubuntu下Git安装图形化代码合并工具kdiff3
  14. linux 查找pcre源码,pcre使用例子
  15. LINUX-AWK-删除首行、删除尾行、删除首尾两行
  16. HDU 1224 DFS
  17. Unity 分辨率框Config Dialog Banner尺寸要求
  18. 做后端php和java区别,【后端开发】php和java有什么区别
  19. Redis各版本的特性及架构
  20. PCIE学习笔记(二)PCIe总线的拓扑结构,协议层,数据传输流程

热门文章

  1. Codeforces Round #796 (Div. 2)
  2. S/4 HANA标准表MARC增强字段
  3. webstorm 打不开问题
  4. ubuntu未关机断电导致异常进入initramfs界面的处理方法
  5. opencv 改变光标_opencv编译方法
  6. 30元云主机包月不是梦
  7. php任意文件删除漏洞,phpyun二次任意文件删除漏洞
  8. 手把手带你写一个中断输入设备驱动~
  9. VS2010高速绘图Hight-Speed Charting -- 函数说明
  10. js前端处理过滤特殊字符以及输入法特殊表情符号emoji的正则方法,解决数据库报错问题。