edgeR是一个研究重复计数数据差异表达的Bioconductor软件包。一个过度离散的泊松模型被用于说明生物学可变性和技术可变性。经验贝叶斯方法被用于减轻跨转录本的过度离散程度,改进了推断的可靠性。该方法甚至能够用最小重复水平使用,只要至少一个表型或实验条件是重复的。该软件可能具有测序数据之外的其他应用,例如蛋白质组多肽计数数据。可用性:程序包在遵循LGPL许可证下可以从Bioconductor网站。

一:下载安装该软件

下载安装edgeR这个R包,因为这是一次讲R包的下载,我就啰嗦一点,这种生物信息学的包不同于普通的R包,是需要用biocLite来安装的,命令如下

安装成功之后会有以下提示。

但是我加载碰到一个很幼稚的错误,因为我的电脑太差了,这是一个测试的电脑,是300块钱在二手市场里面淘的,所以内存不够。

我简单搜索了一下,才知道是虚拟内存太小了,需要调整

重启电脑,就成功啦

二:准备数据

就是对tophat的bam文件用HTseq计数后的count文件,见前一篇文章《转录组HTseq对基因表达量进行计数》

三:运行命令

因为主要是在R里面操作,我就只讲R里面的命令了,首先要把那些HTseq产生的文件拷贝到R的工作目录,我这里是自己设置了工作目录

setwd(“D:\\项目\\RNA-seq\\htseq”)

a=read.table(“case1.sam.count”)

b=read.table(“case2.sam.count”)

c=read.table(“control.sam.count”)

counts=data.frame(case1=a[,2],case2=b[,2],control=c[,2])

rownames(counts)=a[,1]

这样就读入了一个counts数据框

可以看到有三个样本,涉及到了23373个基因,每个样本的测序量约50M的reads

可以看到,有很多基因的计数不到30次。

我们首先对第一组来选择差异基因

case1_control=counts[,1:2];group=c(“case1″,”control”);

cds

简单看看这个构造的对象cds的具体内容

原文来自:http://www.bio-info-trainee.com/255.html

edger多组差异性分析_转录组edgeR分析差异基因相关推荐

  1. edger多组差异性分析_转录组edgeR分析差异基因 | 生信菜鸟团

    转录组edgeR分析差异基因 edgeR是一个研究重复计数数据差异表达的Bioconductor软件包.一个过度离散的泊松模型被用于说明生物学可变性和技术可变性.经验贝叶斯方法被用于减轻跨转录本的过度 ...

  2. 转录组分析_转录组+?分析+?实验=2区文章

    随着高通量测序技术的发展,越来越多的研究者或多或少的做了一些测序项目,其中尤以转录组测序类最多. 今天小编就给大家带来一篇2月28日发表在BMC Plant Biology(影响因子3.93,中科院分 ...

  3. edger多组差异性分析_简单使用DESeq2/EdgeR做差异分析

    DESeq2和EdgeR都可用于做基因差异表达分析,主要也是用于RNA-Seq数据,同样也可以处理类似的ChIP-Seq,shRNA以及质谱数据. 这两个都属于R包,其相同点在于都是对count da ...

  4. edger多组差异性分析_使用edgeR进行无重复差异表达分析

    写这篇文章一部分原因是填2年前的一个坑 转录组入门(7):差异表达分析. 另一部分原因是GQ最近又在搞一波无重复的差异表达分析, 所以专门去学了edgeR 我个人是不太推荐没有重复的差异表达分析,毕竟 ...

  5. edger多组差异性分析_简单使用DESeq2/EdgeR做差异分析 – 生信笔记

    DESeq2和EdgeR都可用于做基因差异表达分析,主要也是用于RNA-Seq数据,同样也可以处理类似的ChIP-Seq,shRNA以及质谱数据. 这两个都属于R包,其相同点在于都是对count da ...

  6. edger多组差异性分析_【step by step】菜鸟学TCGA(4)-用edgeR做差异表达分析

    大家好,工作太忙,太久没有更新了,哎,泪-- 有的同学问我要代码,有的发了,后面的还没有发,一个一个发好累啊,大家有建议吗? 感觉某宝的这个课程也不贵,300多,有经济能力的小伙伴可以自己买,学得快些 ...

  7. edger多组差异性分析_edgeR差异基因分析的一般过程

    基于转录组测序获得的定量表达值,识别差异表达变化的基因或其它非编码RNA分子,实际上方法还是非常多的.但就目前来看,DESeq2和edgeR是出现频率最高的两种方法了. DESeq2已经在上一篇文章中 ...

  8. edger多组差异性分析_edgeR之配对检验分析差异基因的使用教程

    edgeR的介绍 背景 RNA-seq表达谱与生物复制的差异表达分析. 实现一系列基于负二项分布的统计方法,包括经验贝叶斯估计,精确检验,广义线性模型和准似然检验. 与RNA-seq一样,它可用于产生 ...

  9. edger多组差异性分析_R语言利用edgeR package进行基因差异表达分析 举例

    R语言利用edgeR package进行基因差异表达分析 举例 实验数据: 同一组织,分为两组,control vs treat,每组7例sample.数据第一列为基因名,后14列为对应的count. ...

最新文章

  1. 农科院张西美组助研招聘(事业编、解决北京户口)
  2. awk 添加自定义变量
  3. 号外:Mapinfo被Pitney Bowes公司收购
  4. 秒懂晶振以及晶振电路 让你从“吃瓜群众”到“技术大牛”
  5. MSSQL SERVER 2005 数学函数
  6. UNIX再学习 -- 线程同步
  7. chdir、getcwd、mkdir、rmdir函数
  8. jmeter如何通过后置处理器提取(正则提取器、json提取器)做接口关联?
  9. 【数据结构与算法】二叉堆V2.0的Java实现
  10. 阿里云服务器对外开放tomcat端口访问
  11. 基于汇编的 C/C++ 协程 - 实现
  12. Default Folder X 5 for Mac(文件快捷访问工具)
  13. micropython入门指南pdf百度云下载_MicroPython入门教程之语法基础
  14. WebGrid CRM 功能模块描述
  15. git操作时:遇到提示Unable to create ‘D:/xxx/.git/index.lock‘: File exists.的解决办法解决方案
  16. win10易升_记一次因为升级 Win 10 到 2004 版导致的蓝屏问题的解决
  17. html安装网卡驱动,教您怎么用驱动精灵安装网卡驱动
  18. Linux内核私闯进程地址空间并修改进程内存
  19. CCF真题 工资计算
  20. Oracle 恢复dmp文件到数据库表中(超大DMP) 【数据系列 3】

热门文章

  1. 卷积神经网络算法综述
  2. 电脑资料删除后如何恢复呢?两步解决
  3. 计算机网络 常见笔试面试题
  4. 项目管理检查清单-项目规划
  5. 基于android的百度地图的工程车辆租赁服务平台设计
  6. 一套键鼠操控多台主机/电脑/笔记本 - 《Mouse Without Borders》安装配置教程
  7. 大学生HTML期末作业, JavaScript期末大作业
  8. Gerrit 使用教程
  9. 【优化算法】多目标蝗虫优化算法(MOGOA)
  10. 挑战一下真正属于自已的命运。