【果壳笔记】生物信息学——陈小伟老师部分

本文部分图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用。

目录

【果壳笔记】生物信息学——陈小伟老师部分

1、Quantile 归一化过程:

2、FDR控制假阳性的方法

3、转录本表达量的表示方法

4、FPKM 与 RPKM的区别


1、Quantile 归一化过程:

基本方法:芯片间标准化的目的是基于Gene1~Gene5五个基因表达量理论的和应该保持恒定,即S1~s3三列每一列的和是相等的。但实际测定过程中不可能完全相等,因此将这种不等归结于每一组芯片自身的差异而进行芯片间标准化,基本步骤为通过排序取平均重新排序的方法消除芯片间误差,从而可以得到每一组基因表达量的真实值。(老师给的这组芯片基因完全相同的情况下S3一列数据明显偏高,通过这种标准化实现了芯片间差异的消除)。

2、FDR控制假阳性的方法

3、转录本表达量的表示方法

(RPKM:Reads Per Kilobase of transcript per Million mapped reads )(读取每百万次映射读取的每千碱基转录本)

(1) RPKM的作用:

RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理的事,因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表现量较高,而错估基因真正的表现量,所以Ali Mortazavi等人在2008年提出以RPKM在估计基因的表现量。

假设一个物种的基因组上的基因G1外显子长80 Kb,基因G2的外显子长20 Kb。对该物种的一个样本做RNA-seq,共得到23 millions 的reads,能够比对到基因区的reads有20 millions,其中能够比对到G1的read 有16K个,能够比对到G2的有4K个.计算G1和G2的RPKM。

Total mapped reads=20 million

G1: total exon reads=16,000    exon length=80kb

RPKM=16,000/(20*80)=10

G2: total exon reads=4,000    exon length=20kb

RPKM=4,000/(20*20)=10

4、FPKM 与 RPKM的区别

两者基本相同。RPKM代表Reads Per Kilobase of transcript per Million mapped reads(读取每百万次映射读取的每千碱基转录本),FPKM代表Fragments Per Kilobase of transcript per Million mapped reads(每百万份已映射读码中每千碱基的转录片段)。在RNA-Seq中,由于cDNA来源于RNA 的逆转录,转录物的表达量与cDNA片段成比例。RNA-Seq配对末端实验每个片段产生两个reads,但这并不意味着两个reads都可在图上标注。例如,第二个read低品质。如果我们对read计数而不是片段,我们可能对某些片段重复计数,而对另一些只计一次,导致对表达量估计的偏差。因此FPKM以片段为单位计数,而不是reads数。

【果壳笔记】生物信息学——陈小伟老师部分相关推荐

  1. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(1)

    第1章 操作系统概述 1.(5分)下列关于操作系统的叙述中,哪一个是错误的? A. 操作系统管理着计算机系统中的各种资源 B. 操作系统应为用户提供良好的界面 C. 操作系统是计算机系统中的一个应用软 ...

  2. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(7)

    7.存储模型-作业状态 1.(5分)为了保证CPU执行程序指令时能正确访问存储单元,需要将用户进程中的逻辑地址转换为运行时可由CPU直接寻址的物理地址,这一过程称为: A. 地址映射 B. 地址分配 ...

  3. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(8)

    8-存储模型(2)  作业状态 A. 虚拟存储技术 B. 存储保护技术(错选) C. 多道程序设计技术 D. 程序访问的局部性原理 2.(5分)虚拟页式存储系统中页表的作用十分重要,页表由页表项组成, ...

  4. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(4)

    4.处理机调度 1.(5分)下列哪一个调度算法的开销比较小? A. 先来先服务(FCFS) B. 短作业优先(SJF) C. 多级反馈队列(Feedback) D. 最高相应比优先(HRRN)(错选) ...

  5. 学习笔记(01):【孙伟老师UID课堂】设计师也能会的-WEB前端入门基础HTML+CSS视频教程-09综合表单标签讲解-1...

    立即学习:https://edu.csdn.net/course/play/6853/136357?utm_source=blogtoedu 8-9接不上啊  少了几节课吧?

  6. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(2)

    操作系统的运行环境 1.(5分)控制和状态寄存器用于控制处理器的操作,在某种特权级别下可以访问.修改.下列哪一个不是控制和状态寄存器 A. 程序计数器(PC)(错选) B. 指令寄存器(IR) C. ...

  7. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(9)

    9.文件系统(1)  作业状态 1.(5分)UNIX系统中,把输入输出设备看做是 A. 普通文件 B. 目录文件 C. 特殊文件 D. 索引文件 2.(5分)文件的逻辑结构是由下列哪一项决定的? A. ...

  8. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(5)

    5.同步机制(1) 1.(5分)多个进程并发执行时,各个进程应互斥进入其临界区,所谓临界区是指 A. 一段程序 B. 一段数据区 C. 一个缓冲区 D. 一种同步机制 2.(5分)下列哪一种场景问题只 ...

  9. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(3)

    3 .进程线程模型 作业状态 1.(5分)多道程序设计技术是操作系统中最早引入的软件技术,引入它的目的是 A. 提高系统的实时响应速度 B. 充分利用内存,有利于数据共享 C. 充分利用CPU,提高C ...

  10. 操作系统学习笔记——北京大学陈向群老师课后及习题答案(6)

    6.同步机制(2)  作业状态 1.(5分)下列关于管程的描述中,哪一个是不正确的? A. 管程中需要提供互斥量以保证管程的互斥性 B. 管程有自己的名字 C. 管程的主要作用是管理共享资源(数据结构 ...

最新文章

  1. Linux(Centos)下jdbc连接oracle速度超慢的问题
  2. 一个三行两列右列固定左列自适应宽度的CSS
  3. ecshop静态、 ecshop伪静态、ecshop伪静态设置详细方法、ECSHOP静态化方法
  4. swarm 容器_Oracle应用容器云上的WildFly Swarm
  5. java_object的具体使用--上帝
  6. JVM学习01—下载编译openjdk源码并进行调试
  7. Composer最近升级后导致无法下载包的问题解决办法
  8. asp.net membership 配置错误
  9. otdr测试资料生成软件,OTDR曲线图生成工具
  10. 【DBAI】《基于机器学习的数据库技术综述》
  11. 各种控制方法在抗干扰方面的区别
  12. unity+google cardboard
  13. python入门简单教学
  14. NBA篮球经典动画gif系列连载之三
  15. 用Python做一个会旋转的五彩风筝
  16. 教室预约系统mysql_PHP+MySQL教室预约管理系统的设计与实现
  17. flink sql 执行源码走读全流程
  18. 主动变被动9个例句_【语法课堂】全面了解被动语态的特殊用法考点总结
  19. 《这就是搜索引擎》爬虫部分摘抄总结
  20. 关闭mybatis 日志

热门文章

  1. 前端工程师找工作,你需要准备什么?
  2. 剪切蒙版与抠图的结合
  3. 卸载Office 16 Click-to-Run Extensibility Component详细步骤
  4. 微信公众号平台js逆向分析
  5. 洗衣机测试点 思维导图
  6. 多个jdk共存与切换
  7. 001-前端课程介绍
  8. 多读书多看报,少吃零食多睡觉—2014总结,2015规划
  9. XPS文件可以直接打印吗?如何转成Word后修改呢
  10. 基于FPGA板的音乐盒的设计