【果壳笔记】生物信息学——陈小伟老师部分
【果壳笔记】生物信息学——陈小伟老师部分
本文部分图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用。
目录
【果壳笔记】生物信息学——陈小伟老师部分
1、Quantile 归一化过程:
2、FDR控制假阳性的方法
3、转录本表达量的表示方法
4、FPKM 与 RPKM的区别
1、Quantile 归一化过程:
基本方法:芯片间标准化的目的是基于Gene1~Gene5五个基因表达量理论的和应该保持恒定,即S1~s3三列每一列的和是相等的。但实际测定过程中不可能完全相等,因此将这种不等归结于每一组芯片自身的差异而进行芯片间标准化,基本步骤为通过排序取平均重新排序的方法消除芯片间误差,从而可以得到每一组基因表达量的真实值。(老师给的这组芯片基因完全相同的情况下S3一列数据明显偏高,通过这种标准化实现了芯片间差异的消除)。
2、FDR控制假阳性的方法
3、转录本表达量的表示方法
(RPKM:Reads Per Kilobase of transcript per Million mapped reads )(读取每百万次映射读取的每千碱基转录本)
(1) RPKM的作用:
RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理的事,因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表现量较高,而错估基因真正的表现量,所以Ali Mortazavi等人在2008年提出以RPKM在估计基因的表现量。
假设一个物种的基因组上的基因G1外显子长80 Kb,基因G2的外显子长20 Kb。对该物种的一个样本做RNA-seq,共得到23 millions 的reads,能够比对到基因区的reads有20 millions,其中能够比对到G1的read 有16K个,能够比对到G2的有4K个.计算G1和G2的RPKM。
Total mapped reads=20 million
G1: total exon reads=16,000 exon length=80kb
RPKM=16,000/(20*80)=10
G2: total exon reads=4,000 exon length=20kb
RPKM=4,000/(20*20)=10
4、FPKM 与 RPKM的区别
两者基本相同。RPKM代表Reads Per Kilobase of transcript per Million mapped reads(读取每百万次映射读取的每千碱基转录本),FPKM代表Fragments Per Kilobase of transcript per Million mapped reads(每百万份已映射读码中每千碱基的转录片段)。在RNA-Seq中,由于cDNA来源于RNA 的逆转录,转录物的表达量与cDNA片段成比例。RNA-Seq配对末端实验每个片段产生两个reads,但这并不意味着两个reads都可在图上标注。例如,第二个read低品质。如果我们对read计数而不是片段,我们可能对某些片段重复计数,而对另一些只计一次,导致对表达量估计的偏差。因此FPKM以片段为单位计数,而不是reads数。
【果壳笔记】生物信息学——陈小伟老师部分相关推荐
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(1)
第1章 操作系统概述 1.(5分)下列关于操作系统的叙述中,哪一个是错误的? A. 操作系统管理着计算机系统中的各种资源 B. 操作系统应为用户提供良好的界面 C. 操作系统是计算机系统中的一个应用软 ...
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(7)
7.存储模型-作业状态 1.(5分)为了保证CPU执行程序指令时能正确访问存储单元,需要将用户进程中的逻辑地址转换为运行时可由CPU直接寻址的物理地址,这一过程称为: A. 地址映射 B. 地址分配 ...
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(8)
8-存储模型(2) 作业状态 A. 虚拟存储技术 B. 存储保护技术(错选) C. 多道程序设计技术 D. 程序访问的局部性原理 2.(5分)虚拟页式存储系统中页表的作用十分重要,页表由页表项组成, ...
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(4)
4.处理机调度 1.(5分)下列哪一个调度算法的开销比较小? A. 先来先服务(FCFS) B. 短作业优先(SJF) C. 多级反馈队列(Feedback) D. 最高相应比优先(HRRN)(错选) ...
- 学习笔记(01):【孙伟老师UID课堂】设计师也能会的-WEB前端入门基础HTML+CSS视频教程-09综合表单标签讲解-1...
立即学习:https://edu.csdn.net/course/play/6853/136357?utm_source=blogtoedu 8-9接不上啊 少了几节课吧?
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(2)
操作系统的运行环境 1.(5分)控制和状态寄存器用于控制处理器的操作,在某种特权级别下可以访问.修改.下列哪一个不是控制和状态寄存器 A. 程序计数器(PC)(错选) B. 指令寄存器(IR) C. ...
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(9)
9.文件系统(1) 作业状态 1.(5分)UNIX系统中,把输入输出设备看做是 A. 普通文件 B. 目录文件 C. 特殊文件 D. 索引文件 2.(5分)文件的逻辑结构是由下列哪一项决定的? A. ...
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(5)
5.同步机制(1) 1.(5分)多个进程并发执行时,各个进程应互斥进入其临界区,所谓临界区是指 A. 一段程序 B. 一段数据区 C. 一个缓冲区 D. 一种同步机制 2.(5分)下列哪一种场景问题只 ...
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(3)
3 .进程线程模型 作业状态 1.(5分)多道程序设计技术是操作系统中最早引入的软件技术,引入它的目的是 A. 提高系统的实时响应速度 B. 充分利用内存,有利于数据共享 C. 充分利用CPU,提高C ...
- 操作系统学习笔记——北京大学陈向群老师课后及习题答案(6)
6.同步机制(2) 作业状态 1.(5分)下列关于管程的描述中,哪一个是不正确的? A. 管程中需要提供互斥量以保证管程的互斥性 B. 管程有自己的名字 C. 管程的主要作用是管理共享资源(数据结构 ...
最新文章
- Linux(Centos)下jdbc连接oracle速度超慢的问题
- 一个三行两列右列固定左列自适应宽度的CSS
- ecshop静态、 ecshop伪静态、ecshop伪静态设置详细方法、ECSHOP静态化方法
- swarm 容器_Oracle应用容器云上的WildFly Swarm
- java_object的具体使用--上帝
- JVM学习01—下载编译openjdk源码并进行调试
- Composer最近升级后导致无法下载包的问题解决办法
- asp.net membership 配置错误
- otdr测试资料生成软件,OTDR曲线图生成工具
- 【DBAI】《基于机器学习的数据库技术综述》
- 各种控制方法在抗干扰方面的区别
- unity+google cardboard
- python入门简单教学
- NBA篮球经典动画gif系列连载之三
- 用Python做一个会旋转的五彩风筝
- 教室预约系统mysql_PHP+MySQL教室预约管理系统的设计与实现
- flink sql 执行源码走读全流程
- 主动变被动9个例句_【语法课堂】全面了解被动语态的特殊用法考点总结
- 《这就是搜索引擎》爬虫部分摘抄总结
- 关闭mybatis 日志