RNA-seq 详细教程:实验设计(2)
学习目标
了解设置重复对于 RNA-seq
分析的重要性
了解生物重复次数、测序深度和鉴定到的差异表达基因之间的关系
了解如何设计 RNA-seq
实验,以避免批次效应
1. 注意事项
了解 RNA
提取和 RNA-seq
文库制备实验过程中的步骤,有助于设计 RNA-seq
实验,但有一些特殊的注意事项需要明确:
重复次数和类型
避免混淆
处理批次效应
2. 重复
实验重复可以通过技术重复或生物学重复来实现,如下图:
技术重复
使用相同的生物样本重复实验步骤,以准确测量技术差异并在分析过程中将其去除。
生物学重复
使用相同条件下的不同生物样本来衡量样本间的差异。
在微阵列时代,技术重复被认为是必要的;然而,当前的 RNA-seq
技术,技术差异远低于生物差异,因此不需要技术重复。相反,生物重复对于差异表达分析是绝对必要的。
对于差异表达分析,生物学重复越多,对生物学变异的估计就越好,我们对平均表达水平的估计也就越精确。因此,数据可以进行更准确的建模并识别更多差异表达的基因。
如上图所示,生物重复比测序深度更重要,测序深度是每个样本测序的读数总数。该图显示了测序深度和重复次数对鉴定出的差异表达基因数的关系。与增加测序深度相比,重复次数的增加往往会得到更多的差异表达基因。因此,通常更多的重复比更高的测序深度更好,但需要注意的是,检测低表达的差异表达基因和执行异构体水平(可变剪切)的差异表达分析需要更高的深度。
下面列出了一些关于重复和测序深度的建议,用于实验规划:
通用建议:
ENCODE 建议每个样本有 3000 万个 SE reads
。
如果有大量的重复 (>3),每个样本 1500 万次 reads
通常就足够了。
如果可能,进行更多的生物重复。
通常建议读取长度 >= 50 bp
含有低表达基因:
同样,重复比测序深度更有作用。
深度更深,至少有 30-60 百万 reads
,具体取决于表达水平。
异构体水平的差异表达:
新亚型的深度应该更大(每个样本 > 6000 万 reads
)。
对 RNA
质量进行质控。
其他类型的
RNA
分析(内含子保留、small RNA-Seq
等):取绝于具体的分析
★
总之,尽量做生物学重复。
”
3. Confound
Confounding
是指:无法区分结果是由什么原因导致的。
例如,我们知道性别对基因表达有很大影响,如果我们所有的对照组小鼠都是雌性而所有处理组小鼠都是雄性,那么我们的治疗效果就会被性别混淆。我们无法区分是处理的作用和性别的作用。
如何避免:
如果可能,确保每种情况下的动物都是相同的性别、年龄和批次。
如果不可能,则确保在不同条件下平均分配动物。
4. 批次效应
批次效应是 RNA-seq
分析的一个重要问题,仅由批次效应就能导致显著的表达差异。
如何确定是否有批次效应
是否所有的 RNA
提取都是在同一天进行的?
是否所有的文库构建都是在同一天进行的?
是否同一个人对所有样品进行了 RNA
提取与文库制备?
是否对所有样品使用了相同的试剂?
是否在同一地点进行 RNA
提取与文库制备?
如果任何一个答案是“否”,那么就存在批次效应。
5. 建议
如果可能,以避免分批的方式设计实验。
如果无法避免分批:
不要按批次混淆实验:
跨批次拆分不同样本组的重复。重复次数越多越好(超过 2 个)。
请务必在实验数据中包含批次信息。在分析过程中,如果没有混淆,可以回归出由于批次引起的变异,所以有这些信息,它不会影响结果。
欢迎Star -> Github 学习目录( <-点击跳转)
国内链接 -> 学习目录( <-点击跳转)
本文由 mdnice 多平台发布
RNA-seq 详细教程:实验设计(2)相关推荐
- 一文掌握RNA seq,RNA seq课程大汇总
RNA测序(RNA-seq)在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的工具.RNA-seq帮助大家对RNA生物学的理解会越来越全面:从转录本在何时何地转录到RNA ...
- Flink 教程 gitbook 从入门到入土(详细教程)
Flink从入门到入土(详细教程) 和其他所有的计算框架一样,flink也有一些基础的开发步骤以及基础,核心的API,从开发步骤的角度来讲,主要分为四大部分 1.Environment Flink J ...
- 手把手从零开始搭建k8s集群超详细教程
本教程根据B站课程云原生Java架构师的第一课K8s+Docker+KubeSphere+DevOps同步所做笔记教程 k8s集群搭建超详细教程 1. 基本环境搭建 1. 创建私有网络 2. 创建服务 ...
- win10系统优化计算机,全面优化win10电脑系统详细教程 | 专业网吧维护
全面优化win10电脑系统详细教程 以下针对win10系统的电脑全面优化的步骤: 步骤1:禁止开机启动项 1.首先我们先来优化开机速度,拖慢开机速度的首先是开机自启动项,Ctrl + Shift + ...
- GPU运行Tensorflow详细教程及错误解决
GPU运行Tensorflow详细教程及错误解决 前提条件 配置GPU运行 确认是否成功配置 出现的错误及解决方案 前提条件 最重要的一点:CUDA与tensorflow的版本一点要对应,不然用不了! ...
- VMware虚拟机安装黑苹果MacOS Mojave系统详细教程
更多资源请百度搜索:前端资源网 欢迎关注我的博客:www.w3h5.com 最近遇到一个H5页面的 iPhone X 刘海兼容问题.查到一个 XCode 编辑器,可以模拟 iPhone X 环境运行. ...
- [分享] 从定制Win7母盘到封装详细教程 By BILL ( 10月23日补充说明 )
[分享] 从定制Win7母盘到封装详细教程 By BILL ( 10月23日补充说明 ) billcheung 发表于 2011-10-23 00:07:49 https://www.itsk.com ...
- win七系统如何卸载MySQL_win7系统卸载SQL2008R2数据库的详细教程
用过SQL2008R2数据库的朋友都知道,安装起来容易卸起来麻烦,可是在win7 32位旗舰版系统就不知道怎么卸载SQL2008R2数据库了.其实卸载SQL2008R2数据库的方法也很简单,可直接通过 ...
- Ubuntu系统安装搜狗输入法详细教程
Ubuntu16.04系统安装搜狗输入法详细教程 解决Ubuntu 18.04中文输入法的问题,安装搜狗拼音
- PHP7Grafika,PHP图片处理库Grafika详细教程(3):图像属性处理
该文章是接着上篇文章,<PHP极其强大的图片处理库Grafika详细教程(2):图像特效处理模块>,由于grafika功能太多,所以分开写,其他的点击这里 该文章主要写grafika的图像 ...
最新文章
- 教授在飞机上做微积分,被当作恐怖分子抓了......
- Linux之内存描述符mm_struct
- 【正一专栏】轮回-从坚信去年骑士会逆转到今年坚定看好勇士横扫
- Android 优化电池使用时间——确定和监控基座对接状态和类型
- Java黑皮书课后题第7章:**7.19(是否排好序了?)编写以下方法,如果参数中的list数组已经排好序了则返回true。编写一个测试程序,提示用户输入一个列表,显示该列表是否已经排好序
- 新闻发布项目——数据库脚本(直接导入即可)
- 区块链将如何影响你的生活?链圈大佬、美图董事长蔡文胜这样说
- 一程序员被判 9 个月:因薪酬等问题离职,rm -f * 删库,瘫痪 6 个小时
- PWA进阶:Service Worker一问一答
- php fopen 清空文件内容,如何在c语言中清空文件里的内容?
- rpm和yum的使用
- 云服务器性能对照表,云服务器 性能对比
- Android微信页面缓存清理,安卓用户如何彻底清理微信大量缓存?4招让你彻底解决内存烦恼...
- gitbub(cp:http://www.linuxidc.com/Linux/2014-03/97821.htm)
- html 背景颜色设置为透明,css如何设置背景颜色透明?css设置背景颜色透明度的两种方法介绍...
- coursera和udacity_从Udacity和Coursera进行深度学习
- 清华大学生计算机系学生就业方向,这5所大学计算机专业全球顶尖,就业前景广阔,毕业就能拿高薪!...
- 计算机平面设计主要学什么 - 兔课网,兔课网:初学平面要怎么样构图?
- mongodb-报错FailedToParse: Password must be URL Encoded for mongodb:// URL:
- Windows获取本机公网ip脚本