数据原理——1、ChIP-seq
文章目录
- 1、背景介绍
- 2、测序对象:三种类型组蛋白(组蛋白、转录因子、转录调控子)
- 3、测序原理
- 4、检测蛋白质与DNA序列的结合峰
- (1)测序片段匹配到参考基因组
- (2)检测峰
- (2)提高峰质量
- 5、影响ChIPseq测序结果的因素
- (1)免疫共沉淀的影响
- (2)测序的影响
- (3)酶断裂方法和超声波打断的影响
ChIP-seq(研究体内DNA与蛋白质相互作用的方法)
1、背景介绍
ChIP-seq测序方法:
- ChIP 指染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)
- seq 指的是二代测序方法(ChIP-seq比ChIP-chip具有更高的分辨率、更低的噪声和更大的覆盖范围)
作用: 识别蛋白质与DNA互相作用情况
原理: 染色质免疫共沉淀 + 二代测序
应用: 常用于转录因子结合位点和组蛋白修饰位点的研究
2、测序对象:三种类型组蛋白(组蛋白、转录因子、转录调控子)
①组蛋白与DNA的结合是结构性的,结合强度非常大,分度高,是最容易做的蛋白
②TF直接与DNA结合,有序列特异性,比较短,只有几个bp,TF与DNA的结合牢固度,弱于组蛋白
③转录调控子:不直接和DNA互作,与TF或组蛋白互作,和DNA间接结合在一起,容易在交联剂上脱落(第一步),通常作为大蛋白复合体中的一员起作用,表面抗原容易被蛋白复合体中的其他蛋白组分所阻挡,从而影响抗体的富集(第二步)。
- 交联时间
- 研究表明;在DNA上的停留时间短于5秒的蛋白质无法用甲醛交联
- histone:10 min
- TF:10-30 min
- cofactor:30 min
- 不超过30min,防止影响解交联及后续的过程
- 对剪切条件的敏感性
- histone:low
- TF:medium
- cofactor:high
3、测序原理
(1)甲醛交联整个细胞系(组织),即使用甲醛将目标蛋白(组蛋白,转录因子等)与染色质交联固定起来
(2)从细胞裂解液分离基因组DNA,并用超声波将其打断成一定长度的小片段;
(3)添加与目标蛋白质特异的抗体,该抗体与目标蛋白形成免疫沉淀免疫结合复合体,收集这些沉淀;
免疫结合复合体 = 靶蛋白 + 抗体 + 靶蛋白结合的DNA
(4)去交联,分开蛋白与DNA,纯化DNA即得到染色质免疫沉淀的DNA样本,准备测序;
(5)将准备好的样本进行深度测序,测序完成得到数百万个reads,通过与参考基因组匹配后,实现完整序列的构建
4、检测蛋白质与DNA序列的结合峰
(1)测序片段匹配到参考基因组
- 将测序得到的 DNA 片段(sequenced fragments)匹配到参考基因组序列上。有一部分短序列不能匹配到参考基因组上,有可能是未知的基因组序列;另一部分是能够匹配到基因组上的短序列,通常要对这些短序列进行覆盖度计算。
- 从匹配到基因组上的短序列中进行富集区域的扫描。通常扫描到的富集区即被认为是蛋白质与DNA相互结合的区域(也有假阳性位点等的影响)如果在基因组的某个位置蛋白质结合的概率越大,那么在该位置检测到 DNA 片段堆叠就会越高。反之,如果没有蛋白结合,在该位置就会几乎没有DNA 片段堆叠。为了研究方便,我们将这些DNA片段堆叠叫做峰 (Peak)。
(2)检测峰
将覆盖到参考基因组的DNA片段堆叠用柱状图画出来,就会看到峰。
这里需要知道,ChIP-seq是利用抗体去结合特异的靶蛋白,进而去沉淀靶蛋白结合的DNA。理论上,只要抗体设计的好,与蛋白质结合的 DNA 的都可以检测到。
我们一般用 ChIP-seq 检测转录因子的结合,以及检测组蛋白修饰,二者有着截然不同的峰形:
转录因子结合的特征峰,峰型高,而且窄:
组蛋白修饰结合的特征峰,峰型起伏,而且分布广泛:
对扫描到的富集区做深度分析,包括基因,GO注释,利用基因浏览器进行可视化浏览,研究与基因结构的关系等。在UCSC基因组浏览器中显示。
(2)提高峰质量
一般在做ChIP-seq时,会加入一组空白对照(control),提高峰质量,那么为什么?
- 一般检测出的峰值会有背景噪音,也就是文库会夹渣一些没有用抗体捕获的DNA片段也被测序了。
- 开放的染色质区域比封闭的区域更容易断裂
- 序列在基因组中分布不均
- 允许我们在比对的控件中与相同区域进行比较
- 消除 ENCODE 的 Black list的影响
所以会准备空白对照,排除假阳性,对照组有有两种类型:
- input DNA:不用任何抗体捕获的DNA
- mock IP DNA:用不含有抗体的DNA
这样一来,就会让我们检测到的峰更明显更接近真实的生物学特征。
5、影响ChIPseq测序结果的因素
(1)免疫共沉淀的影响
- 高效特异性抗体
- 起始样本量
- ChIP DNA 产量
-细胞类型
-标记或蛋白质丰富程度(组蛋白比TF具有更高的结合覆盖率)
-抗体质量
对于组蛋白,使用来自T细胞的20ug染色质DNA作为起始材料,总共会得到15-50ng DNA。
对于TF,通常从2500万个细胞(200ug染色质)中得到5-25ng。
染色质片段
- 片段大小:影响ChIP-seq中的信噪比
- 因细胞类型而异
- 偏向启动子区域的片段会在ChIP 和对照样品中的启动子上引起ChIP-seq富集
(2)测序的影响
Reads 长度
- 较长的 Reads 和双末端 Reads 可提高匹配率
- 对于等位基因特异性染色质事件,转座因子研究是必需的
避免分批次
序列输入对照的深度等于或大于IP样本
测序深度
- 对于转录因子:最小5-10M
- 对于组蛋白修饰宽谱图则更高:标准为20-40M
(3)酶断裂方法和超声波打断的影响
酶解法:核小体间信息
最常用的酶类如MNase,即:微球菌核酸酶,是一种能降解核小体连接区的DNA序列的核酸酶,最初从金黄色葡萄球菌中分离出来。MNase消化染色质可以释放出一个个独立的核小体。
超声波法:核小体蛋白组分上的完整性
超声打断不如酶裂解法温和,由于打断的不均匀性,导致测序结果背景噪音高,影响后续数据分析
两种方法对实验结果有影响,各有优劣
如果所研究的蛋白质高丰度表达且与DNA结合紧密如组蛋白,那么样本无需交联,这时可使用酶解法
如果所研究的蛋白质表达丰度较低或与DNA结合不紧密如转录因子等,往往需要用交联试剂将样本进行固定,稳定蛋白质和DNA的形态,这时最好选用超声法进行断裂。
参考:
https://www.abcam.com/epigenetics/studying-epigenetics-using-chip
https://academic.oup.com/nar/article/42/9/e74/1248114
https://www.jianshu.com/p/e894626cbcbd
https://blog.csdn.net/E_gene/article/details/112191111?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2aggregatepagefirst_rank_v2~rank_aggregation-2-112191111.pc_agg_rank_aggregation&utm_term=chip%E6%8A%80%E6%9C%AF%E7%9A%84%E5%8E%9F%E7%90%86&spm=1000.2123.3001.4430
https://blog.csdn.net/weixin_30666943/article/details/96063992?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2aggregatepagefirst_rank_v2~rank_aggregation-6-96063992.pc_agg_rank_aggregation&utm_term=%E9%AB%98%E9%80%9A%E9%87%8F%E6%B5%8B%E5%BA%8F%E5%8E%9F%E7%90%86&spm=1000.2123.3001.4430
数据原理——1、ChIP-seq相关推荐
- 爬虫抓取页面数据原理(php爬虫框架有很多 )
爬虫抓取页面数据原理(php爬虫框架有很多 ) 一.总结 1.php爬虫框架有很多,包括很多傻瓜式的软件 2.照以前写过java爬虫的例子来看,真的非常简单,就是一个获取网页数据的类或者方法(这里的话 ...
- 图说二叉树添加数据原理以及遍历原理
一.图说二叉树添加数据原理 前提说明: 有一个学生类Student,属性:name,age; 排序:只实现age排序,即只要年龄相同则认为是相同对象(因为是说明添加原理,只要弄懂了最简单的一种,即使有 ...
- hbase原理与实践_JAVA连接HBase客户端及HBase写入数据和读取数据原理解析
JAVA连接HBase客户端 接着上篇文章进行代码的实践,从JAVA 客户端对 HBase的客户端进行一系列操作 工具类:HbaseUtil 静态代码块一次性创建连接对象 并赋值 返回连接对象 Con ...
- 《大数据原理与应用》林子雨:一. 大数据基础
<大数据原理与应用>林子雨:一. 大数据基础 思维导图 PS:边学边记 重点: 理解大数据的概念及其处理架构Hadoop 难点: 掌握大数据处理架构Hadoop的安装与使用方法 第1章 大 ...
- ZooKeeper学习笔记(八):ZooKeeper集群写数据原理
写数据原理 写流程直接请求发送给Leader节点 这里假设集群中有三个zookeeper服务端 ACK (Acknowledge character)即是确认字符,在数据通信中,接收站发给发送站的一种 ...
- python读写磁盘扇区数据有什么用_磁盘存放数据原理 - osc_v8xs2czi的个人空间 - OSCHINA - 中文开源技术交流社区...
磁盘结构作用数据原理 拓扑图 盘面(side) 模型: 1.磁盘圆形盘面,一个磁盘内含有多个盘面. 2.层叠关系,每个盘面之间不会贴着. 3.第一个盘的正面成为0面,反面为1面:第二个盘正面为2面,反 ...
- STM32串口接收不定长数据原理与源程序
**STM32串口接收不定长数据原理与源程序**CSDN上有很多关于STM32串口接收不定长数据的文章,但实际使用后发现照搬他们的代码,程序根本就不能正确接收数据,其中最关键的一句有问题.其余内容完全 ...
- 计算机网络学习--交换机和路由器转发数据原理
转自知乎: 作者:网工Fox 链接:https://www.zhihu.com/question/20099434/answer/1861866418 来源:知乎 著作权归作者所有.商业转载请联系作者 ...
- 大数据之-Hadoop之HDFS的API操作_写数据流程_上传数据原理剖析_案例---大数据之hadoop工作笔记0066
hdfs的数据流,的写入过程,也就是,文件从本地上传到hdfs的过程,我们来看原理. 1.首先第一步我们的客户端去向,我们的完全分布式集群,像namenode节点,发起一个文件上传请求,并且把要上传的 ...
- Hadoop大数据原理(2) - 分布式文件系统HDFS
文章目录 1. 数据存储问题 2. RAID技术的原理和思路 2.1 常用RAID的原理介绍 2.2 RAID间的性能比较 3. 大数据时代的分布式文件系统 3.1 HDFS的稳固地位 3.2 HDF ...
最新文章
- 新视界,你好!_只愿与一人十指紧扣_新浪博客
- Android 动态生成 EditTest
- 对话推荐系统_RSPapers | 对话推荐系统论文合集
- Java开发微信的6个步骤
- 如何统计JAVA网站访问次数并获得访问者IP
- androidtabhost缓存_FragmentTabHost布局的使用及优化方式
- 读取xml文件转成ListT对象的两种方法(附源码)
- gdal获取像元的灰度值java_GDAL利用地理坐标读取图像像元值
- 信息学奥赛C++语言:交换数值
- 【JAVA 第三章 流程控制语句】课后习题 找零钱
- 如何打造应对超大流量的高性能负载均衡?
- java只对_只对你情有独钟:写给Java的情诗
- 视频教程-java美妆商城项目|在线购书系统(java毕业设计项目ssm版)-Java
- Manjaro-KDE安装动态桌面插件
- 计算机中的windows任务管理器在哪,window任务管理器在哪,windows7如何重装
- APP服务器需要什么样的配置
- java中写html标签,java写html剔出标签
- 王炜:城市虚拟交通系统与交通发展决策支持模式研究
- 新用户启动Anaconda时,一直卡在loading applications
- static 的用法