Genome-wide enhancer maps link risk variants to disease genes

文章目录

  • Genome-wide enhancer maps link risk variants to disease genes
  • 前言
    • 1.Overview of approach
    • 2.Enhancer-gene connections
    • 3.CRISPRi-FlowFISH
    • 4.ABC model
    • 5.The ABC model is generally applicable across cell types
    • 6.Dose ABC connect IBD variants to known cell types and gene?
    • 7.PPIF

前言

今天分享的是今年4月发表在nature的一篇文章。这篇文章是麻省理工学院和哈佛大学博德研究所的Eric S.Lander与斯坦福大学遗传学系的Jesse M. Engreitz合作取得最新进展。


1.Overview of approach

该研究创建了开发了一种名为ABC模型(activity-by-contact)的新模型绘制出了131种人类细胞类型和组织中超过600万个增强子-基因图谱,阐明了疾病变体的功能;并揭示了炎症性肠病IBD的新基因和新途径,揭示了577个通过不同细胞类型的作用控制不同性状的基因,并确定了PPIF增强子在调节巨噬细胞线粒体功能中的作用,使用CRISPR扰动在几种细胞类型中进行了验证。

文章有两个亮点:

1、涉及72种疾病和复杂特征,利用ABC模型将5,036个GWAS信号与2,249个独特基因相关联,其中包括577个基因类,最终在131种人类细胞类型和组织中创建了增强子-基因图,并用于解释GWAS变体的功能;
2、针对炎症性肠病(IBD),已通过该图谱揭示了基因组调控的原理,即确认了包含IBD风险变体并调节PPIF的表达改变巨噬细胞中线粒体的膜电位的增强子 。

2.Enhancer-gene connections

  预测enhancer和gene的connection十分复杂,connection具有cell type的特异性,并且connection的方向和距离都不相同,还存在一对多的情况,将疾病变体的影响考虑进去,更是增加了预测的难度。

3.CRISPRi-FlowFISH

  研究人员提出了一种实验方法CRISPRi-FlowFISH,该方法的关键在于基于目标基因的表达并且通过CRISPRi和荧光原位杂交技术(FISH)来测量候选增强子功能。CRISPRi-FlowFISH结合了CRISPRi(一种基因干扰技术)和FISH(荧光原位杂交技术,一种基因染色技术),通过干扰目标基因附近的候选增强子核苷酸序列,并量化这些序列对目标基因的影响。其主要原理是gRNA可以引导KRAB-dCas9与特定核苷酸序列结合,抑制该序列表达。通过这种方法,可以得到enhancer和gene之间的link(红色的线),并且得到peaks和组蛋白H3K27ac的值,这些值可以得到enhancer的位置。目前已有基于增强子与目标基因的方法、基于基因组三维特征的方法和基于表观基因组特征的机器学习方法用于预测增强子和目标基因之间的功能性连接,其表现均不尽人意。

4.ABC model

  Fulco团队提出了ABC模型,该模型基于简单的生物化学概念:一种远端候选元素对目标基因的定量影响应该取决于它作为增强子的活性(Activity),加权于它与目标基因启动子的3D接触频率(Contact);一个远端候选元素对目标基因表达的相对贡献应该取决于该元素的定量影响除以所有元素的总定量影响。在这个概念下,得到远端候选元素E对目标基因G的相对贡献值公式。计算步骤,

  1. 增强子活性(A)取远端候选元素核苷酸序列上DHS和H3K27ac ChIP–seq 的几何平均值,这两个参数被用于识别增强子。
  2. 接触频率©取5 kb分辨率下,远端候选元素E与目标基因G上启动子之间的由Hi-C实验法测得的KR归一化接触频率。

  下面是通过ABC model预测三个gene和7个enhancer调控的举例,activity为DHS和H3K27ac ChIP–seq 的几何平均值,contact frequency通过Hi-C矩阵获得,计算获得ABC 分数。下面的Measured Effect是通过CRISPR测量得到的具体值。第二种gene PVT1中特定的enhancer,接触频率高很多。第三种gene CCDC26,可以看到,enhancer5是唯一对它有调控作用的gene。将以上结果绘图,可以得到他们的E-G调控Map,可以看到他们之间的调控很复杂,一些enhancer skip了PVT1区调控MYC,并且存在多个enhancer调控同一个gene的关系。

在K562cell中,不同的距离下都有E-G的link,并且调控对gene的表达量影响也不同。如图是IBD相关基因增强子之间的连接的precision-recall图,分析了其中一个基因的1 Mb范围内的37个非编码可信集,并测试了ABC-Max或其他方法将已知基因优先于基因座所有其他基因的频率。

5.The ABC model is generally applicable across cell types

  因为Hi-C data获取非常的昂贵,并且在不同的cell type中变化不大,文章中将不同的cell type的Hi-C矩阵取平均并扩展到更多的cell type中。研究人员利用activity-by-contact(ABC)模型在131个人类生物样品中构建了全基因组的增强子-基因关联图,包括来自ENCODE Project 和其他来源的74种不同的原代细胞、组织和细胞系;在131个生物样品中,研究人员确定了23,219个表达基因和269,539个独特增强子的6,316,021个增强子-基因关联,并通过利用CRISPR扰动比较来验证上述增强子-基因关联预测,其中包括5,755种经过测试的11种细胞类型和状态的元素-基因对。

6.Dose ABC connect IBD variants to known cell types and gene?

  IL10是一种抗炎症细胞因子,是一种在免疫调节和炎症中具有多效性的细胞因子。在小鼠中进行的基因敲除研究表明,这种细胞因子在肠道中是必需的免疫调节剂。在这个基因周围,有两个疾病变体,每个都有大概50%的可能性,是基因的risk变体。这两个变体都与一些enhancer重叠,第二种只在后面几种cell type中与enhancer重叠。利用ABC model,可以看到他们之间的link具有细胞特异性,同时ABC model将一个远端的risk变体的link到了IL10基因上。

  首先为评估增强子-基因关联图谱在将疾病变体与功能联系起来的能力,研究人员对GWAS变体在ABC增强子中的富集进行了量化,并进行精细映射分析。如图1所示,精细映射的GWAS变体在与每个性状相关的细胞类型中显示出ABC增强子中的显着富集,且ABC图谱可以将精细映射的变体准确连接到IBD和其他复杂性状的靶基因,即ABC可以识别与特定表型相关的细胞类型和基因。

  37个非编码可信集上,一些方法对比发现,最高ABC得分(ABC-Max),表现最好。对于每个特征,在丰富的生物样本中,研究人员针对与ABC增强子相交的精细映射变体(PIP≥10%),将每个可信组分配给具有最高ABC得分(ABC-Max)的目标基因。

7.PPIF

  为了探索ABC图谱如何加速实验研究,以确定单个GWAS基因位点的特征,研究人员检测了染色体10q22.3的炎症性IBD风险位点,ABC图谱确认了一个优先级基因。如图所示,高概率变异体(rs1250566,PIP = 19%)位于ZMIZ1的内含子中,在几种免疫细胞类型中与ABC增强子重叠,发现了调节PPIF表达的14种增强子,其中只有一个包含精细映射的IBD变体,并且该增强子对PPIF表达具有显著作用,而PPIF编码亲环素D,可通过控制线粒体通透性和线粒体膜电位,调节代谢、活性氧信号传导和细胞死亡。随后研究人员利用CRISPR干扰实验确认该增强子通过PPIF可以调节细胞中响应炎症刺激的线粒体的代谢状态;除此之外,PPIF具有极其复杂的增强子态势,除IBD之外还包含针对39种其他疾病和性状的GWAS信号,意味着PPIF的细胞类型特异性转录调控可能影响多种复杂疾病和性状。



  下图是通过CRISPRi实验得到的一些结果。在静止和刺激条件下,CRISPR -i在e-PPIF上对免疫细胞系中PPIF表达的影响。数据是平均值±平均值的95%置信区间。使用Benjamini-Hochberg校正法(* P <0.05)进行了双向学生t检验,比较了814个阴性对照gRNA对164个靶向e-PPIF的CRISPRi gRNA。从左到右调整的P值:4.68×10 -101,4.86 ×10 -112,0.019,0.044和1.48×10 -71。d,CRISPRi gRNAs的影响(针对电子PPIF,PPIF上Δ启动子或阴性对照)ψ米,量化为THP1细胞携带具有高的MitoTracker红信号(扩展数据图进行比较的是具有低的那些gRNAs的频率。10F –h)。显示了log 2转化的细胞部分(未经刺激的对照处理)。我们在未刺激的条件下测试了THP1细胞,用LPS刺激,并用佛波12-肉豆蔻酸酯13-乙酸酯(PMA)分化,并用LPS刺激(方法)。数据分别为对照,PPIF和e-PPIF的40、9和5个gRNA平均值的平均值±95%置信区间。双面Wilcoxon秩和检验;* P = 0.0163,P = 0.00426,* P = 0.000356,相对于对照。

  对于IBD和12个血细胞性状,它们在我们的数据集中具有更好的相关细胞类型覆盖率,ABC增强子包含732个PIP≥95%的非编码变体中的46%。如今研究人员利用来自其中一名参与者的数据产生了100多张增强子-基因图谱。

  文章将所有的增强子-基因图谱做了可视化,上面可以选择rick变体和gene,下面是相关的ABC分数,可用做筛选,右边是相关的DNA可及性数据。以上所有的network,dataset和locus都已可视化并且可以在网址https://www.engreitzlab.org/resources下载。

全基因组尺度的增强子--靶基因映射图谱解码非编码突变相关推荐

  1. 基因调控分析之非编码RNA

    ​​非编码RNA简介 非编码 RNA (ncRNA) 是由基因组转录而成的不编码蛋白质的 RNA 分子.非编码 RNA 除了在转录和转录后水平上发挥作用外,还在基因表达的表观遗传学调控中发挥重要作用. ...

  2. 易基因|14种全基因组DNA甲基化测序(WGBS)标准分析比对软件的比较| 生信专区

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 全基因组重亚硫酸盐测序(WGBS)是甲基化研究的重要技术.尽管已经开发了一系列工具来解决由亚硫酸盐处理引起的比对问题,但尚未对最新可用工 ...

  3. 大熊猫源致病大肠杆菌CCHTP全基因组测序及耐药和毒力基因分析

    大熊猫源致病大肠杆菌CCHTP全基因组测序及耐药和毒力基因分析 邓雯文1,李才武1,赵思越2,李仁贵1,何永果1,吴代福1,杨盛智2,黄炎1,张和民1,邹立扣2 1. 中国大熊猫保护研究中心,大熊猫国 ...

  4. 易基因:全基因组DNA甲基化和小RNA分析揭示甘蓝型油菜种子的基因组不对称性 | 植物发育

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 多倍体是被子植物基因组进化中的一种持续现象,有助于现存开花植物的多样性.甘蓝型油菜(Brassica napus)是世界上最重要的被子植 ...

  5. 易基因:全基因组DNA甲基化分析揭示DNMT1在斑马鱼模型听觉系统发育中的作用 | 胚胎发育

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 听力障碍通常与内耳发育不全或损伤有关,是影响生活质量的严重健康问题.因此研究听觉器官发生过程中的关键基因对于探索听力损伤的潜在策略至关重 ...

  6. Nature | 基因组定位涉及精神分裂症的基因和突触生物学

    导读 精神分裂症的遗传率为60 - 80%,其中大部分可归因于常见的风险等位基因.在一项分阶段的全基因组关联研究中,共有76755名精神分裂症患者和243649名对照个体,该研究报告了287个不同基因 ...

  7. 易基因|病毒抗性:全基因组DNA甲基化揭示草鱼年龄相关病毒易感性的表观遗传机制

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 2022年06月02日,淡水生态与生物技术国家重点实验室(中国科学院水生生物研究所)何利波副研究员为第一作者和通讯作者,汪亚平研究员为共 ...

  8. 易基因技术推介|全基因组重亚硫酸盐甲基化测序(WGBS)

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因.今天跟大家介绍一下易基因的王牌产品:全基因组重亚硫酸盐甲基化测序(WGBS). 全基因组重亚硫酸盐甲基化测序(WGBS)可以在全基因组范围 ...

  9. DAP-seq技术鉴定全基因组水平上的ZjVND7靶基因,揭示酸枣全基因组复制在调节木质部导管分化和耐旱性中的作用

    全基因组复制对生物体的影响是多方面的.全基因组加倍后,基因剂量效应.修饰的互作调控.快速遗传和表观遗传的修饰和变化,都会对基因组产生强烈影响,进而影响基因表达,最终导致形态.生理和适应性等性状方面的差 ...

最新文章

  1. 高分求FP-tree算法用Delphi实现
  2. 简述Core Location定位功能
  3. mysql 日志丢失_失而复得数据库日志文件丢失后的恢复
  4. SAP移动类型详细说明
  5. 解决:EXCEL复制粘贴,精度丢失
  6. HDU 3264 Open-air shopping malls
  7. 如何将同一云服务下的虚拟机从经典部署模型迁移到 Azure Resource Manager
  8. 二进制文本编辑器_Textadept for mac(文本编辑) v10.5免费版
  9. [机器学习导论]——第三课——神经网络Ⅰ
  10. echarts雷达图显示数值
  11. 语音合成(TTS)论文优选:HIERARCHICAL PROSODY MODELING FOR NON-AUTOREGRESSIVE SPEECH SYNTHESIS
  12. 绕过iframe busting
  13. Programming Ruby 读书笔记(七)
  14. NS3 Tutorial 中文版:第二章 资源
  15. 高分辨率屏幕下vm安装xp的解决方案
  16. Centos 修改 DNS 怎样生效
  17. c语言15-puzzle解法,15 Puzzle (4乘4谜题) IDA*(DFS策略与曼哈顿距离启发) 的C语言实现...
  18. 无畏先锋服务器没响应,LOL:为啥不删除“郊区”?无畏先锋人气惨淡,21分钟匹配不到人...
  19. 30年前他发明了万维网,现在他要颠覆互联网
  20. Android琐碎知识点,不断更新中

热门文章

  1. 初识LTE(五):完整的SISO LTE 物理层实现
  2. 电脑横机服务器维修,国产电脑横机操作和维修方法
  3. 教你如何搭建编译服务器安装加密系统
  4. 为什么读mba,读mba有用吗?
  5. 2021级-JAVA03 基础语法2--控制语句
  6. 论文悦读(1)——NVM文件系统之NOVA文件系统
  7. 清华大学计算机系刘知远学生,【新书】图神经网络导论,清华大学刘知远老师著作...
  8. 初试 Ceph 存储之块设备、文件系统、对象存储
  9. PS修图嘴斜和PS黑白照片
  10. 渤海财险开启国产数据库替代之路,MogDB助推EAST系统升级