到底什么是eQTL?

eQTL和QTL之间有什么联系?为什么说QTL比eQTL难很多?

QTL和GWAS有什么关系?

GTEx数据库里的eQTL数据如何利用?

说eQTL之前必须先解释QTL,QTL,一说到中文名就清楚了,数量性状位点,就是一个性状,比如身高,会由成百上千个基因来决定,目的简单明确,那么我们如何找到这些位点呢?

Quantitative Trait Locus (QTL) Analysis - 来自nature的介绍

实现层面,其实研究的不是基因,而是染色体上的区段,更明确的说就是分子标记,SNP最流行,大学里还学过很多烦人的分子标记。

关联是关键,association,基本假设就是遗传片段会跟表型一起分离。

通常极少数的loci具有很高的effect size。

选择足够纯的亲代(需要有基因型和表型的差异),然后不断杂交,后代的基因型和表型会不断的分离重组。

然后对基因组的每个位点做统计检验,得出likelihood ratio,从而得出初略的位点信息。

再最后用分子生物学的方法来narrow down有效区域。

想彻底理解背后的统计学思路还得好好啃几篇paper。

空说空看是不可能学扎实的,所以废话不多说,开始用R实操吧,在分析中你会理解越来越多的概念。

R/qtl: A QTL mapping environment

先装个包,然后library("qtl")

载入数据:data(hyper)

先看看genotype的数据:

行代表样品,也就是一个小鼠,列代表了marker,右边列出来的是marker在1号染色体上的位置cm。

0、1、2分别代表什么;0代表两个都是reference allele;1代表一个是reference allel、一个是alternative allele;2代表两个都是alternative allele。

这个要注意,由于真核大多都是非单倍体,所以通常都有2个或多个等位基因;但是参考基因组里只有一套等位基因,那个就是reference allel;如果要考虑多个等位基因,或者考虑haplotype则要做phasing。

再看看phenotype的数据:

可以看看油管的视频:Using R/qtl to analyze QTL data

可视化数据:

第一个图黑色代表缺失值,

最终我们会得到什么结果呢?


听过飞哥对eQTL的解释,就是相当于把每个基因的表达数据当做是一个phenotype,然后做关联分析,看哪些snp对基因的表达产生影响。

If a given genotype affects (decreases or increases) gene expression at the same locus of the genotype, it's called cis eQTL, if it affects expression at a different locus, trans eQTL.

An eQTL is a locus that explains a fraction of the genetic variance of a gene expression phenotype.

下图是一个典型的eQTL位点,它是在TSS两侧1M区间内,叫做cis-eQTL,下图可以看出三种基因型下表达有显著差异,表明该位点对基因表达有显著影响。

通常我们的说法是这个gene有哪些eQTL位点,通常只需要100个个体就可以了。trans eQTLs要难找得多,因为算法上需要扫描整个基因组区域。

做遗传都知道,做什么都要先把population考虑进去。17 per cent of genes were differentially expressed between populations。GxE互作也是老生常谈。

population minor allele frequency

为什么eQTL必须分组织来分析,因为gene expression signatures are cell-type specific。

cis eQTLs are cell-type specific,所以以上的话需要修正为“这个gene在这个组织里有哪些eQTL位点”。

这就表明某些snp只会影响某些特定的组织,以及致病。

These observations certify the importance of integrating data from a relevant tissue when trying to interpret GWAS results using gene expression as an intermediate phenotype.

An important caveat is that in several cases the same regulatory region and variant will be linked to one gene in one tissue and another gene in another tissue

Expression quantitative trait loci: present and future

看下GTEx数据怎么利用,GTEx Portal: Introduction to the Gene eQTL Visualizer

Genotype-Tissue Expression - GTEx Portal官网 里面都是cis-eQTL

输入一个基因后,会有一个主表出现,相当于heatmap,行是组织,列是eQTL,里面点的颜色代表NES,The size and color of the bubble represent the p-value and NES (normalized effect size) of the eQTL。

拖动上面的框到中间就会看到TSS和TES,底下的被蓝色框起来的灰色框代表了exon区域。

附图就是每个eQTL之间的LD score,黑色代表这些eQTL间并不是独立的,更趋向于连锁在一起。

点击某个eQTL就能看到具体的表达差异了。


一篇通俗的文章:eQTL

Expression quantitative trait loci (eQTLs) are genomic loci that explain all or a fraction of variation in expression levels of mRNAs.

基因组位点,解释了基因表达的变化。

A quantitative trait locus (QTL) is a section of DNA (the locus) which correlates with variation in a phenotype (the quantitative trait).

身高,连续性状的控制位点。

QTL是数量性状位点,比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点,而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点。

都是位点,一个是常规数量性状,如身高;另一个就是基因表达性状,如Sox10基因的表达;都是在找一些与其具有强烈相关性的(snp)位点。

QTL定位的核心就是连锁。

转载于:https://www.cnblogs.com/leezx/p/10795353.html

eQTL | Expression quantitative trait loci | 表达数量性状基因座 | QTL | 数量性状位点相关推荐

  1. 数量性状基因座QTL及其作图

    数量性状基因座作图原理与步骤 经典的数量遗传分析方法 ->只能分析控制数量性状表现的众多基因的综合遗传效应,无法准确鉴别基因的数目.单个基因在染色体上的位置和遗传效应 (1)数量性状基因座(QT ...

  2. 何为Referring Expression(指称表达)?

    因为在NLP学习过程中遇到了referring expression,所以记录一下. 一.定义 指称表达是指任何一个目的为识别某一特定人物.地点.事物的词或者短语.通常是一个名词.名词短语或者代词. ...

  3. (转载)最值得看的一维傅里叶分析(时域如何转频域)

    傅里叶分析之掐死教程(完整版)更新于2014.06.06 Heinrich 生娃学工打折腿 知乎日报收录 26,823 人赞同了该文章 作 者:韩 昊 知 乎:Heinrich 微 博:@花生油工人 ...

  4. 黑人是晒黑的吗_当您是互联网上的黑人时,无处可逃

    黑人是晒黑的吗 By A. Rochaun Meadows-Fernandez 作者:A.Rochaun Meadows-Fernandez There were no words to descri ...

  5. eQTL:连接突变与基因表达的桥梁

    欢迎关注"生信修炼手册"! 在高等生物中,很多的重要性状都为数量形状,比如农作物的产量,人类复杂疾病(高血液,糖尿病)等等.对于这些数量性状而言,往往受到多个基因的调控作用.为了更 ...

  6. 基因大数据的集成分析

    基因大数据的集成分析 胡湘红1, 彭衡2, 杨灿3, 张纵辉1, 万翔1, 罗智泉1 1 深圳市大数据研究院,广东 深圳 518172 2 香港浸会大学数学系,香港 999077 3 香港科技大学数学 ...

  7. GWAS理论 1-4 关联分析模型和常用软件介绍

    一.Case-Control 关联分析模型 (第一部分主要是在人类中) 卡方检验 举例 逻辑回归 逻辑混合模型 二.(动植物)数量性状关联分析模型 加性模型(GAM) 当线性模型的种种条件不能满足时, ...

  8. Sequential regulatory activity prediction across chromosomes with convolutional neural networks

    Sequential regulatory activity prediction across chromosomes with convolutional neural networks 基于卷积 ...

  9. GWAS研究基本概念2——Fine mapping

    有了GWAS公共数据后的下一步就是找因果变异(causal varision),这篇文章介绍fine-mapping精细映射 和gene prioritization基因排序,简单一句话就是 tran ...

最新文章

  1. ASP.NET MVC – 样式和布局简介
  2. 让LwIP拥有PING其他设备的能力
  3. 在每个运行中运行多个查询_Spring Data JPA的运行原理及几种查询方式
  4. java arraybound out_java – 获取ArrayIndexOutOfBound:1异常
  5. Python案例:求满足条件的人数
  6. 【蜕变之路】第15天 Eclipse常用问题 (2019年3月5日)
  7. 经典好文!java继承父类注解
  8. k8s重要概念及部署k8s集群
  9. CSA云安全指南V4.0 D9 D10
  10. excel柱状图粗细怎么调_【EXCEL图表当中的柱状图怎么加粗,太细了。】excle柱状图怎么调整...
  11. python画流程_使用Graphviz快速绘制流程图
  12. android中timepicker 常用属性,android – 如何读取TimePicker选择的值?
  13. SRE 到底是干什么的??
  14. hadoop HDFS 流式传输及JAVA API实现代码
  15. cai_VBA植物大战僵尸2Total Control自动刷金币
  16. 虚幻四C++入坑指南09:C++实现FPS游戏(3)Pitch Yaw Roll的作用 视角旋转 跳跃
  17. 用DirectX12绘制一个几何体的程序详述
  18. 字符串匹配算法 之 Aho-Corasick
  19. 车市冷车道 这6款紧凑车苦坐板凳寻伯乐(一)
  20. 关于fiddle开启https证书协议源码

热门文章

  1. 对某邮件盗号诈骗团队的追踪分析和研究
  2. DSPE-PEG-SP94/APRPG/蛋白多肽/TH/TAT 穿膜肽/R8/RGD/HAIYPRH/KRWWKWWRR 磷脂-聚乙二醇-多肽定制
  3. 编程将输入的百分制成绩转换为五分制成绩输出
  4. vue Cli3官网地址
  5. JAXWS CXF GlobalWeather + MyEclipse + Maven + Dom4j Byron自學視頻05
  6. 第五章 USB2.0布线及注意事项
  7. U3D Animator 组件控制动画的播放暂停,动态添加帧事件
  8. 如何测linux传输文件的速度,如何测试linux服务器的上传下载速度
  9. swiper的使用教程
  10. 获取Windows 10上文件资源管理器的帮助