【概念】等位基因相关概念辨析
【概念】等位基因相关概念辨析
- 1. major 与 minor allele
- 2. reference与 alternative allele
- 3. reference 与 risk/effect allele
Minor/alternative/effect/risk allele这些名词很容易混淆,早期的遗传统计学软件,例如plink并没有很重视allele概念上的明确区分,但近年新出的软件或旧软件的新版本为保证统一性已经开始注意此问题。
一些常见allele相关名词的辨析如下:
序号 | 等位基因1(A1) | 等位基因2(A2) | 解释 |
---|---|---|---|
1 | major allele | minor allele | 根据某一特定群体的等位基因频率来定义 |
2 | reference (ref) allele | alternative (alt) allele | 根据与参考基因组的等位碱基的异同进行定义 |
3 | reference (non-risk / non-effect / other) allele | risk / effect allele | 关联检验中常用的名词,注:效应等位≠风险等位,有时可能为保护效应 |
4 | A1 | A2 |
plink1.9 软件的.bim 文件,A1为 minor allele,A2为 major allele
|
5 | REF | ALT |
plink2 软件,REF 为 reference allele,ALT为 alternative allele
|
6 | A1 | A2 |
METAL 软件,A1为 tested allele,A2为 other allele
|
注:Minor allele/major allele 和 ref allele/alt allele真的半毛钱关系都没有。前者指在特定人群/样本下,频率低的就定义为minor,而后者完全不关心频率,只看参考基因组定义哪个是ref,所以minor和major都可以是ref或者alt。
1. major 与 minor allele
Major allele 与 minor allele 通常是针对某一大小确定的特定群体而言,频率最高的allele为该群体的major allele, 频率次高的为 minor allele,对于最常见的 bi-allelic SNP来说,两个allele频率一高一低,就是这个群体中这个SNP的major和minor allele,对于tri- 或者quad-allelic SNP (位点有三种或四种碱基的SNP)而言,minor allele则是频率第二高的那个allele。
注意:
(1) 区分major与minor的依据:某一大小确定特定群体的 allele 频率;
(2) plink1.9目前采用的是major与minor allele的概念,软件会自动计算频率,对原始数据进行操作时会自动改变allele的排序,如果使用plink1.9 的--frq
选项计算频率,输出文件中的MAF (minor allele frequency),不会高于0.5。
plink1.9 中,A1为minor,A2为major allele,故 MAF (minor allele frequency) 是指A1 (minor allele) 的频率。
CHR SNP A1 A2 MAF NCHROBS
1 SNP1 T C 0.1258 10000
1 SNP2 A G 0.1258 10000
2. reference与 alternative allele
Reference allele 在这里是指某一参考基因组上该位点的allele,该位点上其他的allele则称为alternative allele。注意,这里reference 与 alternative allele与频率无关,唯一的决定因素是所选的参考基因组。参考基因组上的allele多为major allele,但这只是巧合,不能以此为依据将major和 reference allele划上等号,也有部分reference allele在该群体中为minor allele。
与plink1.9不同,plink2使用的概念则是reference 与 alternative allele,进行操作时不会自动依据频率而改变ref与alt的排序,使用plink2 的--frq
选项计算频率,输出文件中的是alternative allele frequency (不是MAF),取值范围为[0,1]。
#CHROM ID REF ALT ALT_FREQS OBS_CT
1 SNP1 T C 0.8742 10000
1 SNP2 G A 0.1258 10000
plink2 中则明确区分了reference 与 alternative allele的概念,例如上述的两个SNP,根据参考基因组比对后,SNP1在参考基因组中的ref为T,那么alt就为C,这里计算的alt的频率为0.8742,按概念来说在该群体中,SNP1的T为ref allele,但却又是minor allele , 而C为alt,却又是major。 对于SNP2来说ref 则为 major,alt 为minor。
# 将自己手头数据的ref与alt allele与对应参考基因组比对
plink2 \--bfile testfile \--ref-from-fa -fa hg19.fasta \ # 从参考基因组的fasta文件来决定plink文件中的ref--make-bed \--out testfile_fa
3. reference 与 risk/effect allele
同样是reference allele,在与 risk/effect allele并列时,则指的是GWAS关联检测中的reference allele (other、non-risk 或者 non-effect allele),也就是估计效应量beta(或odds ratio)时的参考组,概念上与上述ref与alt的组合无关,但为了保持统一性,近年来研究中关联检验的reference 也会与 reference genome保持一致,以避免混淆(注意:早期多以minor allele为关联检验的ref allele,这也是容易产生混淆的点)。
Risk allele 则是对疾病发生有贡献的allele (OR>1)。在复杂疾病的研究中,一般情况下risk allele常为minor allele,但也会有例外。Effect allele的概念类似,是对疾病或表型产生效应的allele,关联检验结果中effect一栏指的就是effect allele的效应,既可能是保护效应也可能是危险效应。
参考阅读:
major/minor/reference/alternative/risk/effect allele 概念解析
【概念】等位基因相关概念辨析相关推荐
- 数字化与数据化——概念界定与辨析
来源:创新科技杂志社 本文约16000字,建议阅读20+分钟本文介绍了神经科学和机器学习的进一步发展.近年来,信息技术迅猛发展,人类社会正在由工业时代迈入以数字化为特征的数字时代. [ 摘要 ] 针对 ...
- 增值翻译系列谈(01)——概念界定和辨析
增值翻译系列谈(01)--概念界定和辨析 高巍(w-gao@263.net) 1 译者的主要责任是什么? 答:译者的主要责任并不是"译"好某些文字,而是为了委托者(即客户)的最大利 ...
- 基本概念/MM相关概念
[一]主数据和业务数据的概念 SAP系统将相对静态的数据或者资料称为"主数据"(Master Data),如客户.物料.价格.信用.这些数据一旦建立,只在需要变动 ...
- 什么是容器、什么是docker、docker与虚拟机的对比、docker做什么、运行场景,Docker功能和组件,Docker的C/S模式的运行,Docker概念,相关概念
1.什么是容器 简单来说容器是一种内核技术的虚拟化体现(Cgroup和Namespace),容器可以在核心CPU上运行本地指令,有效的将单个操作系统进行分组管理和隔离. 2.什么是Docker 一种容 ...
- html里的标签的概念,HTML相关概念的介绍及HTML5结构和标签
HTML 指的是 超文本标记语言 (Hyper Text Markup Language) XHTML 指可扩展超文本标记语言(EXtensible HyperText Markup Languag ...
- 诺特定理:物理世界中的守恒定律与对称性关系
数学方程不仅实用,很多还非常优美.许多科学家承认,他们经常喜欢特定的公式,不仅仅是因为它们功能强大,还因为它们形式优雅.简洁及其中所蕴涵着诗一般的真理. 在这里,L表示拉格朗日量,它代表一个物理系统的 ...
- 物联网常见概念总结(期末复习)
物联网复习 文章目录 物联网复习 理论部分 第一章:概述 物联网是什么? 物联网的主要特点与相关概念辨析 物联网体系结构 物联网的应用场景 第二章:自动识别技术 自动识别技术的种类: 条形码技术:最早 ...
- Java 多线程基本概念
多线程基本概念 线程相关概念 Java多线程 继承Thread类创建线程 实现Runnable接口创建线程 使用Callable和Future创建线程 多线程以上创建方式区别 使用继承Thread类的 ...
- GIS地图学习笔记一之基础概念
要做GIS地图的开发,我们需要先了解GIS地图相关的概念. 相关概念可以在这里了解-->ArcGIS 帮助库 本文是从上述网站中学习,摘抄的. 基础概念 地理信息系统 (GIS) 是以可视化和分 ...
最新文章
- linux下安装expect解决方法
- (0045) iOS 开发之MBProgressHUD 源码学习
- 我用的/etc/vimrc
- 51Nod2353 排队问题
- CMDB 设计(二)实现host、ip存储
- 发布订阅模式 仿写Vue事件监听手写js实现
- 产品铭牌要求_AMPULM:电力变压器铭牌有哪些主要技术参数,你都知道吗?
- djnago 模型 新建对象id为空
- ROS 2正式版终于来了,还增加了这些新特性
- 长沙理工计算机安全基础试题,长沙理工大学数字电子技术基础试卷数电试卷题库参考答案(01-10)...
- 无人机4G数传一站多机模式
- oracle数据库基础知识
- vcpkg 详细介绍
- 什么是hadoop?
- Android 读取本地图片文件和读取图片的uri
- 限制性定语从句和非限制性定语从句的四大区别
- signature=f2fd61184b3328e471644f6fd3617f29,IPSEC-×××-CA
- 【IDL】使用IDL对Landsat系列进行批量水体提取
- note3+5.0+Android软件正在升级,波兰先行!三星为Note4推送Android 5.0升级
- 故地重游,今天陪母亲找到了她在1975年知青下乡的住所。
热门文章
- B2B从销售到深度协作
- 20131012-Actel公司申请License的方法
- 深度学习前沿算法思想
- 计算机丢失d3dcompile,电脑d3dcompiler43.dll文件丢失怎么办 文件丢失解决方法
- 出现这个错误的解决方法No enclosing instance of type 类名 is accessible. Must qualify the allocation with
- Java写一个excel工具类_Java中Excel写操作工具类--Java免费学习网
- Linux----软件安装及程序管理
- 微信分享链接的缩略图和标题
- 通信端口感叹号_解决通用串行总线控制器总是有感叹号的办法
- BZOJ3356 : [Usaco2004 Jan]禁闭围栏