gwas snp 和_GWAS学习笔记4---SNP过滤
1:缺失比例(Missing
rates):(
GENO > 0.05 )
Shortly we will
apply more stringent criteria, such that GENO > 0.05. In this
case, 0.05*89 = 4.45 samples, meaning that if a SNP is missing in
4.45 more more samples, that SNP will be removed from the
dataset.
2:最小等位基因频率(Minor
Allele frequencies)(
MAF< 0.03 如果SNP较多可以设置为MAF<0.05)
MAF
is the Minor Allele Frequency. It can be used to exclude SNPs which
are not informative because they show little variation in the
sample set being analyzed. For instance, if a SNP shows variation
in only 1 of the 89 individuals, it is not useful statistically and
should be removed.
3:Removing SNPs
out of Hardy-Weinberg equilibrium(p-value > 10−6 -
10−4
)
Population
genetic theory suggests that under ‘normal’ conditions, there is a
predictable relationship between allele frequencies and genotype
frequencies. In cases where the genotype distribution is different
from what one would expect based on the allele frequencies, one
potential explanation for this is genotyping error. Natural
selection is another explanation. For this reason, we typically
check for deviation from Hardy-Weinberg equilibrium in the controls
for a case- control study. For a quantitative trait, PLINK just
uses everyone. The following command generates p-values for
deviation from HWE for each SNP. Low p-values indicate that a SNP
is out of HWE.
4:如果你有vcf文件,可以先用vcftools转换为plink的输入形势,输出结果为:.bed与.map文件,然后以此作为输入进行过滤:
vcftools --vcf
my.vcf --plink --out plink
plink
--noweb --file plink --geno 0.05 --maf 0.05 --hwe 0.0001 --make-bed
--out QC
参考文献:
Roshyara N R,
Kirsten H, Horn K, et al. Impact of pre-imputation SNP-filtering on
genotype imputation results[J]. BMC genetics, 2014, 15(1):
1.
Pongpanich M,
Sullivan P F, Tzeng J Y. A quality control algorithm for filtering
SNPs in genome-wide association studies[J]. Bioinformatics, 2010,
26(14): 1731-1737.
gwas snp 和_GWAS学习笔记4---SNP过滤相关推荐
- 学习笔记——数据库(过滤搜索2:正则表达式)
MySQL 正则表达式 MySQL仅支持多数正则表达式实现的一个很小的子集 基本字符匹配 关键词 REGEXP 用于表明该关键字后面的字符串为 正则表达式. . 是正则表达式语言中的一个特殊字符,表示 ...
- gwas snp 和_GWAS分析中:为何有些SNP效应值大却不显著?
之前的GWAS分析中,我查看结果时有过这个疑问,随着不断的学习理解,我已经知道了为什么,这里将我思考的结果分享一下. 1. 错误的理解 某一个SNP,效应值(Effect)越大,就越显著??? 「事实 ...
- gwas snp 和_GWAS分析原理浅谈
引言 遗传学的研究成功地找到了很多致病突变体,这些突变体是指染色体上的变异位点.GWAS(全基因组关联分析)试图找到染色体上的变异位点,并研究这些变异位点与疾病或其它性状的关联. GWAS常用的方法是 ...
- Plink GWAS学习笔记
目录 0 准备 1 遗传数据的质量控制 1.1 对个体及SNP缺失率进行筛选 1.2 性别质控 1.3 最小等位基因频率MAF 1.4 哈温平衡检验 1.5 杂合率检验 1.6 去掉亲缘关系近的个体 ...
- GWAS学习笔记(一):质量控制(QC)
本系列文章采用的数据集与代码来自https://github.com/MareesAT/GWA_tutorial. 该教程获得了许多人的推荐,是一份很详细的step-by-step guide. 本文 ...
- RNA-seq流程学习笔记(7)-使用Hisat2进行序列比对
参考文章: RNAseq(4)–Hisat2进行序列比对及Samtools格式转化 RNA-seq(5):序列比对:Hisat2 hisat2比对软件将reads比对到参考基因组 hisat2比对 R ...
- AMBA CHI协议学习笔记2-Link层
[本系列文章是我自己对CHI协议的学习笔记,仅供参考,欢迎指正.] [文中的红色字体是我自己的标注] 一.CHI的六种通道 CHI的通道,有收/发两个方向,在发送方向上,有三个通道分别是REQ,WDA ...
- oracle学习笔记(二)--创建数据库
Oracle创建数据库 先用向导看看好使不,开始菜单中Oracle - OraDb10g_home1 | Configuration and Migration Tools | Database Co ...
- Oracle 学习笔记,,,经验总结整理的。。。
cmd进入: 1. D:\oracle\ora92\bin> 2. sqlplus /nolog 3. conn sys/sys as sysdba sqlplus进入: username:sy ...
- PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 call
您的位置 首页 PyTorch 学习笔记系列 PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 发布: 2017年8月4日 7,195阅读 ...
最新文章
- 替换元素和非替换元素的学习
- java 单线程改多线程_帮我把单线程的程序改成多线程JAVA,急!
- 信息系统项目管理师考前冲刺第一天:项目基础知识和立项管理
- JQUERY项目所用插件
- 【Boost】boost库asio详解6——boost::asio::error的用法浅析
- 从GAN到WGAN到LipschitzGA
- 输入身份证号,输出出生日期
- git-bisect last updated in 2.19.1【转】
- UVa 1588 - Kickdown(BUG)
- bzoj 3361: [Usaco2004 Jan]培根距离
- 下载并安装IDA Pro 7.0
- hadoop 运行过程中出现Call to localhost/127.0.0.1:9000 failed on connection exception错误。
- php curl怎么设置cookie,curl php正确设置cookie
- 前端之jquery基础
- 计算机英语2000带英标
- 给我“空降”一个弟兄
- 乱七八糟的pwn入门(六)——5.passcode
- MFC 子对话框多了任务栏图标?
- win10 桌面颜色变成灰色
- [多点触控测试]不用app,手机怎么测试屏幕触控点数