1:缺失比例(Missing

rates):(

GENO > 0.05 )

Shortly we will

apply more stringent criteria, such that GENO > 0.05. In this

case, 0.05*89 = 4.45 samples, meaning that if a SNP is missing in

4.45 more more samples, that SNP will be removed from the

dataset.

2:最小等位基因频率(Minor

Allele frequencies)(

MAF< 0.03 如果SNP较多可以设置为MAF<0.05)

MAF

is the Minor Allele Frequency. It can be used to exclude SNPs which

are not informative because they show little variation in the

sample set being analyzed. For instance, if a SNP shows variation

in only 1 of the 89 individuals, it is not useful statistically and

should be removed.

3:Removing SNPs

out of Hardy-Weinberg equilibrium(p-value > 10−6 -

10−4

)

Population

genetic theory suggests that under ‘normal’ conditions, there is a

predictable relationship between allele frequencies and genotype

frequencies. In cases where the genotype distribution is different

from what one would expect based on the allele frequencies, one

potential explanation for this is genotyping error. Natural

selection is another explanation. For this reason, we typically

check for deviation from Hardy-Weinberg equilibrium in the controls

for a case- control study. For a quantitative trait, PLINK just

uses everyone. The following command generates p-values for

deviation from HWE for each SNP. Low p-values indicate that a SNP

is out of HWE.

4:如果你有vcf文件,可以先用vcftools转换为plink的输入形势,输出结果为:.bed与.map文件,然后以此作为输入进行过滤:

vcftools --vcf

my.vcf --plink --out plink

plink

--noweb --file plink --geno 0.05 --maf 0.05 --hwe 0.0001 --make-bed

--out QC

参考文献:

Roshyara N R,

Kirsten H, Horn K, et al. Impact of pre-imputation SNP-filtering on

genotype imputation results[J]. BMC genetics, 2014, 15(1):

1.

Pongpanich M,

Sullivan P F, Tzeng J Y. A quality control algorithm for filtering

SNPs in genome-wide association studies[J]. Bioinformatics, 2010,

26(14): 1731-1737.

gwas snp 和_GWAS学习笔记4---SNP过滤相关推荐

  1. 学习笔记——数据库(过滤搜索2:正则表达式)

    MySQL 正则表达式 MySQL仅支持多数正则表达式实现的一个很小的子集 基本字符匹配 关键词 REGEXP 用于表明该关键字后面的字符串为 正则表达式. . 是正则表达式语言中的一个特殊字符,表示 ...

  2. gwas snp 和_GWAS分析中:为何有些SNP效应值大却不显著?

    之前的GWAS分析中,我查看结果时有过这个疑问,随着不断的学习理解,我已经知道了为什么,这里将我思考的结果分享一下. 1. 错误的理解 某一个SNP,效应值(Effect)越大,就越显著??? 「事实 ...

  3. gwas snp 和_GWAS分析原理浅谈

    引言 遗传学的研究成功地找到了很多致病突变体,这些突变体是指染色体上的变异位点.GWAS(全基因组关联分析)试图找到染色体上的变异位点,并研究这些变异位点与疾病或其它性状的关联. GWAS常用的方法是 ...

  4. Plink GWAS学习笔记

    目录 0 准备 1 遗传数据的质量控制 1.1 对个体及SNP缺失率进行筛选 1.2 性别质控 1.3 最小等位基因频率MAF 1.4 哈温平衡检验 1.5 杂合率检验 1.6 去掉亲缘关系近的个体 ...

  5. GWAS学习笔记(一):质量控制(QC)

    本系列文章采用的数据集与代码来自https://github.com/MareesAT/GWA_tutorial. 该教程获得了许多人的推荐,是一份很详细的step-by-step guide. 本文 ...

  6. RNA-seq流程学习笔记(7)-使用Hisat2进行序列比对

    参考文章: RNAseq(4)–Hisat2进行序列比对及Samtools格式转化 RNA-seq(5):序列比对:Hisat2 hisat2比对软件将reads比对到参考基因组 hisat2比对 R ...

  7. AMBA CHI协议学习笔记2-Link层

    [本系列文章是我自己对CHI协议的学习笔记,仅供参考,欢迎指正.] [文中的红色字体是我自己的标注] 一.CHI的六种通道 CHI的通道,有收/发两个方向,在发送方向上,有三个通道分别是REQ,WDA ...

  8. oracle学习笔记(二)--创建数据库

    Oracle创建数据库 先用向导看看好使不,开始菜单中Oracle - OraDb10g_home1 | Configuration and Migration Tools | Database Co ...

  9. Oracle 学习笔记,,,经验总结整理的。。。

    cmd进入: 1. D:\oracle\ora92\bin> 2. sqlplus /nolog 3. conn sys/sys as sysdba sqlplus进入: username:sy ...

  10. PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 call

    您的位置 首页 PyTorch 学习笔记系列 PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 发布: 2017年8月4日 7,195阅读 ...

最新文章

  1. 替换元素和非替换元素的学习
  2. java 单线程改多线程_帮我把单线程的程序改成多线程JAVA,急!
  3. 信息系统项目管理师考前冲刺第一天:项目基础知识和立项管理
  4. JQUERY项目所用插件
  5. 【Boost】boost库asio详解6——boost::asio::error的用法浅析
  6. 从GAN到WGAN到LipschitzGA
  7. 输入身份证号,输出出生日期
  8. git-bisect last updated in 2.19.1【转】
  9. UVa 1588 - Kickdown(BUG)
  10. bzoj 3361: [Usaco2004 Jan]培根距离
  11. 下载并安装IDA Pro 7.0
  12. hadoop 运行过程中出现Call to localhost/127.0.0.1:9000 failed on connection exception错误。
  13. php curl怎么设置cookie,curl php正确设置cookie
  14. 前端之jquery基础
  15. 计算机英语2000带英标
  16. 给我“空降”一个弟兄
  17. 乱七八糟的pwn入门(六)——5.passcode
  18. MFC 子对话框多了任务栏图标?
  19. win10 桌面颜色变成灰色
  20. [多点触控测试]不用app,手机怎么测试屏幕触控点数

热门文章

  1. 一起学Kubernetes——设计概览
  2. 计算机内打不开小米路由器,win7系统无法访问小米路由器的解决方法
  3. arm开发板开发环境搭建
  4. 窄带传输与LoRa扩频传输技术应用方案对比
  5. CentOS7下ldap的安装
  6. 斟杯春秋雨,平过四季
  7. 不同大小硬盘对拷oracle,硬盘对拷方式克隆时必须注意一个大问题
  8. Visual C++ 2010 第4章 数组、字符串和指针
  9. 摄影曝光基础——光圈、快门、ISO
  10. CSS+DIV 网页重构技术