GWAS数据分析专题
欢迎关注”生信修炼手册”!
全基因组关联分析是目前研究复杂疾病易感性的最有效手段之一,通过芯片或者高通量测序得到全基因组规模的SNP分析结果,再结合卡方,费舍尔精确检验,线性回归等统计方法,快速分析与表型相关联的SNP位点。本文整理了GWAS数据分析相关的资料。
GWAS芯片是常用的SNP分型平台,但是其位点相比全基因组还是不够,此时可以通过基因型填充技术提高SNP位点数目
GWAS中的genotype imputation简介
基因型填充中的phasing究竟是什么
基因型填充前的质控条件简介
使用shapeit进行单倍型分析
使用Eagle2进行单倍型分析
Haplotype Reference Consortium:最大规模的单倍型数据库
使用IMPUTE2进行基因型填充
使用Beagle进行基因型填充
使用Minimac进行基因型填充
文献解读|不同基因型填充软件性能的比较
Michigan Imputation Server:基因型填充的在线工具
对分型结果进行质控后,就可以进行了GWAS分析了。GWAS的基本分析中设计到了卡方检验,费舍尔精确检验,线性回归,逻辑回归等统计方法
卡方检验在关联分析中的应用
费舍尔精确检验在关联分析中的应用
Cochran-Armitage趋势检验在关联分析中的应用
Cochran-Mantel-Haenszel检验在关联分析中的应用
odd ratio值在关联分析中的含义
线性回归的这些细节,你都搞明白了吗?
没想到你是这个样子的置信区间
逻辑回归or线性回归,傻傻分不清楚
自己动手进行逻辑回归,你也可以!
odd ratio置信区间的计算,你学会了吗?
多元回归分析存在多重共线性了怎么办?
对于GWAS的分析结果,最常见的图表就是QQ图和曼哈顿图,以及locuszoom
一文搞懂Q-Q plot图的含义
3分钟掌握曼哈顿图的绘制
曼哈顿图就够了吗?你还需要LocusZoom
传统的GWAS分析对象为SNP, 还可以进一步在gene, pathway等水平来进行关联研究
GWAS大家都知道,Gene-Based GWAS你了解吗?
3步搞定GWAS中的Gene Set Analysis
GWAS做完了,下一步做什么?
meta分析可以整合多个gwas分析的结果,增大样本量,提高检验效能
GWAS样本量不够怎么办,meta分析了解一下
你没看错,搞定GWAS meta分析只需一行代码!
meta分析的森林图不会画?看这里
GWAMA:GWAS meta-analysis的又一利器
点击鼠标即可完成GWAS meta分析,任何人都可以!
用R进行gwas meta分析,原来如此简单
也可以将基因和基因之间的互作,基因和环境因素之间的互作考虑进来,一起分析
基因型与表型的交互作用如何分析,多元回归来搞定
你听说过Epistasis吗?
GWAS中的Gene-Gene Interactions如何分析?看这里
终于搞清楚了Lasso回归和Ridge回归的区别
用R进行Lasso regression回归分析
多因子降维法MDR分析GxG, GxE交互作用
MDR多因子降维分析实战
MDR的进阶版本-GMDR
GWAS除了识别与表型关联的位点,还有很多应用
polygenic risk score:多基因风险评分
使用PRSice进行多基因风险评分分析
什么是SNP遗传力?
LDSC:连锁不平衡回归分析
LDSC分析实战
不会linux也没关系,点击鼠标即可完成的LDSC分析来了
想要进行gene prioritization分析,请看这里!
衡量样本亲缘关系,除了IBD你还知道哪些方法?
Linear Mixde Model:线性混合模型简介
一文掌握inbreeding coefficient近交系数的计算
使用GCTA的GREML评估SNP遗传力
GWAS经过这么多年的发展,有很多已发表的公开数据集被收录到数据库中
GWAS ATLAS:最全面的GWAS数据库
GWAS公开结果哪里找,GWAS Catalog来帮忙
GWAS要求的样本量很大,可以看到别人发表的高分文章中样本量在几千到几万的水平,整个实验的话费是比较高昂的。在GWAS的分析中,核心就是各种统计学方法的应用。
·end·
—如果喜欢,快分享给你的朋友们吧—
往期精彩
自己动手进行逻辑回归,你也可以!
GWAS大家都知道,Gene-Based GWAS你了解吗?
3步搞定GWAS中的Gene Set Analysis
你听说过Epistasis吗?
GWAS中的Gene-Gene Interactions如何分析?看这里
终于搞清楚了Lasso回归和Ridge回归的区别
odd ratio置信区间的计算,你学会了吗?
多元回归分析存在多重共线性了怎么办?
基因型与表型的交互作用如何分析,多元回归来搞定
曼哈顿图就够了吗?你还需要LocusZoom
GWAS做完了,下一步做什么?
GWAS meta分析
GWAS样本量不够怎么办,meta分析了解一下
你没看错,搞定GWAS meta分析只需一行代码!
meta分析的森林图不会画?看这里
GWAMA:GWAS meta-analysis的又一利器
点击鼠标即可完成GWAS meta分析,任何人都可以!
用R进行gwas meta分析,原来如此简单
基因型填充
GWAS中的genotype imputation简介
基因型填充中的phasing究竟是什么
基因型填充前的质控条件简介
使用shapeit进行单倍型分析
gtool:操作genotype data的利器
使用IMPUTE2进行基因型填充
使用Beagle进行基因型填充
使用Minimac进行基因型填充
使用Eagle2进行单倍型分析
X染色体的基因型填充
文献解读|不同基因型填充软件性能的比较
Haplotype Reference Consortium:最大规模的单倍型数据库
Michigan Imputation Server:基因型填充的在线工具
CNV分析
aCGH芯片简介
aCGH芯片分析简介
基于SNP芯片进行CNV分析中的基本知识点
PennCNV:利用SNP芯片检测CNV
DGV:人类基因组结构变异数据库
dbvar:染色体结构变异数据库
DGVa:染色体结构变异数据库
CNVD:疾病相关的CNV数据库
DECIPHER:疾病相关的CNV数据库
全基因组数据CNV分析简介
使用CNVnator进行CNV检测
使用lumpy进行CNV检测
CNVnator原理简介
WES的CNV分析简介
XHMM分析原理简介
使用conifer进行WES的CNV分析
使用EXCAVATOR2检测WES的CNV
靶向测序的CNV分析简介
使用CNVkit进行CNV分析
DECoN:最高分辨率的CNV检测工具
TCGA
TCGA数据库简介
使用GDC在线查看TCGA数据
使用gdc-client批量下载TCGA数据
一文搞懂TCGA中的分析结果如何来
通过GDC Legacy Archive下载TCGA原始数据
使用GDC API查看和下载TCGA的数据
使用GDC下载TCGA肿瘤患者的临床信息
使用TCGAbiolinks下载TCGA的数据
使用TCGAbiolinks进行生存分析
使用TCGAbiolinks分析TCGA中的表达谱数据
使用TCGAbiolinks进行甲基化和转录组数据的联合分析
Broad GDAC:TCGA数据分析中心
使用cBioPortal查看TCGA肿瘤数据
UCSC Xena:癌症基因组学数据分析平台
GEPIA:TCGA和GTEx表达谱数据分析平台
TANRIC:肿瘤相关lncRNA数据库
SurvNet:基于网络的肿瘤biomarker基因查找算法
TCPA:肿瘤RPPA蛋白芯片数据中心
TCGA Copy Number Portal:肿瘤拷贝数变异数据中心
生存分析
生存分析详细解读
用R语言进行KM生存分析
使用OncoLnc进行TCGA生存分析
用R语言进行Cox回归生存分析
使用kmplot在线进行生存分析
肿瘤数据库
ICGC:国际肿瘤基因组协会简介
HPA:人类蛋白图谱数据库
Oncomine:肿瘤芯片数据库
ONGene:基于文献检索的肿瘤基因数据库
oncomirdb:肿瘤相关的miRNA数据库
TSGene:肿瘤抑癌基因数据库
NCG:肿瘤驱动基因数据库
mutagene:肿瘤突变频谱数据库
CCLE:肿瘤细胞系百科全书
mSignatureDB:肿瘤突变特征数据库
GTEx:基因型和基因表达量关联数据库
肿瘤免疫和新抗原
Cancer-Immunity Cycle:肿瘤免疫循环简介
TMB:肿瘤突变负荷简介
肿瘤微环境:Tumor microenvironment (TME)简介
肿瘤浸润免疫细胞量化分析简介
使用EPIC预测肿瘤微环境中免疫细胞构成
TIMER:肿瘤浸润免疫细胞分析的综合网站
quanTIseq:肿瘤浸润免疫细胞定量分析
The Cancer Immunome Atlas:肿瘤免疫图谱数据库
肿瘤新抗原简介
TSNAdb:肿瘤新抗原数据库
使用NetMHCpan进行肿瘤新抗原预测分析
Hi-C数据分析
chromosome-territories:染色质疆域简介
chromosome conformation capture:染色质构象捕获技术
3C的衍生技术简介
解密Hi-C数据分析中的分辨率
A/B compartment:染色质区室简介
TAD:拓扑关联结构域简介
chromatin loops:染色质环简介
Promoter Capture Hi-C:研究启动子区染色质互作的利器
使用HiCUP进行Hi-C数据预处理
Juicer:Hi-C数据处理分析的利器
Juicer软件的安装详解
Juicebox:Hi-C数据可视化利器
Juicer实战详解
HiC-Pro:灵活的Hi-C数据处理软件
HiC-Pro实战详解
3D Genome Browser:Hi-C数据可视化工具
HiCPlotter:Hi-C数据可视化工具
3CDB:基于3C技术的染色质互作信息数据库
3DIV:染色质空间互作数据库
4DGenome:染色质相互作用数据库
4D nucleome project:染色质三维结构研究必不可少的参考项目
3dsnp:SNP在染色质环介导的调控网络中的分布数据库
iRegNet3D:疾病相关SNP位点在三维调控网络中的作用
使用WashU Epigenome Browser可视化hi-c数据
HiGlass:高度定制的Hi-C数据可视化应用
Hi-C Data Browser:Hi-C数据浏览器
使用FitHiC评估染色质交互作用的显著性
使用TADbit识别拓扑关联结构域
使用pyGenomeTracks可视化hi-c数据
hi-c辅助基因组组装简介
文献解读|使用hi-C数据辅助埃及伊蚊基因组的组装
chip_seq数据分析
Chip-seq简介
chip_seq质量评估之计算样本间的相关性
chip_seq质量评估之查看抗体富集效果
chip_seq质量评估之PCA分析
chip_seq质量评估之coverage分析
chip_seq质量评估之FRiP Score
chip_seq质量评估之cross correlation
chip_seq质量评估之文库复杂度
depth, bedgraph, bigwig之间的联系与区别
bigwig归一化方式详解
使用igvtools可视化测序深度分布
使用UCSC基因组浏览器可视化测序深度分布数据
使用deeptools查看reads分布特征
使用phantompeakqualtools进行cross correlation分析
blacklist regions:NGS测序数据中的黑名单
MACS:使用最广泛的peak calling软件之一
MACS2 peak calling实战
使用SICER进行peak calling
使用HOMER进行peak calling
peak注释信息揭秘
PAVIS:对peak区域进行基因注释的在线工具
使用UPORA对peak进行注释
使用GREAT对peak进行功能注释
annoPeakR:一个peak注释的在线工具
使用ChIPpeakAnno进行peak注释
使用ChIPseeker进行peak注释
使用PeakAnalyzer进行peak注释
使用homer进行peak注释
利用bedtools预测chip_seq数据的靶基因
motif
关于motif你需要知道的事
详解motif的PFM矩阵
详解motif的PWM矩阵
使用WebLogo可视化motif
使用seqLogo可视化motif
使用ggseqlogo可视化motif
MEME:motif分析的综合性工具
使用MEME挖掘序列中的de novo motif
使用DREME挖掘序列中的de novo motif
使用MEME-ChIP挖掘序列中的de novo motif
chip_seq数据库
ENCODE project项目简介
FactorBook:人和小鼠转录因子chip_seq数据库
ReMap:人类Chip-seq数据大全
IHEC:国际人类表观基因组学联盟
Epifactors:表观因子数据库
GTRD:最全面的人和小鼠转录因子chip_seq数据库
ChIP-Atlas:基于公共chip_seq数据进行分析挖掘
Cistrome DB:人和小鼠的chip_seq数据库
chipBase:转录因子调控网络数据
unibind:human转录因子结合位点数据库
chip_seq在增强子研究中的应用
DENdb:human增强子数据库
VISTA:人和小鼠的增强子数据库
EnhancerAtlas:人和小鼠的增强子数据库
FANTOM5:人类增强子数据库
TiED:人类组织特异性增强子数据库
HEDD:增强子疾病相关数据库
HACER:human增强子数据库
SEdb:超级增强子数据库简介
dbSUPER:人和小鼠中的超级增强子数据库
dbCoRC:核心转录因子数据库
使用ROSE鉴定超级增强子
18年文章目录
2018年推文合集
扫描下方二维码,关注我们,解锁更多精彩内容!
生物信息入门
只差这一个
公众号
GWAS数据分析专题相关推荐
- Python科研数据分析专题之缺失值填补
保姆级教程 | Python科研数据分析专题(三) 缺失值填补 提取出X2的非缺失的部分,即交易日数据 填补缺失值1:补0 填补缺失值2:用平均值填充 填补缺失值3:前向/后向填充 缺失值填补 Sim ...
- 宏基因组数据分析专题之展望与数据质控
宏基因组数据分析专题之展望与数据质控 导读 宏基因组测序(Metagenomics Sequencing)是以特定环境下的微生物群落作为研究对象,对该样品中所包含的全部微生物总的DNA进行测序 从而使 ...
- 【空气质量数据分析专题九】污染物浓度小时变化分析
前言 对空气质量小时级别五年数据进行小时变化分析,可以看出污染物浓度在一天中逐小时变化的特征. 分析流程 对数据进行专题二的预处理后,计算出各污染物全时段的各小时的平均浓度,最后进行可视化分析.处理方 ...
- TCGA肿瘤数据分析专题
欢迎关注"生信修炼手册"! 癌症作为人类健康的头号杀手,其研究的意义不言而喻.目前世界范围内已经有大量的肿瘤相关数据,鉴于公共数据库的数据挖掘成为一种趋势. GEO是一个国际化的开 ...
- DNA甲基化数据分析专题
欢迎关注"生信修炼手册"! DNA 甲基化作为重要的表观遗传学的标记,能够调控基因的表达,在生长发育和疾病相关研究领域都有着重要意义.测定甲基化的手段有很多,芯片作为一种成熟的手段 ...
- mRNA数据分析专题
欢迎关注"生信修炼手册"! mRNA是基因实时表达的产物,研究mRNA可以探究基因表达以及调控的规律:同时也可以用于发现基因结构的变化,比如可变剪切,融合基因等事件,本文整理了mR ...
- miRNA数据分析专题
欢迎关注"生信修炼手册"! miRNA是一类长度在18到36bp的非编码RNA, 其功能属于转后后修饰调控,主要通过和mRNA的3'UTR区进行结合,结合区域称之为`seed`,当 ...
- Python科研数据分析专题之正态性检验
数据的正态性检验 Sim_Jackson | 2023 在时间序列预测类的论文中应用较多 # 导入需要的第三方库 import pandas as pd import os import warnin ...
- 数据分析专题报告范文6篇_专题报告格式及范文(共6篇).doc
专题报告格式及范文(共6篇) 专题报告格式及范文(共6篇) XXXXXX 英文 作者姓名四号仿宋,中间全角逗号隔开 英文姓名五号Times New Roman,标点半角,姓大写,名首字母大写两字之间用 ...
最新文章
- 随机生成6位图片验证码
- SAP MM 如何看一个Inbound Delivery单据相关的IDoc?
- 让Windows Server 2008+IIS 7+ASP.NET突破默认限制,支持海量并发连接数
- SqlDependency学习笔记
- 数据中心空调系统应急方案
- hbase shell 查看列名_hbase shell 命令行的操作
- Python编码规范:IF中的多行条件
- HashMap底层理解(上)
- Android 系统(40)Handler的基本概念
- 子类重载父类函数_Python面向对象之继承、重写与重载
- VB.Net工作笔记001---用ASP调用VB.NET编写的dll_ClassLibrary
- java后台生成excel_Java后台生成Excel前台下载
- docker mysql扩容_docker pull mysql 时报错,说空间不足
- Linux 虚拟机配置静态IP地址
- java 正则表达式匹配冒号_用于匹配与冒号连接的单词对的正则表达式
- c语言 十进制转换成二进制 递归实现
- BigDecimal表示0.1
- 支小蜜智慧食堂刷脸就餐让学生不再刷卡吃饭
- kaggle 共享单车项目数据分析和单车租赁数预测
- 微信H5纯签约 提示“发起签约页面非法”