欢迎关注”生信修炼手册”!

针对复杂疾病,通过GWAS研究可以识别到大量的疾病易感位点,然而这些位点绝大多数都属于微效位点,单个或者少数几个位点对疾病的效应较弱,无法准确的预测疾病。为了更好的研究患病风险,我们需要综合多基因位点的信息。在这个基础上,提出了多基因风险评分的概念。

多基因风险评分,对应的英文如下

polygenic risk score

简称PRS, 计算公式如下

其中i表示SNP位点,m表示SNP位点的总数,β表示该SNP位点对于疾病的效应,j表示该SNP位点的基因型,分别用0,1,2表征没有突变,杂合突变和纯合突变,ω表示每种基因型的频率。从公式可以看出,PRS值是所有疾病相关位点效应值的总和。在计算PRS时,有以下两个关键步骤

  1. SNP位点的选择,采用GWAS分析的p值作为阈值来筛选SNP位点,通常会有多个阈值

  2. SNP位点权重的计算,常用OR值或者回归分析的beta值作为SNP位点对疾病效应的权重

PRS结合了所有疾病关联位点的效应值,更加适合预测个体的患病风险,在实际分析中,计算PRS的流程如下

首先将数据集分为两个部分,base data和target data。其中base data提供了GWAS分析的结果,如p值,beta或者OR值等,用于构建模型;而target data提供了部分样本的基因型和表型数据,用基于base data构建的模型来预测这部分样本的患病风险。

在建模之前,需要对数据进行质控,可以参考GWAS的质控标准。同时还需要注意,两个数据集的样本必须是独立的,不存在重复样本,即一个样本不能同时出现在base data和target data中。接下来计算PRS, 需要考虑连锁不平衡的调整,beta收缩,pvalue阈值选取等因素,然后计算PRS值,并进行PRS和表型之间的关联分析,最后使用两个数据集进行交叉验证。

可以进行PRS分析的软件有很多,PRSice是使用的最为广泛的一款。在后续会详细介绍其用法。

·end·

—如果喜欢,快分享给你的朋友们吧—

往期精彩

  • 自己动手进行逻辑回归,你也可以!

  • GWAS大家都知道,Gene-Based GWAS你了解吗?

  • 3步搞定GWAS中的Gene Set Analysis

  • 你听说过Epistasis吗?

  • GWAS中的Gene-Gene Interactions如何分析?看这里

  • 终于搞清楚了Lasso回归和Ridge回归的区别

  • odd ratio置信区间的计算,你学会了吗?

  • 多元回归分析存在多重共线性了怎么办?

  • 基因型与表型的交互作用如何分析,多元回归来搞定

  • 曼哈顿图就够了吗?你还需要LocusZoom

  • GWAS做完了,下一步做什么?

GWAS meta分析

  • GWAS样本量不够怎么办,meta分析了解一下

  • 你没看错,搞定GWAS meta分析只需一行代码!

  • meta分析的森林图不会画?看这里

  • GWAMA:GWAS meta-analysis的又一利器

  • 点击鼠标即可完成GWAS meta分析,任何人都可以!

  • 用R进行gwas meta分析,原来如此简单

基因型填充

  • GWAS中的genotype imputation简介

  • 基因型填充中的phasing究竟是什么

  • 基因型填充前的质控条件简介

  • 使用shapeit进行单倍型分析

  • gtool:操作genotype data的利器

  • 使用IMPUTE2进行基因型填充

  • 使用Beagle进行基因型填充

  • 使用Minimac进行基因型填充

  • 使用Eagle2进行单倍型分析

  • X染色体的基因型填充

  • 文献解读|不同基因型填充软件性能的比较

  • Haplotype Reference Consortium:最大规模的单倍型数据库

  • Michigan Imputation Server:基因型填充的在线工具

CNV分析

  • aCGH芯片简介

  • aCGH芯片分析简介

  • 基于SNP芯片进行CNV分析中的基本知识点

  • PennCNV:利用SNP芯片检测CNV

  • DGV:人类基因组结构变异数据库

  • dbvar:染色体结构变异数据库

  • DGVa:染色体结构变异数据库

  • CNVD:疾病相关的CNV数据库

  • DECIPHER:疾病相关的CNV数据库

  • 全基因组数据CNV分析简介

  • 使用CNVnator进行CNV检测

  • 使用lumpy进行CNV检测

  • CNVnator原理简介

  • WES的CNV分析简介

  • XHMM分析原理简介

  • 使用conifer进行WES的CNV分析

  • 使用EXCAVATOR2检测WES的CNV

  • 靶向测序的CNV分析简介

  • 使用CNVkit进行CNV分析

  • DECoN:最高分辨率的CNV检测工具

TCGA

  • TCGA数据库简介

  • 使用GDC在线查看TCGA数据

  • 使用gdc-client批量下载TCGA数据

  • 一文搞懂TCGA中的分析结果如何来

  • 通过GDC Legacy Archive下载TCGA原始数据

  • 使用GDC API查看和下载TCGA的数据

  • 使用GDC下载TCGA肿瘤患者的临床信息

  • 使用TCGAbiolinks下载TCGA的数据

  • 使用TCGAbiolinks进行生存分析

  • 使用TCGAbiolinks分析TCGA中的表达谱数据

  • 使用TCGAbiolinks进行甲基化和转录组数据的联合分析

  • Broad GDAC:TCGA数据分析中心

  • 使用cBioPortal查看TCGA肿瘤数据

  • UCSC  Xena:癌症基因组学数据分析平台

  • GEPIA:TCGA和GTEx表达谱数据分析平台

  • TANRIC:肿瘤相关lncRNA数据库

  • SurvNet:基于网络的肿瘤biomarker基因查找算法

  • TCPA:肿瘤RPPA蛋白芯片数据中心

  • TCGA Copy Number Portal:肿瘤拷贝数变异数据中心

生存分析

  • 生存分析详细解读

  • 用R语言进行KM生存分析

  • 使用OncoLnc进行TCGA生存分析

  • 用R语言进行Cox回归生存分析

  • 使用kmplot在线进行生存分析

肿瘤数据库

  • ICGC:国际肿瘤基因组协会简介

  • HPA:人类蛋白图谱数据库

  • Oncomine:肿瘤芯片数据库

  • ONGene:基于文献检索的肿瘤基因数据库

  • oncomirdb:肿瘤相关的miRNA数据库

  • TSGene:肿瘤抑癌基因数据库

  • NCG:肿瘤驱动基因数据库

  • mutagene:肿瘤突变频谱数据库

  • CCLE:肿瘤细胞系百科全书

  • mSignatureDB:肿瘤突变特征数据库

  • GTEx:基因型和基因表达量关联数据库

肿瘤免疫和新抗原

  • Cancer-Immunity Cycle:肿瘤免疫循环简介

  • TMB:肿瘤突变负荷简介

  • 肿瘤微环境:Tumor microenvironment (TME)简介

  • 肿瘤浸润免疫细胞量化分析简介

  • 使用EPIC预测肿瘤微环境中免疫细胞构成

  • TIMER:肿瘤浸润免疫细胞分析的综合网站

  • quanTIseq:肿瘤浸润免疫细胞定量分析

  • The Cancer Immunome Atlas:肿瘤免疫图谱数据库

  • 肿瘤新抗原简介

  • TSNAdb:肿瘤新抗原数据库

  • 使用NetMHCpan进行肿瘤新抗原预测分析

Hi-C数据分析

  • chromosome-territories:染色质疆域简介

  • chromosome conformation capture:染色质构象捕获技术

  • 3C的衍生技术简介

  • 解密Hi-C数据分析中的分辨率

  • A/B compartment:染色质区室简介

  • TAD:拓扑关联结构域简介

  • chromatin loops:染色质环简介

  • Promoter Capture Hi-C:研究启动子区染色质互作的利器

  • 使用HiCUP进行Hi-C数据预处理

  • Juicer:Hi-C数据处理分析的利器

  • Juicer软件的安装详解

  • Juicebox:Hi-C数据可视化利器

  • Juicer实战详解

  • HiC-Pro:灵活的Hi-C数据处理软件

  • HiC-Pro实战详解

  • 3D Genome Browser:Hi-C数据可视化工具

  • HiCPlotter:Hi-C数据可视化工具

  • 3CDB:基于3C技术的染色质互作信息数据库

  • 3DIV:染色质空间互作数据库

  • 4DGenome:染色质相互作用数据库

  • 4D nucleome project:染色质三维结构研究必不可少的参考项目

  • 3dsnp:SNP在染色质环介导的调控网络中的分布数据库

  • iRegNet3D:疾病相关SNP位点在三维调控网络中的作用

  • 使用WashU Epigenome Browser可视化hi-c数据

  • HiGlass:高度定制的Hi-C数据可视化应用

  • Hi-C Data Browser:Hi-C数据浏览器

  • 使用FitHiC评估染色质交互作用的显著性

  • 使用TADbit识别拓扑关联结构域

  • 使用pyGenomeTracks可视化hi-c数据

  • hi-c辅助基因组组装简介

  • 文献解读|使用hi-C数据辅助埃及伊蚊基因组的组装

chip_seq数据分析

  • Chip-seq简介

  • chip_seq质量评估之计算样本间的相关性

  • chip_seq质量评估之查看抗体富集效果

  • chip_seq质量评估之PCA分析

  • chip_seq质量评估之coverage分析

  • chip_seq质量评估之FRiP Score

  • chip_seq质量评估之cross correlation

  • chip_seq质量评估之文库复杂度

  • depth, bedgraph, bigwig之间的联系与区别

  • bigwig归一化方式详解

  • 使用igvtools可视化测序深度分布

  • 使用UCSC基因组浏览器可视化测序深度分布数据

  • 使用deeptools查看reads分布特征

  • 使用phantompeakqualtools进行cross correlation分析

  • blacklist regions:NGS测序数据中的黑名单

  • MACS:使用最广泛的peak calling软件之一

  • MACS2 peak calling实战

  • 使用SICER进行peak calling

  • 使用HOMER进行peak calling

  • peak注释信息揭秘

  • PAVIS:对peak区域进行基因注释的在线工具

  • 使用UPORA对peak进行注释

  • 使用GREAT对peak进行功能注释

  • annoPeakR:一个peak注释的在线工具

  • 使用ChIPpeakAnno进行peak注释

  • 使用ChIPseeker进行peak注释

  • 使用PeakAnalyzer进行peak注释

  • 使用homer进行peak注释

  • 利用bedtools预测chip_seq数据的靶基因

motif

  • 关于motif你需要知道的事

  • 详解motif的PFM矩阵

  • 详解motif的PWM矩阵

  • 使用WebLogo可视化motif

  • 使用seqLogo可视化motif

  • 使用ggseqlogo可视化motif

  • MEME:motif分析的综合性工具

  • 使用MEME挖掘序列中的de novo motif

  • 使用DREME挖掘序列中的de novo motif

  • 使用MEME-ChIP挖掘序列中的de novo motif

chip_seq数据库

  • ENCODE project项目简介

  • FactorBook:人和小鼠转录因子chip_seq数据库

  • ReMap:人类Chip-seq数据大全

  • IHEC:国际人类表观基因组学联盟

  • Epifactors:表观因子数据库

  • GTRD:最全面的人和小鼠转录因子chip_seq数据库

  • ChIP-Atlas:基于公共chip_seq数据进行分析挖掘

  • Cistrome DB:人和小鼠的chip_seq数据库

  • chipBase:转录因子调控网络数据

  • unibind:human转录因子结合位点数据库

  • chip_seq在增强子研究中的应用

  • DENdb:human增强子数据库

  • VISTA:人和小鼠的增强子数据库

  • EnhancerAtlas:人和小鼠的增强子数据库

  • FANTOM5:人类增强子数据库

  • TiED:人类组织特异性增强子数据库

  • HEDD:增强子疾病相关数据库

  • HACER:human增强子数据库

  • SEdb:超级增强子数据库简介

  • dbSUPER:人和小鼠中的超级增强子数据库

  • dbCoRC:核心转录因子数据库

  • 使用ROSE鉴定超级增强子

18年文章目录

  • 2018年推文合集

扫描下方二维码,关注我们,解锁更多精彩内容!

生物信息入门

只差这一个

公众号

polygenic risk score:多基因风险评分相关推荐

  1. [文献分享] 父母炎症性肠病与儿童自闭症(国家登记数据队列研究、连锁不平衡分数回归、多基因风险评分、孟德尔随机化)

    文献来源:Sadik A, Dardani C, Pagoni P, et al. Parental inflammatory bowel disease and autism in children ...

  2. PRS多基因风险评分的几个算法

    之前体验了一下impute.me的基因检测分析服务,其内容之丰富和详尽让我感到吃惊.基本上涵盖了几乎所有有影响的GWAS研究结果(GWAS-Catalog等来源),于是我感到很好奇,他的评估计算方法, ...

  3. GWAS - PRS多基因风险评分计算学习笔记

    一.安装PRSice(mac版) 经试验我觉得直接从git hub中下载对应的安装包是最快的:https://github.com/choishingwan/PRSice,下载之后解压,解压文件如图所 ...

  4. 多基因风险预测模型2--相关概念和软件

    计算PRS时,设计到的概念和常用的软件,这里整理一下. 1. PRS和GRS PRS,polygenic risk score,多基因风险评分 GRS,genetic risk score,遗传风险评 ...

  5. 小微数字风控必学-冷启动开发风险评分(含实操)

    新产品上线,往往只能使用规则进行审批与授信.能不能拦住风险是一回事,老板报以不信任的目光更使得风控从业人员倍受挫折.我们提供一个迁移学习风险评分开发方案,尝试在冷启动阶段就完成风险评分的开发. 假定某 ...

  6. 如何应对数据匮乏,试试冷启动阶段开发的风险评分

    前言: 在模型开发过程中,或多或少都会遇到在生产过程中非常常见的问题就是模型样本开发不足.特别是在一些数据策略的冷启动阶段,而关于这些我们之前的文章都有以下内容: ①讲解经典专家评分卡怎么实操 ②两种 ...

  7. 数据分析 - 美国金融科技公司Prosper的风险评分分析

    数据分析 - 美国金融科技公司Prosper的风险评分分析 今年Reinhard Hsu觉得最有意思的事情,是参加了拍拍贷第二届魔镜杯互联网金融数据应用大赛.通过"富爸爸队",认识 ...

  8. 代价函数Cost Function ,损失函数Loss Function,经验风险empirical risk,期望风险expected risk,结构风险structural risk

    损失函数,代价函数,目标函数 损失函数(Loss Function )是定义在单个样本上的,算的是一个样本的误差. 代价函数(Cost Function )是定义在整个训练集上的,是所有样本误差的平均 ...

  9. R语言survival包coxph函数构建cox回归模型、ggrisk包ggrisk函数可视化Cox回归的风险评分图、使用风险得分的中位数计算最佳截断值cutoff(基于LIRI基因数据集)

    R语言survival包coxph函数构建cox回归模型.ggrisk包ggrisk函数可视化Cox回归的风险评分图.使用风险得分的中位数计算最佳截断值cutoff(基于LIRI基因数据集) 目录

最新文章

  1. 推荐7个最新发现的神仙网站,让人心动!
  2. mx3 android 5.1,魅族MX3揭晓:猎户座处理器5.1寸屏幕
  3. 根文件系统使用登录模式
  4. kubernetes英语怎么读_陷阱英语单词怎么读?
  5. 北京黑马计算机培训宿舍图案,黑马经典图形!
  6. [XSY3320] string (AC自动机,哈希,点分治)
  7. DCF:A Dataflow-Based Collaborative Filtering Trainging Algorithm
  8. AtomicInteger 的使用
  9. 【codevs1079】回家
  10. 计算机科学创新大赛,计信学院举办第六届科技创新小发明大赛
  11. 《Servlet和JSP学习指南》一第1章 Servlet 1.1 Servlet API概述
  12. matlab 绘制一个二维正弦曲线(repmat)
  13. ccs软件5.5安装
  14. Qt绘制中国地图轮廓边界
  15. 非常规方法彻底删除System Volume Information.exe
  16. Android应用测试方法总结
  17. 微软surface屏幕测试软件,【微软 Surface Pro 3 平板电脑使用感受】屏幕|软件_摘要频道_什么值得买...
  18. 大数据和java的区别
  19. html内边距的顺序,html中内边距和外边距之间的区别是什么? - 收获啦
  20. 苏州博物馆计算机系统操作工,行车及铁钢包调度系统在炼钢厂应用.doc

热门文章

  1. 高中分班考试如何计算机,高中分班是怎么分的
  2. 抓包工具mitmproxy和Anyproxy
  3. fcpx使用教程:final cut pro 导出视频的图文方法
  4. 学习CBAP业务分析是每个BA从业者的必经阶段——SITC上海信息化培训中心
  5. OpenGL中gl,glu,glut的关系(扩展)
  6. vcruntime140.dll丢失的解决方法,vcruntime140.dll下载安装教程
  7. 免安装免费绿色录屏软件 ffmpeg.
  8. Leetcode447(力扣447):回旋镖的数量
  9. gedit命令和vim异常退出处理
  10. 造福全球眼疾患者的技术 出现可辨识眼疾的AI系统