使用R/qtl进行QTL分析
使用R/qtl进行QTL分析
QTL分析是进行基因精细定位和克隆的基础,今天教大家使用R包" qtl "进行QTL分析。
在开始分析前,我们需要准备两个输入文件:基因型和表型文件。
基因型文件:
表型文件:
基因型和表型文件均保存为逗号分隔的csv文件。
准备好两个输入文件后,我们就可以开始分析啦!
安装R包
install.packages(“qtl”)
加载R包
library(“qtl”)
导入基因型和表型数据
sug <- read.cross(“csvs”, “.”, “gen.csv”, “phe.csv”)
查看输入文件相关信息
summary(sug)
此外,还有一些函数可以统计对应的信息。
样本数
nind(sug)
染色体数
nchr(sug)
标记数
totmar(sug)
每个染色体上的标记数
nmar(sug)
表型数
nphe(sug)
除了文字信息外,我们还可以用图来展示这些信息。
plot(sug)
这三张图分别展示了缺失的基因型数据,遗传图谱和表型数据分布。
也可以单独展示这三张图。
展示缺失基因型数据(黑色为缺失的基因型)
plotMissing(sug)
绘制遗传图谱
plotMap(sug)
绘制表型分布直方图
plotPheno(sug, pheno.col=1)
计算基因型概率
sug <- calc.genoprob(sug, step=1)
使用默认方法进行single-QTL全基因组扫描
out.em <- scanone(sug)
查看扫描结果
summary(out.em)
挑选LOD > 3的结果
summary(out.em, threshold=3)
展示结果
plot(out.em)
我们可以看到7号和15号染色体上各有一个显著的峰。
使用Haley-Knott回归方法进行全基因组扫描
out.hk <- scanone(sug, method=“hk”)
使用Multiple imputation法进行全基因组扫描
sug <- sim.geno(sug, step=1, n.draws=64)
out.imp <- scanone(sug, method=“imp”)
比较三种方法结果的差异
plot(out.em, out.hk, out.imp, col=c(“blue”, “red”, “green”))
我们可以看到,三种方法的结果并没有明显差异。
进行1000次Permutation test
operm <- scanone(sug, method=“hk”, n.perm=1000)
获得显著性阈值
summary(operm, alpha=c(0.05, 0.2))
从扫描结果中挑选显著的位点
summary(out.hk, perms=operm, alpha=0.2, pvalues=TRUE)
接下来,我们需要估计QTL区间。因为我们通过LOD值过滤后的QTL位点位于7号和15号染色体上,所以我们首先对7号染色体上的QTL区间的进行估计。
获得7号染色体1.5倍LOD区间和95%贝叶斯区间
lodint(out.hk, chr=7, drop=1.5)
bayesint(out.hk, chr=7, prob=0.95)
第一行和第三行是区间的范围,第二行是预测QTL的位置。
获得区间两侧最近的标记
lodint(out.hk, chr=7, expandtomarkers=TRUE)
bayesint(out.hk, chr=7, expandtomarkers=TRUE)
获得离QTL最近的标记
max(out.hk)
mar <- find.marker(sug, chr=7, pos=47.7)
统计不同基因型个体的表型
plotPXG(sug, marker=mar)
红色的点表示基因型进行过填补的个体。
统计不同基因型个体的效应
effectplot(sug, mname1=mar)
Tips:我们常说的LOD值=log10 (L1/L0) ,L1指该位点含QTL的概率,L0指该位点不含QTL的概率。LOD值为3表示该位点含QLT的概率是不含QTL概率的1000倍。
使用R/qtl进行QTL分析相关推荐
- R语言亚组分析 (Subgroup Analysis)及森林图绘制实战
R语言亚组分析 (Subgroup Analysis)及森林图绘制实战 目录 R语言亚组分析 (Subgroup Analysis)及森林图绘制实战 #亚组分析
- R语言伪相关性分析(Spurious Correlation)、相关关系不是因果关系:以哺乳动物数据集msleep为例
R语言伪相关性分析(Spurious Correlation):相关关系不是因果关系.相关关系不是因果关系.相关关系不是因果关系 #correlation doesn't means causatio ...
- R语言伪相关性分析(Spurious Correlation)、相关关系不是因果关系:以缅因州离婚率数据集为例
R语言伪相关性分析(Spurious Correlation).相关关系不是因果关系:以缅因州离婚率数据集为例 #correlation doesn't means causation 目录
- R语言构建生存分析(survival analysis)模型示例
R语言构建生存分析(survival analysis)模型示例 生存分析处理的是预测特定事件将要发生的时间.它也被称为失败时间分析或死亡时间分析.例如,预测癌症患者存活的天数,或者预测机械系统将要失 ...
- 如何使用Power BI和R脚本创建高级分析
In this article, we will discover how to find the associations and hidden patterns in a dataset. The ...
- pvrect r语言 聚类_技术贴 | R语言——肠型分析:介绍、方法
点击蓝字↑↑↑"微生态",轻松关注不迷路 导读 2011年,肠型(Enterotypes)的概念首次在<自然>杂志上由Arumugam等[1]提出,该研究发现可以将人类 ...
- R语言实现单因素方差分析
1.方差分析基本原理:是一种分析各类别自变量对数值因变量影响的一种统计方法.自变量对因变量的影响也称为自变量效应.由于影响效应的大小体现为因变量的误差里有多少是由自变量造成的,因此,方差分析通过对数据 ...
- R语言逻辑回归预测分析付费用户
原文链接:http://tecdat.cn/?p=967 对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率(点击文末& ...
- [统计模型] 基于R的潜在剖面分析(LPA)
本文主要介绍基于R进行潜在剖面分析(Latent Profile Aanalysis, LPA). 关于潜在类别分析LCA/潜在剖面分析LPA的概念和区别,可以参考一下这篇文章: 潜在类别分析LCA ...
最新文章
- python最新版下载教程-各种版本的Python下载安装教程
- mtk处理器和骁龙对比_高通正在开发全新AR/VR处理器骁龙XR2;骁龙865对比骁龙855 Plus/苹果A13:爆料称性能增加20%...
- RocketMQ的Producer详解之分布式事务消息(代码实现以及过程分析)
- mysql占位符 防注入_php mysql中防注入的几个小问题,麻烦大大帮我解答谢谢
- mysql中select语句子句,了解mysql中select语句操作实例
- Python中文件的读写、写读和追加写读三种模式的特点
- 【解决方案】jquery live的change事件在IE下失效
- chkconfig: command not found
- 食谱数据库数据找不到的问题
- 华为的数字化转型之道
- 即时通讯工具的优缺点分别是什么
- 过来领你的Bug之“缺陷分析“篇
- UI基本控件(一):UIScrollView
- 使用 f2py 包装 Fortran MPI 程序
- 一个30岁转行IT行业从小兵到主管的崎岖成长之路
- html网页制作期末大作业成品_新疆旅游网页设计作品_dreamweaver作业静态HTML网页设计模板_新疆旅游景点网页作业制作...
- 长度测试仪:可测量网线/电话线/光纤等的长度
- leetcode每日一题—781.森林中的兔子
- js下载Word文档
- 算法比赛经历--蓝桥杯,天梯赛,力扣,牛客,cf,acwing,acm