使用 QTLtools 进行 PCA 分析
3 使用 QTLtools 进行 PCA 分析
QTLtools 工具可以进行基因型的PCA分析,也可以进行表型的PCA分析,以下教程分别针对基因型和表型的PCA进行介绍:
3.1 对基因型进行PCA分析;
命令如下所示:
QTLtools pca --vcf genotypes.chr22.vcf.gz --scale --center --maf 0.05 --distance 50000 --out test
genotypes.chr22.vcf.gz输入文件如下所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-n1kDrPVV-1628864096685)(https://img2020.cnblogs.com/blog/812148/202108/812148-20210810160813806-1773641731.png)]
- –maf 0.05 指的是只考虑此等位基因频率小于0.05的变异位点;
- –distance 50000 指的是只考虑间隔至少50kb的变异位点;
运行后,会生成两个输出文件test.pca和test.pca_stats
test.pca表示基因型的PCA结果,如下所示:
test.pca_stats指的是每个PC所解释的百分比,如下所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k3h7zOkh-1628864096688)(https://img2020.cnblogs.com/blog/812148/202108/812148-20210810162905812-397362726.png)]
3.2 对表型进行PCA分析;
命令如下所示:
QTLtools pca --bed genes.50percent.chr22.bed.gz --scale --center --out genes.50percent.chr22
输入文件genes.50percent.chr22.bed.gz如下所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9my0CZ4p-1628864096689)(https://img2020.cnblogs.com/blog/812148/202108/812148-20210810163047131-882886704.png)]
- 表型文件总共有6+N列,N指的是样本数量,比如示例文件有4个样本,那么表型文件就有10列;
- 第一列是染色体;
- 第二列是起始位置;
- 第三列是终止位置;
- 第四列是ID,比如exon的ID;
- 第五列是group ID, 比如gene ID;
- 第六列是方向;
- 从第七列开始,则是每个样本对应的表型值;
- 文件分隔符为 TAB;
- 缺失值用NA表示,对于缺失值,QTLtools 会自动impute;
同样的,会生成genes.50percent.chr22.pca和genes.50percent.chr22.pca_stats两个文件。
genes.50percent.chr22.pca如下所示:
genes.50percent.chr22.pca_stats如下所示:
致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感谢小可爱们多年来的陪伴, 我与你们一起成长~
使用 QTLtools 进行 PCA 分析相关推荐
- pca图解读_干货!手把手一步一步解读PCA分析,逃学博士尽力了!
01 引言 之前发了几篇文章关于矩阵中 特征向量和PCA主元分析的文章,大家反响不错.当时并没有涉及到数学运算,只是大概讲了讲原理. 这篇文章我们一起来一步一步解读 PCA的计算过程 如何用Pytho ...
- pca降维的基本思想_R语言进行PCA分析
点击上方「蓝字」关注我 写在前面 前面我们知道了降维分析 学习了PCoA分析 今天学习PCA分析... PCA(Principal Component Analysis),即主成分分析方法,是一种使用 ...
- PCA分析(主成分分析)--结果解读
主成分分析(PCA)是一个很好的工具,可以用来降低特征空间的维数.PCA的显著优点是它能产生不相关的特征,并能提高模型的性能. PCA用于减少用于训练模型的特征维度数量,它通过从多个特征构造所谓的主成 ...
- R语言中如何进行PCA分析?利用ggplot和prcomp绘制基因表达量分析图
学习笔记的主要内容是在R语言中利用ggplot2进行PCA分析和绘图,包括简单分析与操作流程,对比不同方式得到的结果差异,提供脚本代码供练习. PCA分析的原理 在处理基因差异表达数据时,有时候需要分 ...
- PCA分析及CNS级别作图
从这节开始,就逐渐涉及转录组的基本可视化了,我们的可视化要做到CNS级别的图,争取做好分析,一步到位,让您有真正的收获! PCA(主成分分析),具体的原理就不说了,自行百度.简单理解,PCA就是降维, ...
- R语言ggplot2 | PCA分析及其可视化
主成分分析 主成分分析(PCA)的基本介绍 PCA常用的参数 标准化 特征值和特征向量 载荷 得分 R语言实现PCA分析 逐步计算PCA分析中的参数 prcomp函数 princomp函数 自定义函数 ...
- PCA分析法的python主要代码
一 PCA分析法介绍 可以理解为是一种降维的思想,将M列数据降维成对应的N列数据,用主要的几个字段解释整体方差变异 也可以理解为一种低维度的映射,举例将三维的数据找到一个二维映射面,同时可以尽力解释出 ...
- 一文读懂PCA分析 (原理、算法、解释和可视化)
生物信息学习的正确姿势 NGS系列文章包括NGS基础.高颜值在线绘图和分析.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流 ...
- R语言中的PCA分析与可视化
文章目录 1. 常用术语 (1)标准化(Scale) (2)特征值 (eigen value) (3)特征向量(eigen vector) (4)载荷(loading) (5)得分(score) 2. ...
最新文章
- 【设计模式】享元模式
- 深度学习利器:TensorFlow在智能终端中的应用——智能边缘计算,云端生成模型给移动端下载,然后用该模型进行预测...
- java 异常_Java学习——异常与异常处理
- Kafka系列2-producer和consumer报错
- 七边形简单画法步骤图_眼线笔的画法步骤图
- 服务器如何返回429状态,Instagram远程服务器返回一个错误:(429)UNKNOWN STATUS CODE...
- android国籍组件,android组件化之路
- C++笔记---函数声明(prototype)
- linux grep 正则 id,浅谈Linux grep与正则表达式
- Scripting for Testers 测试人员脚本编程教程 Lynda课程中文字幕
- 【UE·蓝图】UE4蓝图MediaPlayer注意事项
- 数据分析:穿越致富的正确姿势
- vue对vue-giant-tree进行节点操作
- 驾照考试之科目二(深圳仙田版)
- U盘分区损坏了还能恢复吗?双重方法解难题
- Base64解密转图片
- Android笔记-Felix
- 树莓派的linux操作系统,树莓派的6种轻量级操作系统介绍
- Power BI Power Query页面使用python进行数据处理
- KSO-在NETCore中RabbitMQ的使用以及相关代码