3 使用 QTLtools 进行 PCA 分析

QTLtools 工具可以进行基因型的PCA分析,也可以进行表型的PCA分析,以下教程分别针对基因型和表型的PCA进行介绍:

3.1 对基因型进行PCA分析;

命令如下所示:

QTLtools pca --vcf genotypes.chr22.vcf.gz --scale --center --maf 0.05 --distance 50000 --out test

genotypes.chr22.vcf.gz输入文件如下所示:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-n1kDrPVV-1628864096685)(https://img2020.cnblogs.com/blog/812148/202108/812148-20210810160813806-1773641731.png)]

  • –maf 0.05 指的是只考虑此等位基因频率小于0.05的变异位点;
  • –distance 50000 指的是只考虑间隔至少50kb的变异位点;

运行后,会生成两个输出文件test.pcatest.pca_stats

test.pca表示基因型的PCA结果,如下所示:

test.pca_stats指的是每个PC所解释的百分比,如下所示:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k3h7zOkh-1628864096688)(https://img2020.cnblogs.com/blog/812148/202108/812148-20210810162905812-397362726.png)]

3.2 对表型进行PCA分析;

命令如下所示:

QTLtools pca --bed genes.50percent.chr22.bed.gz --scale --center --out genes.50percent.chr22

输入文件genes.50percent.chr22.bed.gz如下所示:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9my0CZ4p-1628864096689)(https://img2020.cnblogs.com/blog/812148/202108/812148-20210810163047131-882886704.png)]

  • 表型文件总共有6+N列,N指的是样本数量,比如示例文件有4个样本,那么表型文件就有10列;
  • 第一列是染色体;
  • 第二列是起始位置;
  • 第三列是终止位置;
  • 第四列是ID,比如exon的ID;
  • 第五列是group ID, 比如gene ID;
  • 第六列是方向;
  • 从第七列开始,则是每个样本对应的表型值;
  • 文件分隔符为 TAB;
  • 缺失值用NA表示,对于缺失值,QTLtools 会自动impute;

同样的,会生成genes.50percent.chr22.pcagenes.50percent.chr22.pca_stats两个文件。

genes.50percent.chr22.pca如下所示:

genes.50percent.chr22.pca_stats如下所示:


致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX

感谢小可爱们多年来的陪伴, 我与你们一起成长~

使用 QTLtools 进行 PCA 分析相关推荐

  1. pca图解读_干货!手把手一步一步解读PCA分析,逃学博士尽力了!

    01 引言 之前发了几篇文章关于矩阵中 特征向量和PCA主元分析的文章,大家反响不错.当时并没有涉及到数学运算,只是大概讲了讲原理. 这篇文章我们一起来一步一步解读 PCA的计算过程 如何用Pytho ...

  2. pca降维的基本思想_R语言进行PCA分析

    点击上方「蓝字」关注我 写在前面 前面我们知道了降维分析 学习了PCoA分析 今天学习PCA分析... PCA(Principal Component Analysis),即主成分分析方法,是一种使用 ...

  3. PCA分析(主成分分析)--结果解读

    主成分分析(PCA)是一个很好的工具,可以用来降低特征空间的维数.PCA的显著优点是它能产生不相关的特征,并能提高模型的性能. PCA用于减少用于训练模型的特征维度数量,它通过从多个特征构造所谓的主成 ...

  4. R语言中如何进行PCA分析?利用ggplot和prcomp绘制基因表达量分析图

    学习笔记的主要内容是在R语言中利用ggplot2进行PCA分析和绘图,包括简单分析与操作流程,对比不同方式得到的结果差异,提供脚本代码供练习. PCA分析的原理 在处理基因差异表达数据时,有时候需要分 ...

  5. PCA分析及CNS级别作图

    从这节开始,就逐渐涉及转录组的基本可视化了,我们的可视化要做到CNS级别的图,争取做好分析,一步到位,让您有真正的收获! PCA(主成分分析),具体的原理就不说了,自行百度.简单理解,PCA就是降维, ...

  6. R语言ggplot2 | PCA分析及其可视化

    主成分分析 主成分分析(PCA)的基本介绍 PCA常用的参数 标准化 特征值和特征向量 载荷 得分 R语言实现PCA分析 逐步计算PCA分析中的参数 prcomp函数 princomp函数 自定义函数 ...

  7. PCA分析法的python主要代码

    一 PCA分析法介绍 可以理解为是一种降维的思想,将M列数据降维成对应的N列数据,用主要的几个字段解释整体方差变异 也可以理解为一种低维度的映射,举例将三维的数据找到一个二维映射面,同时可以尽力解释出 ...

  8. 一文读懂PCA分析 (原理、算法、解释和可视化)

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.高颜值在线绘图和分析.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流 ...

  9. R语言中的PCA分析与可视化

    文章目录 1. 常用术语 (1)标准化(Scale) (2)特征值 (eigen value) (3)特征向量(eigen vector) (4)载荷(loading) (5)得分(score) 2. ...

最新文章

  1. 【设计模式】享元模式
  2. 深度学习利器:TensorFlow在智能终端中的应用——智能边缘计算,云端生成模型给移动端下载,然后用该模型进行预测...
  3. java 异常_Java学习——异常与异常处理
  4. Kafka系列2-producer和consumer报错
  5. 七边形简单画法步骤图_眼线笔的画法步骤图
  6. 服务器如何返回429状态,Instagram远程服务器返回一个错误:(429)UNKNOWN STATUS CODE...
  7. android国籍组件,android组件化之路
  8. C++笔记---函数声明(prototype)
  9. linux grep 正则 id,浅谈Linux grep与正则表达式
  10. Scripting for Testers 测试人员脚本编程教程 Lynda课程中文字幕
  11. 【UE·蓝图】UE4蓝图MediaPlayer注意事项
  12. 数据分析:穿越致富的正确姿势
  13. vue对vue-giant-tree进行节点操作
  14. 驾照考试之科目二(深圳仙田版)
  15. U盘分区损坏了还能恢复吗?双重方法解难题
  16. Base64解密转图片
  17. Android笔记-Felix
  18. 树莓派的linux操作系统,树莓派的6种轻量级操作系统介绍
  19. Power BI Power Query页面使用python进行数据处理
  20. KSO-在NETCore中RabbitMQ的使用以及相关代码

热门文章

  1. 工作第七周:提升版权意识,共塑良好共享氛围
  2. ubuntu16 安装UR5e driver
  3. AppleScript(7) : 睡眠
  4. 黑龙江省佳木斯市谷歌高清卫星地图下载
  5. C# Websocket连接(wss)
  6. python@regex正则表达式
  7. Win10家庭版找不到组策略gpedit.msc怎么办
  8. flutter flutter_swiper自定义指示器
  9. Android简单美观计算器(界面部分)
  10. C++没落了?学习C++没有前途了?从业者给你揭晓答案