VariantAnnotation中,使用ScanVcfParam来指定要提取的数据.使用包中附带的示例VCF文件

library(VariantAnnotation)

vcfFile = system.file(package="VariantAnnotation", "extdata", "chr22.vcf.gz")

发现有关该文件的信息

scanVcfHeader(vcfFile)

## class: VCFHeader

## samples(5): HG00096 HG00097 HG00099 HG00100 HG00101

## meta(1): fileformat

## fixed(0):

## info(22): LDAF AVGPOST ... VT SNPSOURCE

## geno(3): GT DS GL

制定样品“HG00097”,“HG00101”的“LDAF”,“AVGPOST”信息字段,“GT”基因型字段的请求,用于22号染色体上的坐标50300000,50400000

param = ScanVcfParam(

info=c("LDAF", "AVGPOST"),

geno="GT",

samples=c("HG00097", "HG00101"),

which=GRanges("22", IRanges(50300000, 50400000)))

读取所请求的数据

vcf = readVcf(vcfFile, "hg19", param=param)

并从VCF中提取相关数据

head(geno(vcf)[["GT"]])

## HG00097 HG00101

## rs7410291 "0|0" "0|0"

## rs147922003 "0|0" "0|0"

## rs114143073 "0|0" "0|0"

## rs141778433 "0|0" "0|0"

## rs182170314 "0|0" "0|0"

## rs115145310 "0|0" "0|0"

head(info(vcf)[["LDAF"]])

## [1] 0.3431 0.0091 0.0098 0.0062 0.0041 0.0117

ranges(vcf)

## IRanges of length 1169

## start end width names

## [1] 50300078 50300078 1 rs7410291

## [2] 50300086 50300086 1 rs147922003

## [3] 50300101 50300101 1 rs114143073

## [4] 50300113 50300113 1 rs141778433

## [5] 50300166 50300166 1 rs182170314

## ... ... ... ... ...

## [1165] 50364310 50364312 3 22:50364310_GCA/G

## [1166] 50364311 50364313 3 22:50364311_CAT/C

## [1167] 50364464 50364464 1 rs150069372

## [1168] 50364465 50364465 1 rs146661152

## [1169] 50364609 50364609 1 rs184235324

也许你只是将​​基因型元素“GS”作为一个简单的R矩阵感兴趣,然后只需要指定您感兴趣的样本和/或范围,并使用readGeno(或类似的专门查询的readGen或readInfo).

VariantAnnotation小插曲和参考手册中有大量文档;另请参见?ScanVcfParam;示例(ScanVcfParam).

matlab生成vcf,从VCF文件中提取样本数据相关推荐

  1. 从Matlab的 .fig 图窗文件中提取相关数据

    首先我们需要知道,Matlab的 .fig 图形体系分成4级:root-figure-axes-line.这种分层结构可在图窗的"属性检查器"里看到,此外还能看到每个层级的父/子以 ...

  2. matlab出如何从fig中获取数据,如何从MATLAB的fig文件中提取原始数据?

    如何从MATLAB的fig文件中提取原始数据? mip版  关注:171  答案:3  悬赏:70 解决时间 2021-02-23 07:29 已解决 2021-02-23 02:41 如何从MATL ...

  3. matlab从fig图文件中提取数据

    matlab从fig图文件中提取数据 lh=findall(gca,'type','line'); cell_l = cellfun('length',get(lh,'xdata')); i_lh=f ...

  4. matlab地址数据类型uns,使用matlab生成sine波mif文件

    使用matlab生成sine波mif文件 作者:lee神 在使用altera 的FPGA中的rom過程中常常會使用到.mif文件或.hex文件.對於初學者,無論mif還是hex都是很令人疑惑的東西,這 ...

  5. 从keystore(jks)文件中提取私钥

    JKS文件是使用keytool生成的keystore文件,存放私钥和证书.但是我们用keytool的时候,私钥并没有单独生成出来.这个不利于我们后期的一些扩展工作.所以,我们需要把私钥从keytool ...

  6. 从GTF文件中提取TSS上下游1kb的区间,要多少行代码?

    欢迎关注"生信修炼手册"! 在ATAC_seq数据分析中,需要绘制reads在TSS位点附近的分布图, 如下所示 左侧为NFR reads在TSS位点两侧的分布图,右侧为单个核小体 ...

  7. 使用ffmpeg从视频文件中提取音频文件、视频抽帧和切割视频

    目录 ffmpeg下载 使用ffmpeg从视频文件中提取音频文件 批量提取文件夹下多个视频文件的音频 使用ffmpeg从视频文件中提取视频帧 使用ffmpeg将按固定时长将视频切割成多个小片段 将分割 ...

  8. [SimplePlayer] 4. 从视频文件中提取音频

    提取音频,具体点来说就是提取音频帧.提取方法与从视频文件中提取图像的方法基本一样,这里仅列出其中的不同点: 1. 由于目的提取音频,因此在demux的时候需要指定的是提取audio stream Au ...

  9. ML之MLiR:利用多元线性回归法,从大量数据(csv文件)中提取五个因变量(输入运输任务总里程数、运输次数、三种不同的车型,预测需要花费的小时数)来预测一个自变量

    ML之MLiR:利用多元线性回归法,从大量数据(csv文件)中提取五个因变量(输入运输任务总里程数.运输次数.三种不同的车型,预测需要花费的小时数)来预测一个自变量 输出结果 代码设计 from nu ...

  10. python提取文件指定列_如何从csv文件中提取特定列并使用python绘图

    我有一个csv文件,其中包含以下几行数据:# Vertex X Y Z K_I K_II K_III J 0 2.100000e+00 2.000000e+00 -1.000000e-04 0.000 ...

最新文章

  1. VB.Net to C Sharp Converter有用吗?
  2. tomcat线程释放时间_详解tomcat的连接数与线程池
  3. ZOJ 3171 The Hidden 7's DP
  4. success for advertisement
  5. JSTL分割字符 fn:split()
  6. 如何快速的学习html5,高效快速学习HTML5的技巧
  7. “开源社区运营就像种菜”,黄东旭谈开源商业化 | 独家
  8. Visual C#中用WMI控制远程计算机
  9. 当不知轴承型号时如何寻找轴承故障频率_轴承故障了?检测,处理,简单实用...
  10. 小学用计算机画画的课件,小学信息技术绘图课件
  11. 恋爱测试题测男生软件,男友求生欲测试题大全
  12. 新一代态势感知系统发布——北望
  13. Windows环境安装MySQL ZIP Archive
  14. 互联网公司的期权激励和期权估值问题
  15. cocos2dx配置Android环境最新教程
  16. Inno setup打包vc++运行库
  17. 基于pytorch简单实现稀疏3d卷积(SECOND)
  18. 乌云笼罩下的尹山湖畔
  19. 电子签章如何申请(电子签章类型)
  20. 内网IP和公网IP的区别

热门文章

  1. 2020第十二届全国大学生数学竞赛初赛试题及答案(江苏非数)
  2. 三星堆的青铜机器人_三星堆“青铜大立人”,手里原来握的是什么东西,至今困扰考古界...
  3. 《墨菲定律》读书笔记(上)
  4. 宣传一个非常好看的鼠标指针样式
  5. 《了解MIPI-DSI》
  6. Unity游戏教程初步(一):开始之前
  7. Verilog 任意整数分频器
  8. 收藏!常用的档案馆(室)检索工具及编制方法
  9. 实现人脸手动祛痘效果---OpenCV-Python开发指南(60)
  10. python在冒号处显示语法错误_python中的语法错误