matlab生成vcf,从VCF文件中提取样本数据
在
VariantAnnotation中,使用ScanVcfParam来指定要提取的数据.使用包中附带的示例VCF文件
library(VariantAnnotation)
vcfFile = system.file(package="VariantAnnotation", "extdata", "chr22.vcf.gz")
发现有关该文件的信息
scanVcfHeader(vcfFile)
## class: VCFHeader
## samples(5): HG00096 HG00097 HG00099 HG00100 HG00101
## meta(1): fileformat
## fixed(0):
## info(22): LDAF AVGPOST ... VT SNPSOURCE
## geno(3): GT DS GL
制定样品“HG00097”,“HG00101”的“LDAF”,“AVGPOST”信息字段,“GT”基因型字段的请求,用于22号染色体上的坐标50300000,50400000
param = ScanVcfParam(
info=c("LDAF", "AVGPOST"),
geno="GT",
samples=c("HG00097", "HG00101"),
which=GRanges("22", IRanges(50300000, 50400000)))
读取所请求的数据
vcf = readVcf(vcfFile, "hg19", param=param)
并从VCF中提取相关数据
head(geno(vcf)[["GT"]])
## HG00097 HG00101
## rs7410291 "0|0" "0|0"
## rs147922003 "0|0" "0|0"
## rs114143073 "0|0" "0|0"
## rs141778433 "0|0" "0|0"
## rs182170314 "0|0" "0|0"
## rs115145310 "0|0" "0|0"
head(info(vcf)[["LDAF"]])
## [1] 0.3431 0.0091 0.0098 0.0062 0.0041 0.0117
ranges(vcf)
## IRanges of length 1169
## start end width names
## [1] 50300078 50300078 1 rs7410291
## [2] 50300086 50300086 1 rs147922003
## [3] 50300101 50300101 1 rs114143073
## [4] 50300113 50300113 1 rs141778433
## [5] 50300166 50300166 1 rs182170314
## ... ... ... ... ...
## [1165] 50364310 50364312 3 22:50364310_GCA/G
## [1166] 50364311 50364313 3 22:50364311_CAT/C
## [1167] 50364464 50364464 1 rs150069372
## [1168] 50364465 50364465 1 rs146661152
## [1169] 50364609 50364609 1 rs184235324
也许你只是将基因型元素“GS”作为一个简单的R矩阵感兴趣,然后只需要指定您感兴趣的样本和/或范围,并使用readGeno(或类似的专门查询的readGen或readInfo).
VariantAnnotation小插曲和参考手册中有大量文档;另请参见?ScanVcfParam;示例(ScanVcfParam).
matlab生成vcf,从VCF文件中提取样本数据相关推荐
- 从Matlab的 .fig 图窗文件中提取相关数据
首先我们需要知道,Matlab的 .fig 图形体系分成4级:root-figure-axes-line.这种分层结构可在图窗的"属性检查器"里看到,此外还能看到每个层级的父/子以 ...
- matlab出如何从fig中获取数据,如何从MATLAB的fig文件中提取原始数据?
如何从MATLAB的fig文件中提取原始数据? mip版 关注:171 答案:3 悬赏:70 解决时间 2021-02-23 07:29 已解决 2021-02-23 02:41 如何从MATL ...
- matlab从fig图文件中提取数据
matlab从fig图文件中提取数据 lh=findall(gca,'type','line'); cell_l = cellfun('length',get(lh,'xdata')); i_lh=f ...
- matlab地址数据类型uns,使用matlab生成sine波mif文件
使用matlab生成sine波mif文件 作者:lee神 在使用altera 的FPGA中的rom過程中常常會使用到.mif文件或.hex文件.對於初學者,無論mif還是hex都是很令人疑惑的東西,這 ...
- 从keystore(jks)文件中提取私钥
JKS文件是使用keytool生成的keystore文件,存放私钥和证书.但是我们用keytool的时候,私钥并没有单独生成出来.这个不利于我们后期的一些扩展工作.所以,我们需要把私钥从keytool ...
- 从GTF文件中提取TSS上下游1kb的区间,要多少行代码?
欢迎关注"生信修炼手册"! 在ATAC_seq数据分析中,需要绘制reads在TSS位点附近的分布图, 如下所示 左侧为NFR reads在TSS位点两侧的分布图,右侧为单个核小体 ...
- 使用ffmpeg从视频文件中提取音频文件、视频抽帧和切割视频
目录 ffmpeg下载 使用ffmpeg从视频文件中提取音频文件 批量提取文件夹下多个视频文件的音频 使用ffmpeg从视频文件中提取视频帧 使用ffmpeg将按固定时长将视频切割成多个小片段 将分割 ...
- [SimplePlayer] 4. 从视频文件中提取音频
提取音频,具体点来说就是提取音频帧.提取方法与从视频文件中提取图像的方法基本一样,这里仅列出其中的不同点: 1. 由于目的提取音频,因此在demux的时候需要指定的是提取audio stream Au ...
- ML之MLiR:利用多元线性回归法,从大量数据(csv文件)中提取五个因变量(输入运输任务总里程数、运输次数、三种不同的车型,预测需要花费的小时数)来预测一个自变量
ML之MLiR:利用多元线性回归法,从大量数据(csv文件)中提取五个因变量(输入运输任务总里程数.运输次数.三种不同的车型,预测需要花费的小时数)来预测一个自变量 输出结果 代码设计 from nu ...
- python提取文件指定列_如何从csv文件中提取特定列并使用python绘图
我有一个csv文件,其中包含以下几行数据:# Vertex X Y Z K_I K_II K_III J 0 2.100000e+00 2.000000e+00 -1.000000e-04 0.000 ...
最新文章
- VB.Net to C Sharp Converter有用吗?
- tomcat线程释放时间_详解tomcat的连接数与线程池
- ZOJ 3171 The Hidden 7's DP
- success for advertisement
- JSTL分割字符 fn:split()
- 如何快速的学习html5,高效快速学习HTML5的技巧
- “开源社区运营就像种菜”,黄东旭谈开源商业化 | 独家
- Visual C#中用WMI控制远程计算机
- 当不知轴承型号时如何寻找轴承故障频率_轴承故障了?检测,处理,简单实用...
- 小学用计算机画画的课件,小学信息技术绘图课件
- 恋爱测试题测男生软件,男友求生欲测试题大全
- 新一代态势感知系统发布——北望
- Windows环境安装MySQL ZIP Archive
- 互联网公司的期权激励和期权估值问题
- cocos2dx配置Android环境最新教程
- Inno setup打包vc++运行库
- 基于pytorch简单实现稀疏3d卷积(SECOND)
- 乌云笼罩下的尹山湖畔
- 电子签章如何申请(电子签章类型)
- 内网IP和公网IP的区别