matlab读取snp文件,bcftools 提取vcf(snp/indel)文件子集
做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎。这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5
一、根据个体提取子集
根据样品名提取vcf文件,准备要保留的个体名文件 keep.list,一行一个个体(参考第三步)。
无痛处理,速度超快,命令如下:
1 bcftools view -S keep.list test.vcf >sub_indv.vcf
二、根据染色体位置提取子集
注意:这里vcf要使用gbzip压缩并且构建索引才行,而且vcf文件位置顺序不能乱(别问我怎么知道的??);
准备好染色体及位置文件chr_pos.list,文件内容示例如下:
chr1 27639chr160383chr260469chr360516chr460534
后续命令如下,速度快,内存消耗还小:
1 bgzip test.vcf2 tabix -p vcf test.vcf.gz3 bcftools view -R chr_pos.list test.vcf.gz >new.pos.vcf
三、直接提取测序个体样品名
1 bcftools query -l test.vcf >ind.list
1 head -100 test.vcf |grep "#C"|cut -f10-|xargs -n 1 >ind.list # 不调用软件这样也行
ind.list文件中一行一个样品名
原文:https://www.cnblogs.com/mmtinfo/p/11945592.html
matlab读取snp文件,bcftools 提取vcf(snp/indel)文件子集相关推荐
- matlab读取医学图像MetaImage类型的.mha和.mhd文件
0.简单说明: matlab读取DICOM医学图像文件的方式很简单直接,matlab自带dicomread函数. >> help dicomread dicomread - Read DI ...
- matlab读取xml文档并储存为.mat文件详解
起因是需要将c++中的矩阵传入matlab中进行处理,发现xml文档可以保留精度,因此选择xml作为中介完成从c++到matlab的数据传递. xml文档结构如下: <opencv_storag ...
- 怎样从PHP文件中提取特征码,关于判断文件唯一性,怎么提取特征码
关于判断文件唯一性,怎么提取特征码 Delphi / Windows SDK/API http://www.delphi2007.net/DelphiAPI/html/delphi_200611081 ...
- 使用ffmpeg从mp4文件中提取视频流到h264文件中
注释: -i 2018.mp4: 是输入的MP4文件 -codec copy: 从mp4中拷贝 -bsf: h264_mp4toannexb: 从mp4拷贝到annexB封装 -f h264: 采用 ...
- 【OFF三维显示】通过MATLAB读取off文件生成三视图 提取轮廓线
1.软件版本 MATLAB2021a 2.本算法理论知识 里共提供了100个OFF文件,用来验证不同三维物体的效果. 整个系统分为两个部分:off文件的获取以及不同视角的物体显示和轮廓显示. 其中OF ...
- matlab读取nastran模型,Matlab 读Nastran结果文件.pch,并提取刚度阵和质量阵问题
我在前几天在CSDN上下载了一个提取Nastran结果.pch文件中的刚度阵和质量阵的m文件,代码如下: // function [K,M]=Get_K_M(N) %读取Nastran的pch文件,得 ...
- R语言实现GWAS结果显著SNP位点归类提取与变异类型转化
GWAS结果显著SNP位点归类提取与变异类型转化 根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性 ...
- matlab读取文件夹下所有文件的字符串,MATLAB读取文件夹下所有文件的文件名并读取数据...
MATLAB读取文件夹下特定类型格式文件的文件名并读取该格式文件的数据 利用代码对大量数据进行自动批处理时,首先需要获取该数据存放的文件夹(文件夹路径),然后获取该文件夹下某一类型数据所有的文件名,最 ...
- matlab数据变成一列数据,matlab读取excel表格列数据-matlab导入excel后,怎么把数据提取成一列?...
怎么用matlab读取excel表格中的一列十六进制数据? x=xlsread('oillack.xls','sheet1','a1:a73') excel文件名是oillack.xls,sheet1 ...
- matlab网页视频流,使用Matlab读取视频流文件
Matlab中对图像和视频流的读取还是很方便的,但是由于不常用Matlab读取视频流(这家伙处理能力较OpenCV还是慢些)偶有小忘,这次有在工作中遇到特此记录一下,Matlab的help文档关于视频 ...
最新文章
- 转:一个android开发者独立开发社交app全过程
- 学容器必须懂 bridge 网络 - 每天5分钟玩转 Docker 容器技术(32)
- ajax存储过程,jQuery-AJAX将下拉列表重新绑定到存储过程的结果
- 一步步编写操作系统 46 用c语言编写内核3
- 服务至上——安擎的待“客”之道
- Mac OS X下的移动光标和文字编辑快捷键
- C/C++ Memory Layout
- msm 关机充电开启与关闭
- JLink重刷固件(win7/win8/win10亲测可用)
- 职称计算机 将计算机broad_1下的e盘映射为k盘网络驱动器,职称计算机考试网络基础答案(1)...
- Python学习_基础_29_面向对象编程之多态、鸭子类型
- 【数论】B043_机器人大冒险(取次数)
- androrid按键事件
- 亚马逊服务器EC2无法ping通的问题
- worldpress 的 GPG 加密插件
- 【客户是瞎子】腾讯微博注册的不友好提示
- mui 本地化后调试_MUI和LIP-如何用您的语言用中文编写和本地化Windows
- Linux proxy 设置
- 深圳多家银行设立取款限额 ATM机限时取款(图)
- brew php 降级icu4c