做群体变异检测后,通常会有提取子集的操作,之前没有发现bcftools有这个功能,都是自己写脚本操作,数据量一上来,速度真的是让人无语凝噎。这里记录下提取子vcf文件的用法,软件版本:bcftools-1.5

一、根据个体提取子集

根据样品名提取vcf文件,准备要保留的个体名文件 keep.list,一行一个个体(参考第三步)。

无痛处理,速度超快,命令如下:

1 bcftools view -S keep.list test.vcf >sub_indv.vcf

二、根据染色体位置提取子集

注意:这里vcf要使用gbzip压缩并且构建索引才行,而且vcf文件位置顺序不能乱(别问我怎么知道的??);

准备好染色体及位置文件chr_pos.list,文件内容示例如下:

chr1 27639chr160383chr260469chr360516chr460534

后续命令如下,速度快,内存消耗还小:

1 bgzip test.vcf2 tabix -p vcf test.vcf.gz3 bcftools view -R chr_pos.list test.vcf.gz >new.pos.vcf

三、直接提取测序个体样品名

1 bcftools query -l test.vcf >ind.list

1 head -100 test.vcf |grep "#C"|cut -f10-|xargs -n 1 >ind.list # 不调用软件这样也行

ind.list文件中一行一个样品名

原文:https://www.cnblogs.com/mmtinfo/p/11945592.html

matlab读取snp文件,bcftools 提取vcf(snp/indel)文件子集相关推荐

  1. matlab读取医学图像MetaImage类型的.mha和.mhd文件

    0.简单说明: matlab读取DICOM医学图像文件的方式很简单直接,matlab自带dicomread函数. >> help dicomread dicomread - Read DI ...

  2. matlab读取xml文档并储存为.mat文件详解

    起因是需要将c++中的矩阵传入matlab中进行处理,发现xml文档可以保留精度,因此选择xml作为中介完成从c++到matlab的数据传递. xml文档结构如下: <opencv_storag ...

  3. 怎样从PHP文件中提取特征码,关于判断文件唯一性,怎么提取特征码

    关于判断文件唯一性,怎么提取特征码 Delphi / Windows SDK/API http://www.delphi2007.net/DelphiAPI/html/delphi_200611081 ...

  4. 使用ffmpeg从mp4文件中提取视频流到h264文件中

    注释: -i 2018.mp4:  是输入的MP4文件 -codec copy: 从mp4中拷贝 -bsf: h264_mp4toannexb: 从mp4拷贝到annexB封装 -f h264: 采用 ...

  5. 【OFF三维显示】通过MATLAB读取off文件生成三视图 提取轮廓线

    1.软件版本 MATLAB2021a 2.本算法理论知识 里共提供了100个OFF文件,用来验证不同三维物体的效果. 整个系统分为两个部分:off文件的获取以及不同视角的物体显示和轮廓显示. 其中OF ...

  6. matlab读取nastran模型,Matlab 读Nastran结果文件.pch,并提取刚度阵和质量阵问题

    我在前几天在CSDN上下载了一个提取Nastran结果.pch文件中的刚度阵和质量阵的m文件,代码如下: // function [K,M]=Get_K_M(N) %读取Nastran的pch文件,得 ...

  7. R语言实现GWAS结果显著SNP位点归类提取与变异类型转化

    GWAS结果显著SNP位点归类提取与变异类型转化 根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性 ...

  8. matlab读取文件夹下所有文件的字符串,MATLAB读取文件夹下所有文件的文件名并读取数据...

    MATLAB读取文件夹下特定类型格式文件的文件名并读取该格式文件的数据 利用代码对大量数据进行自动批处理时,首先需要获取该数据存放的文件夹(文件夹路径),然后获取该文件夹下某一类型数据所有的文件名,最 ...

  9. matlab数据变成一列数据,matlab读取excel表格列数据-matlab导入excel后,怎么把数据提取成一列?...

    怎么用matlab读取excel表格中的一列十六进制数据? x=xlsread('oillack.xls','sheet1','a1:a73') excel文件名是oillack.xls,sheet1 ...

  10. matlab网页视频流,使用Matlab读取视频流文件

    Matlab中对图像和视频流的读取还是很方便的,但是由于不常用Matlab读取视频流(这家伙处理能力较OpenCV还是慢些)偶有小忘,这次有在工作中遇到特此记录一下,Matlab的help文档关于视频 ...

最新文章

  1. 转:一个android开发者独立开发社交app全过程
  2. 学容器必须懂 bridge 网络 - 每天5分钟玩转 Docker 容器技术(32)
  3. ajax存储过程,jQuery-AJAX将下拉列表重新绑定到存储过程的结果
  4. 一步步编写操作系统 46 用c语言编写内核3
  5. 服务至上——安擎的待“客”之道
  6. Mac OS X下的移动光标和文字编辑快捷键
  7. C/C++ Memory Layout
  8. msm 关机充电开启与关闭
  9. JLink重刷固件(win7/win8/win10亲测可用)
  10. 职称计算机 将计算机broad_1下的e盘映射为k盘网络驱动器,职称计算机考试网络基础答案(1)...
  11. Python学习_基础_29_面向对象编程之多态、鸭子类型
  12. 【数论】B043_机器人大冒险(取次数)
  13. androrid按键事件
  14. 亚马逊服务器EC2无法ping通的问题
  15. worldpress 的 GPG 加密插件
  16. 【客户是瞎子】腾讯微博注册的不友好提示
  17. mui 本地化后调试_MUI和LIP-如何用您的语言用中文编写和本地化Windows
  18. Linux proxy 设置
  19. 深圳多家银行设立取款限额 ATM机限时取款(图)
  20. brew php 降级icu4c

热门文章

  1. 目前NAXX所用到的一些BUFF和药水
  2. css3直线运动_纯css3动画--边框线条动画
  3. Python之pandas学习笔记
  4. 不到一周我开发出了属于自己的知识共享平台
  5. 太阳系行星运转示意图
  6. ASP程序性能测试报告
  7. html里怎么旋转视频文件,拍摄的视频如何旋转 三种方法教你旋转视频
  8. 游戏公司游戏策划面试笔记
  9. todo游戏行业实战案例3:玩家等级停滞率
  10. JavaEE简易聊天室(Netbeans:Servlet+Cookie+Session)