假设有文件长如下样子:

CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  samplename

1 3552841 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

1 3552842 . T . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

2 3552843 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

2 3552844 . T . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

3 3552845 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

3 3552846 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

4 3552847 . A . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

5 3552848 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

6 3552849 . A . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

7 3552850 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

现提取第一列字符为“3”,并打印出符合第一列为“3”的所有列,同时保存,则可以用以下命令:

awk -F " " ‘{if($1~/^3/) print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10}‘ sample.vcf > samplecol.vcf #{if($1~/^3/) print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10}‘ 的意思是,在文件sample.vcf中,如果第一列($1)里面有匹配(~)正则表达式(/^3/)的话,那么就输出(print)到标准输出。保存到samplecol.vcf文件中。

输出的文件如下:

3 3552845 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

3 3552846 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

原文:http://www.cnblogs.com/chenwenyan/p/7056882.html

Linux打印全部的内容,linux提取指定列字符并打印所有内容(awk)相关推荐

  1. 根据列名提取指定列 shell awk

    例子文件 colname.txt enzyme sample1 sample2 sample3 sample4 sample5 1 2 2 3 4 5 2 2 4 6 8 8 3 4 7 8 9 10 ...

  2. orm提取指定列_使用ORM提取数据很容易! 是吗?

    orm提取指定列 介绍 几乎所有系统都以某种方式与外部数据存储一起运行. 在大多数情况下,它是一个关系数据库,并且通常将数据获取委托给某些ORM实现. ORM涵盖了很多例程,并且带来了一些新的抽象作为 ...

  3. python csv文件和xlsx文件混杂时,提取指定列数据并合并

    这篇文章是R语言 如何合并csv文件(批量读取csv文件)的姊妹篇.提供更为强大的功能. 解决的问题是提取csv文件和xlsx文件混杂时,文件合并问题.具体来说,下面的代码是提取指定列文本,简单清洗后 ...

  4. pandas索引复合索引dataframe数据、索引dataframe中指定行和指定列交叉格子的数据内容(getting a specific value)、使用元组tuple表达复合索引的指定行

    pandas索引复合索引dataframe数据.索引dataframe中指定行和指定列交叉格子的数据内容(getting a specific value).使用元组tuple表达复合索引的指定行 目 ...

  5. linux提取第一列且删除第一行(awk函数)

    如下文件所示,只想提取红框中的内容,即进行提取第一列,且去除第一行的操作 则用到下列命令行: awk 'NR == 1 {next} {print $1}' file.txt > file_co ...

  6. Linux 命令行操作 while read ; cut 提取指定列; uniq命令并计数;sort 命令倒序查找

    while read 命令 ls *txt* | while read line; do other-operate-command; done cut -f 命令 提取文件中第17 20列 zcat ...

  7. xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...

    利用xpath来提取所有标签里面的内容,即使标签头不同 #-*-coding:utf8-*- import re import os from lxml import etree html = ''' ...

  8. linux中修改某行某列字符串,Linux替换指定列的字符串(awk 命令)

    假设有文件test.txt,想把test.txt文件第三列含有的good替换为bye,并把替换后的文件保存为test_bye.txt,只需要如下命令. test.txt go go good go m ...

  9. linux三剑客及常见命令,Linux三剑客及使用介绍

    Linux 三剑客是(grep,sed,awk)三者的简称,熟练使用这三个工具可以提升运维效率.Linux 三剑客以正则表达式作为基础,而在Linux系统中,支持两种正则表达式,分别为"标准 ...

  10. linux获取偶数行内容,linux命令(39):shell 打印偶数行,奇数行 ,行号

    awk 命令: 1. 打印行号和内容: awk '{print NR":"$0}' 2. 输出:偶数行和奇数行到文件 awk '{print $0.txt > NR%2.tx ...

最新文章

  1. android cts测试二
  2. 浅析自助式商城网站的制作步骤——简单易上手
  3. Spring Boot是如何实现自动配置的?
  4. 关于asp.net2.0资源文件本地化多语言版本的一些小技巧
  5. ionic安装插件常用命令
  6. Java 中 String 的常用方法(二)
  7. [VUE系列二]vue官方文档总结和整理
  8. 阿里乌镇大动作:平头哥开源 MCU 设计平台!
  9. LeetCode - 48. Rotate Image
  10. STM32官方封装库下载方法
  11. C6000 DSP技术深度探索(1)---关于启动方式
  12. matlab中邮递员问题实例,中国邮递员问题的求解实例.doc
  13. MATLAB提取 .fig 文件中的数据
  14. 解释什么是啸叫,为什么会发生啸叫,啸叫的为何和如何防止啸叫
  15. 用户行为分析 无埋点代码
  16. 从零构建通讯器--4.3日志打印实战,捋下main函数的调用顺序
  17. 怎么快速学会Excel?每周学习5个实用小技巧
  18. C IN ARM64 汇编基础-变量与表达式-基于The C Programming Language - Second Edition
  19. 什么事数据对象以及属性分为什么类型?
  20. IDEA右键创建servlet,没有servlet选项的解决办法(转载)

热门文章

  1. 面向对象程序设计——总结作业
  2. Ubuntu 16.04安装SoapUI工具进行接口测试(Web Service/WSDL/RESTfull)
  3. Docker-registry + GlusterFS
  4. CentOS 7.x 安装教程、硬盘分区、LVM、网络配置、软件源配置、制作USB Disk、U盘安装、网络安装...
  5. 绿色版Tomcat的配置
  6. 三层交换机SVI实现不同VLAN通信.
  7. 计算机学科技术前沿:INFOCOM和SIGCOMM会议信息
  8. 玩转DataGridView之实现两个GRID间行的拖拽
  9. AS3 的 2D向量类(Vector2D)
  10. Navicat - 导入CSV注意事项