在服务器开发中,我们经常会写入大量的日志文件。有时候我们需要对这些日志文件进行统计。Linux中我们可以利用以下命令简单高效的实现这一功能。

需要用到的命令简介

  • cat命令 
    cat命令主要有三大功能 
    1.一次显示整个文件 cat filename 
    2.创建一个文件 cat > fileName 
    3.将几个文件合并为一个文件 cat file1 file2 > file 
    参数: 
      -n 或 –number 由 1 开始对所有输出的行数编号 
      -b 或 –number-nonblank 和 -n 相似,只不过对于空白行不编号 
      -s 或 –squeeze-blank 当遇到有连续两行以上的空白行,就代换为一行的空白行 
      -v 或 –show-nonprinting
  • | 管道 
    管道的作用是将左边命令的输出作为右边命令的输入
  • awk 命令 
    awk 是行处理器,优点是处理庞大文件时不会出现内存溢出或处理缓慢的问题,通常用来格式化文本信息。awk依次对每一行进行处理,然后输出。 
    命令形式 awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file 
      [-F|-f|-v] 大参数,-F指定分隔符,-f调用脚本,-v定义变量 var=value 
      ’ ’ 引用代码块 
      BEGIN 初始化代码块,在对每一行进行处理之前,初始化代码,主要是引用全局变量,设置FS分隔符 
      // 匹配代码块,可以使字符串或正则表达式 
      {} 命令代码块,包含一条或多条命令 
      ;多条命令使用分号分隔 
      END 结尾代码块,对每一行进行处理后再执行的代码块,主要进行最终计算或输出 
    由于篇幅限制,可自行查找更详细的信息。这里awk命令的作用是从文件中每一行取出我们需要的字符串

  • sort 命令 
    sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。 
      -b:忽略每行前面开始出的空格字符; 
      -c:检查文件是否已经按照顺序排序; 
      -d:排序时,处理英文字母、数字及空格字符外,忽略其他的字符; 
      -f:排序时,将小写字母视为大写字母; 
      -i:排序时,除了040至176之间的ASCII字符外,忽略其他的字符; 
      -m:将几个排序号的文件进行合并; 
      -M:将前面3个字母依照月份的缩写进行排序; 
      -n:依照数值的大小排序; 
      -o<输出文件>:将排序后的结果存入制定的文件; 
      -r:以相反的顺序来排序; 
      -t<分隔字符>:指定排序时所用的栏位分隔字符;

  • uniq 命令 
    uniq 命令用于报告或忽略文件中的重复行,一般与sort命令结合使用 
       -c或——count:在每列旁边显示该行重复出现的次数; 
      -d或–repeated:仅显示重复出现的行列; 
      -f<栏位>或–skip-fields=<栏位>:忽略比较指定的栏位; 
      -s<字符位置>或–skip-chars=<字符位置>:忽略比较指定的字符; 
      -u或——unique:仅显示出一次的行列; 
      -w<字符位置>或–check-chars=<字符位置>:指定要比较的字符。
  • > 命令 
    > 是定向输出到文件,如果文件不存在,就创建文件。如果文件存在,就将其清空 
    另外 >>是将输出内容追加到目标文件中。其他同>

现在我们开始

1 读入文件

cat test.log.2017-09-20 
  • 1

执行结果 
    

2 从每一行取出我们需要的字符串

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'

awk 命令中 -F 指定每一行的分隔符 在这里 ‘(txt=|&client)’是分隔符,它是一个正则表达式。意义是,用’txt=’或’&client’ 作为分隔符 
举例来说下面这行

sdate=2017-09-20 23:59:32&txt=com.ford.fordmobile&client_id=x

会被分割成

sdate=2017-09-20 23:59:32&
com.ford.fordmobile
_id=x

三部分 
其中第二部分”com.ford.fordmobile”是我所需要的字段

而’{print $2}’的意思是将每行得到的第二个值打印出来,$0代表获取的所有值 
执行效果如下 
    

3 对行进行排序 
先排序是因为去重与统计的 ‘unip’命令只能处理相邻行

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'|sort

执行结果 
 
可以看到相同行已经被排在了一起

4 统计数量与去重

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c

uniq -c 中的-c 代表在每列旁边显示该行重复出现的次数 
执行结果 

5 按重复次数排序

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c | sort -nr

sort 的 -n:依照数值的大小排序;-r 按照相反顺序排列

执行结果

6 将结果输出到文件中

cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c | sort -nr > testfile

可以看到我们当前目录已有testfile 目录 
用vim 打开可以看到 

日志分析命令 cat+awk+uniq+sort 详解相关推荐

  1. Java开发必须掌握的日志分析命令

    转载自 Java开发必须掌握的日志分析命令 对于大型网站来说,很多网站在可用性方面提出4个9或者5个9的要求,如果是4个9,那么网站全年的不可用时间不能超过52.6分钟,如果是5个9,全年不可用时间不 ...

  2. python调用adb shell命令_Python之使用adb shell命令启动应用的方法详解

    Python之使用adb shell命令启动应用的方法详解 一直有一个心愿希望可以用Python做安卓自动化功能测试,在一步步摸索中,之前是用monkeyrunner,但是发现对于控件ID的使用非常具 ...

  3. shell脚本编程神器之awk语法案例详解

    AWK入门指南 文章目录 shell脚本编程神器之awk语法案例详解 安装AWK AWK 起步示例 AWK程序的结构 执行 awk 程序 awk 的错误提示 简单输出 打印每一行 打印特定行 NF,字 ...

  4. Linux系统命令sort详解

    sort命令的功能是对文件中的各行进行排序.sort命令有许多非常实用的选项,这些选项最初是用来对数据库格式的文件内容进行各种排序操作的.实际上,sort命令可以被认为是一个非常强大的数据管理工具,用 ...

  5. linux xxx命令,linux命令ps aux|grep xxx详解

    对进程进行监测和控制,首先必须要了解当前进程的情况,也就是需要查看当前进程, 而ps命令(Process Status)就是最基本同时也是非常强大的进程查看命令. 使用该命令 可以确定有哪些进程正在运 ...

  6. [总结]FFMPEG命令行工具之ffplay详解

    目录 0 前言 1 语法 Synopsis 2 描述 Description 3 选项 Options 3.1 流指定器 Stream specifiers 3.2 通用选项 Generic opti ...

  7. 每天一个linux命令(25):linux文件属性详解

    每天一个linux命令(25):linux文件属性详解 Linux 文件或目录的属性主要包括:文件或目录的节点.种类.权限模式.链接数量.所归属的用户和用户组.最近访问或修改的时间等内容.具体情况如下 ...

  8. php mysql修改命令_PHP编程:mysql alter table命令修改表结构实例详解

    <PHP编程:mysql alter table命令修改表结构实例详解>要点: 本文介绍了PHP编程:mysql alter table命令修改表结构实例详解,希望对您有用.如果有疑问,可 ...

  9. 怎么打开python shell_Python之使用adb shell命令启动应用的方法详解

    一直有一个心愿希望可以用Python做安卓自动化功能测试,在一步步摸索中,之前是用monkeyrunner,但是发现对于控件ID的使用非常具有局限性,尤其是ID的内容不便于区分 具有重复性时,后面又发 ...

最新文章

  1. 《现代操作系统》第7章读书笔记--虚拟化和云(未完成)
  2. node更新到最新版本_云顶之弈10.24版本临时更新永恩、劫大砍,最新上分阵容推荐...
  3. Linux计划任务(at,crontab)
  4. oracle归档日志的概念,浅谈Oracle归档日志
  5. linux修改密码最短生存时间,Linux基础命令---修改用户密码
  6. java的课后作业咋写_写的简单的java第三季的课后作业
  7. HTML左侧下拉列表,HTML中的下拉列表 select
  8. leetcode笔记(Python版)待更新
  9. Luogu4587[FJOI2016] 神秘数
  10. vs2019键盘钩子_江门网站建设:针对Web开发人员的12个最佳Visual Studio代码扩展
  11. 华为交换机密码重置(在S5720系列上验证)
  12. linux下计算md5值,Linux下使用md5sum计算和检验MD5码
  13. psv无线怎么连接电脑连接服务器,如何使用PSV远程操作电脑 PSVITA REMOTE DESKTOP详细教程...
  14. 日本語トレーニング(二十一)
  15. 2021Java春招面试:看完这篇文终于搞明白了
  16. 购车指南首次买车必看系列之(二): 产权篇
  17. AutoLeaders控制组——51单片机学习笔记(LED点阵屏、DS1302时钟芯片)
  18. python 柱状图折线图共用一个图例_Python数据可视化–折线图–柱状图
  19. Android 搜狗输入法-手表版对圆形手环/手表适配
  20. Hive中各种日期格式转换方法总结

热门文章

  1. 不得不学习的MybatisPlus教程
  2. 朱老师物联网大讲堂学习总结
  3. 华为Matebook安装Manjaro Linux的不完全攻略
  4. 简历要凸显出自己的能力
  5. Ubuntu 设定硬盘分区的卷标 (名字)
  6. 名帖275 董其昌 行书《书画合璧山水册》
  7. 华为NCE网管配置EVPL业务(共享VCTrunk)之路径法
  8. Java Math类静态double ceil(double d)与示例
  9. 声明double变量的时候,加d与不加d有什么区别
  10. 合同法律风险管理 动态合同履约衔接与函件往来