答案如下:

# 利用linux自带命令:sort、awk、grep、head、uniq组合得出相应的答案

awk '{print $1}' | grep 'www.xxxx.com'  access.log | sort | uniq -c | sort -nr -k1 | head -n 10

命令说明

  1. awk命令说明
    AWK 是一种处理文本文件的语言,是一个强大的文本分析工具。之所以叫 AWK 是因为其取了三位创 始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符。
    语法如下:

    awk [选项参数] 'script' var=value file(s)或awk [选项参数] -f scriptfile var=value file(s)

    基本用法
    test.log

    1 hello world!2 php mysql3 java javascript4 golang c

    用法一:

    awk '{[pattern] action}' {filenames}   # 行匹配语句 awk '' 只能用单引号

    示例:

    # 每行按照tab或者空格分割,输出文本中的1、2项$ awk '{print $1 $2}' test.log# 输出1 hello2 php3 java4 golang

    用法二:

    # -F相当于内置变量FS, 指定分割字符awk -F{分隔符}

    示例:

    # 使用分隔符awk -F: '{print $1 $2}' test.log# 输出1 hello2 php3 java4 golang

    还有一些其他用法,比如设置变量,在awk -v后面跟变量名并且赋值,然后输出,比如:

    awk -va=1 '{print $1,$1+a}' test .logawk -va=1 -vb=3 '{print $1,$1+a,$b}' test.log

    还有awk脚本的方式等等,后面两种不常用,如果想了解可以自行查找资料学习,这里主要说明第一种和第二种用法。

  2. grep命令说明
    在linux中grep命令用于查找文件中符合条件的字符串,通常搭配ps -ef | grep 'xxxx' xxx.log等命令配合使用。
    语法:

    grep [-abcEFGhHilLnqrsvVwxy][-A<显示列数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...]

    具体参数信息可以通过grep --help命令查看
    这里列举几种常用的用法

    # 查看符合条件的日志条目grep -n '2019-10-24 00:01:11' *.log# 在当前目录下第一级文件夹中寻找包含指定字符串的文件grep "main" /.in# 利用正则表达式匹配文件内容所在的行grep –e "正则表达式" 文件名# 查找时不区分大小写grep –i "被查找的字符串" 文件名# 从根目录开始查找所有扩展名为 .log 的文本文件,并找出包含 "ERROR" 的行find / -type f -name "*.log" | xargs grep "ERROR"# 从当前目录开始查找所有扩展名为 .in 的文本文件,并找出包含 "thermcontact" 的行find . -name "*.in" | xargs grep "thermcontact"# 还有很多使用方式可以自行查找
  3. uniq命令说明
    Linux uniq 命令用于检查及删除文本文件中重复出现的行列,一般与 sort 命令结合使用。uniq 可检查 文本文件中重复出现的行列。
    语法:

    uniq [-cdu][-f<栏位>][-s<字符位置>][-w<字符位置>][--help][--version][输入文件][输出文件]# 参数详情查看uniq --help

    示例:

    # 文件test.txt中第1、4、7、9行为相同行,使用uniq命令可以删除重复行uniq test.txt# 检查文件并删除文件中重复出现的行,并在行首显示该行重复出现的次数uniq -c test.txt# 当重复行不是连续并且不相邻的时候uniq不起作用,这时可以搭配sort命令一起使用sort test.txt | uniq
  4. sort命令说明
    Linux sort命令用于将文本文件内容加以排序。sort可针对文本文件的内容,以行为单位来排序。
    语法:

    sort [-bcdfimMnr][-o<输出文件>][-t<分隔字符>][+<起始栏位>-<结束栏位>][--help][--verison][文件]# 参数详情查看sort --help

    示例

    # 使用sort命令以默认的方式对文件的行进行排序sort test.txt
  5. head命令说明
    head 命令可用于查看文件的开头部分的内容,有一个常用的参数 -n 用于显示行数,默认为 10,即显示 10 行的内容。
    语法

    head [参数] [文件]  # 参数详情查看head --help

    示例

    # 显示日志文件前10行head access.log# 显示日志文件开头前5行head -n 5 access.log# 显示文件前20个字节head -c 20 access.log

查找txt中的中文字符_找出nginx请求日志中某个url请求总次数排名前十的ip地址...相关推荐

  1. python查找两个数组中相同的元素_找出两个数组的相同元素,最优算法?

    在做新旧接口交替过程中,遇到了老接口和新接口json数据有些不一致的情况,需要比较两个json对象,把相同的元素赋其中一个json对象中变量的值.而且其中一个json最后输出格式还需要改变下属性名,思 ...

  2. java找出字符串出现最多的字符,JAVA_找出输入的字符串中出现次数最多的字符

    代码是我看着 乐乐熊小妹 的博客打的. import java.util.*; public class Find { public static void main(String[] args){ ...

  3. 找出一批正整数中的最大偶数_找出一批正整数中最大的偶数,c语言怎么写?

    展开全部 1.打开5261C-Free5.0新建一个空白页面4102,然后将1653C语言的基础格式写完,注意回格式缩进.答 2.然后输入"   int a=10; float b=5,c; ...

  4. java a标签正则_正则表达式:java中婚配HTML中a标签中的中文字符

    正则表达式:java中匹配HTML中a标签中的中文字符 今天群里一位朋友问到了一个正则表达式的问题,有如下内容: 特432 453543 a1特123你好123吗? 特2 标签中的文字现在要匹配出内容 ...

  5. python处理中文字符串_处理python字符串中的中文字符

    # -*- coding:utf-8 -*- import sys,os txta = open('a.txt','r') str = '' for line in txta: str += line ...

  6. Java通过正则剔除乱码_正则表达式 - 去掉乱码字符/提取字符串中的中文字符/提取字符串中的大小写字母 - Python代码...

    目录 1.乱码符号种类较少,用replace() 2.乱码字符种类较多,用re.sub() 3.提取字符串中的中文字符 4.提取字符串中的中文字符和数字 5.提取其他 数据清洗的时候一大烦恼就是数据中 ...

  7. python django mysql写入中文乱码_解决django 向mysql中写入中文字符出错的问题

    之前使用django+mysql建立的一个站点,发现向数据库中写入中文字符时总会报错,尝试了修改settings文件和更改数据表的字符集后仍不起作用.最后发现,在更改mysql的字符集后,需要重建数据 ...

  8. 解决Python3中的中文字符编码的问题-亲测有效

    解决Python3中的中文字符编码的问题 一.原理篇: Unicode是一32位编码格式,不适合用来传输和存储,所以必须转换成utf-8,gbk等等.这篇文章主要介绍了Python3中的解决中文字符编 ...

  9. 正则表达式 - 去掉乱码字符/提取字符串中的中文字符/提取字符串中的大小写字母 - Python代码

    目录 1.乱码符号种类较少,用replace() 2.乱码字符种类较多,用re.sub() 3.提取字符串中的中文字符 4.提取字符串中的中文字符和数字 5.提取其他 数据清洗的时候一大烦恼就是数据中 ...

最新文章

  1. 库函数和系统调用的区别和联系
  2. 用RSA实现Web单点登录密码的加密传输
  3. Mysql For Windows安装图解
  4. AWS发布低延迟互动直播服务
  5. iframe页面使用Js实现父页面和子页面通信
  6. php扩展zval,PHP扩展开发(7):zval结构
  7. SAP发票校验中支付条件中的基准日期缺省值的配置及控制逻辑测试
  8. 13个非常有用的Python代码片段
  9. Oracle数据字典表
  10. 配置ActiveX控件在网页中下载安装
  11. 学编程c语言高考能加分吗,学好编程,中高考都能加分,还能保送清华北大!...
  12. STM32CubeIDE界面设置为黑色
  13. <数字图像处理(2)> 图像增强(二)对数变换
  14. fastboot 详解
  15. 关于项目结束时的工作总结
  16. 使用VMware Convert迁移Windows主机到虚拟机经验
  17. Maven系列第五讲 私服讲解
  18. 【QT学习】Day 1 快捷键、按钮、对象树、信号和槽、Lambda表达式
  19. 手机App将三年内消失,互联网世界的第二次大战
  20. keystore生成 linux_keystore 生成证书

热门文章

  1. python使用imbalanced-learn的RandomOverSampler方法进行上采样处理数据不平衡问题
  2. 什么是数据湖(Data Lake)?
  3. pandas read_csv ‘utf-8‘ codec can‘t decode bytes in position 1198-1199: invalid continuation byte解决
  4. 交叉验证(cross validation)是什么?K折交叉验证(k-fold crossValidation)是什么?
  5. mysql5.7数据库快照_lvm快照备份数据库(Mysql5.7)
  6. docker nginx安装模块_docker安装nginx与php7.1
  7. 捋一下测序后生信分析内容及其常用软件
  8. 三代测序原理与数据文件简介(SMRT+Nanopore)
  9. 管理系统中的计算机应用信息可靠性,计算机信息处理系统的可靠性研究
  10. numpy 修改数据类型