使用awk,sort和uniq从ATS访问日志中统计出异常链接域名的次数排名
在运维过程中,发现portal中出现流量异常曲线,
就从排查ATS的访问日志中的异常域名开始,下面是我截获的对应时段的访问日志截图
发现里面有502,403等异常响应,我们将这段访问日志文件记为exception_peak.log。采用下面的命令来过滤出502的访问记录,并剥离出对应的访问链接的host,统计指定时段中的该host出现次数,最后逆序排名。
cat exception_peak.log | grep ' 502 ' | awk -F '"' '{print $2}' | awk -F '/' '{print $3}' | sort | uniq -c | sort -nr > host_peak.log
这里说明如下:
grep ' 502 ' 只过滤出502的访问记录,
awk -F '"' '{print $2}'表示以双引号为分隔线,取第2段子域,也就是访问链接,
awk -F '/' '{print $3}'表示从访问链接中提取出host
sort | uniq -c 表示现将可能重复的行放到一起,再去掉重复行,并标注每行重复的次数
sort -nr 表示按重复次数逆序排名
这样处理的结果将会被重定向到一个名为 host_peak.log的日志文件中,它的内容如下
这就是我们想要的效果。
注意:如果采用下面的命令
cat exception_peak.log | grep ' 502 ' | awk -F '"' '{print $2}' | awk -F '/' '{print $3}' | awk 'a[$1]+=1;END{for(i in a){print a[i]" "i;}}' | sort -k1 -urn > host_peak.log
我们会发现有个小bug就是,数字ip的次数无法统计,参见下面的截图
另外,下面是可能需要用到的几个命令:
awk -F “/“ ‘{print $0}’
awk -F “/“ ‘{if ($1==502) print $2}’
awk -F “:“ ‘{print $1,$2}’
使用awk,sort和uniq从ATS访问日志中统计出异常链接域名的次数排名相关推荐
- 使用cat,awk和sort命令从nginx访问日志中统计user-agent类型
业务场景描述如下: 我有一个Nginx的web服务器,需要从统计日志中统计有哪些类型的设备终端和浏览器访问了我的网站. 访问日志中的每条记录是这样的: 使用下面的命令得到user-agent所在的字段 ...
- 在apache访问日志中统计统计前十名pv
通过访问日志,统计前十名的pv值 cat /var/log/httpd/access_log |grep html|sed 's/^.*GET//g'|sed 's/HTTP.*$//g'|sort| ...
- awk命令过滤tomcat的访日日志中IP地址
1. 命令如下 批量过滤日志文件,grep -v是要排除10网段开头的IP地址 sort会自动按ip排序 uniq -c去重并计数 sort -n 按数值从小到大排序 [root@linux-node ...
- ATS自定义日志中的各字段解读
线上日志格式定义如下 <Format = "%<cqtq> %<ttms> %<pssc> %<sssc> [%<cqtt> ...
- oracle 访问日志ip,怎么从访问日志中把ip提取出来
2020-04-21阅读(24) 本文主要为您介绍忘了自己电脑用户密码怎么办,内容包括我忘记密码了怎么办登陆不了了电脑育儿问答宝宝树,我的电脑用户名和密码忘记了怎么办,台式电脑用户名密码忘记了怎么办. ...
- Apache访问日志详解
想要知道什么人在什么时候浏览了网站的哪些内容吗?查看Apache的访问日志就可以知道.访问日志是Apache的标准日志,本文详细解释了访问日志的内容以及相关选项的配置. 一.访问日志的格式 Apach ...
- 【数据架构解读】基于阿里云数加StreamCompute和MaxCompute构建的访问日志统计分析...
[场景] 用户搭建网站会不断的产生访问日志(Nginx,Apache访问日志).为了从访问日志中挖掘出更多价值,本文主要阐述如果利用阿里云数加从沉睡中的访问日志中获取更有价值的数据,包括用于实时统计和 ...
- SLB访问日志分析:基于客户端来源和HTTP状态码的实践
摘要: 阿里云负载均衡SLB可以对多台云服务器(ECS)进行流量分发,支持TCP的四层负载均衡和基于HTTP/HTTPS的七层负载均衡.使用SLB可以降低单台ECS异常时对业务的冲击,提升系统可用性. ...
- NGINX访问日志和错误日志
Logs are very useful to monitor activities of any application apart from providing you with valuable ...
最新文章
- ubuntu root下的无密码登陆
- 初级搭建博客mysql_mysql 初级命令学习2
- linear-gradient 百分比以及斜角的使用
- C++ 中vector的学习
- Java后端:一个注解搞定 Spring Boot 日志!
- SQL Server 2008 各种DateTime的取值范围
- 人工智能规模化落地还有哪些坑?阿里副总裁华先胜连麦详解!
- 使用Calender类获取系统时间和时间和运算
- 高级Linux Kernel Inline Hook技术分析与实现
- HTML标记特定,制作asp:标记特定的HTML标记
- xci转化nsp_4nxci软件下载[xci游戏转nsp格式工具]v2.10-k73游戏之家
- fseek函数c语言_在C / C ++中使用fseek()函数的指南
- 计算机信息工程专业工资,2020年工科类专业薪资最新排名,计算机很吃香,工资水平最高...
- 辽宁大连IPv6高校
- Workbench Command——cifti格式操作,如何制作label文件即 Human_MMP.lh.label.gii?
- arcgis 线自动构面的方法一例
- Excel插入图片实现单击放大或缩小
- kafka的broker配置
- linux脱离终端运行程序
- 请选择服务器许可证文件,获取并安装许可文件 | PowerMill 2022 | Autodesk Knowledge Network...
热门文章
- url中去掉index.php,方便redirect()
- os.system() 和 os.popen()
- Android模拟器学framework和driver之传感器篇1(linux sensor driver)
- [原]SSL 开发简述(Delphi)
- 对于数据库进行设计在PHP,关于数据库表的设计
- python读取文件r_python read文件的r和rb的区别
- html5面板制作代码,HTML5绘制设备面板
- php redis search,php redis类
- python不用编译吗_windows编译xgboost-python,不用vs编译
- java列表包含列表_java – 包含另一个列表的列表