运用awk提取日志文件中的IP地址
在我们的日常工作中,可能会遇到各种不同的问题,有来自内部,有的来自外部。
以Nginx服务为例,服务上线之后可能会遭受非法的流量攻击,我们在配置Nginx服务时可以通过Nginx.conf配置文件中的http模块,来过滤那些高频访问服务的IP地址,将其输出到access.log文件中。
但是日志中的IP地址众多,我们该如何根据需要来提取这些IP地址呢,下面我就介绍一下使用awk提取IP地址的方法
需求:统计出日志文件中503次数最多的前三个 IP
首先,我们想要提取日志文件中的IP地址,就要知道日志文件的格式
可以看到IP地址是每一行的第一个字段,且需求是提取状态码为502的IP地址
cat access.log | awk '/503/ {a[$1]++} END {for (i in a) printf("%d %s\n", a[i], i);}' | sort -nr| head -3
以IP地址作为数组的下标,数组保存IP地址出现的个数,最终输出数组的下标也就是IP地址,并根据出现次数进行排序,再输出前三。
运用awk提取日志文件中的IP地址相关推荐
- python读取日志统计ip_使用python脚本实现统计日志文件中的ip访问次数
使用python脚本实现统计日志文件中的ip访问次数,注意此脚本只适用ip在每行开头的日志文件,需要的朋友可以参考下 适用的日志格式: 106.45.185.214 - - [06/Aug/2014: ...
- python使用正则表达式抽取文件中的IP地址
python使用正则表达式抽取文件中的IP地址 IP正则 r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})' 有效IP ((25[0-5]|2[0-4][0-9]|[01] ...
- linux awk 时间范围,如何用awk从日志文件中找到时间范围的记录
日志格式如下 2013/08/16 01:10:11.111 E12345678900-0 6513 123 0 IN OK() 0 0 0 ...
- 张坤 2012.5.4 egrep在文件中找IP地址
作者:2010级嵌入式 张坤 [root@localhost 桌面]# cat aaa.txt 192.168.1.1 1234.234.04.08 123.1234.045.678 asdfasd ...
- 如何从 Apache 和 NGINX 服务器的日志文件中提取 IP 地址
作为系统管理员,您需要密切关注访问您网站的 IP 地址.服务器日志是此类信息的有用来源.它们包含您的服务器收到的每个请求的 IP 地址.日期时间.请求类型.URL.服务器响应等.在本文中,我们将了解如 ...
- klg日志文件中提取RGBD图像数据
main函数 本程序用于从klg日志文件中提取RGB图像和Depth图像信息,klg文件在ElasticFusion中被用于保存数据集. 涉及的相关开源代码如下: LogView mp3guy/Log ...
- linux日志添加到文件,关于linux:将变量中的内容追加到日志文件中
我有一个脚本,并尝试将我的变量中的内容附加到.log文件. 我在另一篇文章中看到了(如何通过命令行将变量文本附加到文件的最后一行?),你可以使用echo"$(cat $ FILE)$ APP ...
- Tips--利用shell脚本批量提取txt文件中任意字段
利用shell脚本批量提取txt文件中任意字段 前言 0. 一个例子 1. cat命令 2. '|'符号与'>'符号 3. grep命令 4. awk命令 前言 对于测试中出现的log,我们经常 ...
- jstack Dump日志文件中的线程状态
jstack Dump 日志文件中的线程状态 dump 文件里,值得关注的线程状态有: 死锁,Deadlock(重点关注) 执行中,Runnable 等待资源,Waiting on conditio ...
最新文章
- 南方科技大学环境学院夏雨教授博士后一名(环境微生物方向)
- 数据不平衡、不平衡采样、调整分类阈值、过采样、欠采样、SMOTE、EasyEnsemble、加入数据平衡的流程、代价敏感学习BalanceCascade、
- stm32 hal uart_STM32 非阻塞HAL_UART_Receive_IT解析与实际应用
- ajax post 表单和 json 字符串
- hive建立内部表映射hbase_快手 HBase 在千亿级用户特征数据分析中的应用与实践...
- 一个娃娃竟然拍出50万......
- 在C语言中如何让常量起作用,解析C语言中如何正确使用const
- Java线程—如何解决Swing的单线程问题-----------Swing线程机制
- 【Elasticsearch】elasticsearch bool 布尔 查询
- 指定module_详解流量复制解决方案--NGINX的ngx_http_mirror_module模块实现
- [Python] L1-029. 是不是太胖了-PAT团体程序设计天梯赛GPLT
- 1.5 案例:多项式曲线拟合的比较
- 阶段3 2.Spring_06.Spring的新注解_8 spring整合junit完成
- 线性代数与矩阵论知识点总结
- java html转word!
- PCB 设计的基本流程
- 工行u盾显示316_工行银行网上交易老是提示插入u盾
- C盘用户名更改后一些注意事项
- sony6000正在连接服务器,极速对焦+11张每秒连拍 Sony A6000评测
- signal,blinker:信号(看我脸色行事)
热门文章
- ERP发货系统的修改(四十三)
- photoshop油画滤镜使用和案例教程
- 电信专家王煜全:手机监管面临三大困境
- element表格默认勾选
- html调用js自动播放音乐,使用html js实现点击文本和播放音乐的功能
- UnityAR-平面检测
- 单视图几何Vanish Point(消失点/灭点)计算方法——Robert_T_Collins(罗伯特·柯林斯)算法
- 面试当中必考的数据结构---树种类大全和相关优秀博客总结
- 机器学习数据分析极简思路及sklearn算法小试
- arduino nano引脚号_ARDUINO 脚号的命名规则