python关键字提取源码_python实现按关键字筛选日志文件
最近忙成了狗,五六个项目堆在一起,头疼的是测试还失惊无神的给我丢来一个几十甚至上百M的日志文件,动不动就几十上百万行,就算是搜索也看得头昏眼花的,因此自己花了点时间写了一段小脚本去过滤日志,当然这样的东西网上应该大把,但是还是想自己搞下,权当学习!
#!/usr/bin/python
# -*- encoding: utf-8 -*-
# version 1.0
import re
import time
'''
用于筛选日志文件,适用于python2.x版本
使用时将日志文件放于search.py工具同一目录
筛选完毕后会出现“旧文件名+当前时间”格式命名的新日志文件
'''
def getParameters():
file_name = ""
key_work = ""
while (True):
file_name = raw_input("请输入文件名:")
key_work = raw_input("请输入过滤关键字:")
if len(file_name) == 0 or len(key_work) == 0:
flag = raw_input("您输入的文件名或关键子为空,输出c重试,q退出程序:")
if flag == "q":
return
elif flag == "c":
continue
else:
break
new_file = file_name + "-" + formatTime(time.localtime())
f = open("./" + file_name, "rb")
lines = f.readlines()
if len(lines) == 0:
print("========日志文件为空========")
f.close()
return
nf = open("./" + new_file, "wb");
count = 0
for line in lines:
rs = re.search(key_work, line)
if rs:
print("[命中]--->%s" % line)
nf.write(line)
count = count + 1
f.close()
nf.close()
print("共找到%d条信息" % count)
def formatTime(timevalue):
'''
format the time numbers
'''
return time.strftime("%Y%m%d%H%M%S", timevalue)
if __name__ == '__main__':
getParameters()
说明:这段脚本我是直接在终端上./xxxx.py的方式运行的,我终端由于编译android源码需要装的是python2.7.6,在python3上运行估计会有问题。
好了,下面是我测试了下的赛选结果:
当然,这只针对单个文件而已!
以上这篇python实现按关键字筛选日志文件就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
本文标题: python实现按关键字筛选日志文件
本文地址: http://www.cppcns.com/jiaoben/python/294978.html
python关键字提取源码_python实现按关键字筛选日志文件相关推荐
- python关键词提取源码_Python 结巴分词 关键词抽取分析
关键词抽取就是从文本里面把跟这篇文档意义最相关的一些词抽取出来.这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语.因此,目前依然可以在论文中看到关键词这一项. ...
- python关键词提取源码,python实现textrank关键词提取
python实现textrank关键词提取 来源:中文源码网 浏览: 次 日期:2018年9月2日 [下载文档: python实现textrank关键词提取.txt ] (友情提示:右键 ...
- python算法实现源码_python 实现A_算法的示例代码
python 实现A_算法的示例代码 来源:中文源码网 浏览: 次 日期:2018年9月2日 [下载文档: python 实现A_算法的示例代码.txt ] (友情提示:右键点上行txt ...
- python人脸识别源码_Python 抖音机器人,让你找到漂亮小姐姐
本项目作者沉迷于抖音无法自拔,常常花好几个小时在抖音漂亮小姐姐身上. 本着高效.直接地找到漂亮小姐姐的核心思想,我用 Python + ADB 做了一个 Python 抖音机器人 Douyin-Bot ...
- python贪吃蛇源码_Python:游戏:贪吃蛇(附源码)
Python:游戏:贪吃蛇(附源码) 发布时间:2018-09-05 09:59, 浏览次数:1295 , 标签: Python 贪吃蛇是个非常简单的游戏,适合练手. 首先分析一下这个游戏 1.蛇怎么 ...
- python爬虫框架源码_python爬虫的基本框架
1.爬虫的基本流程: 通过requests库的get方法获得网站的url 浏览器打开网页源码分析元素节点 通过BeautifulSoup或者正则表达式提取想要的数据 储存数据到本地磁盘或者数据库 2. ...
- python字符串替换源码_Python实现字符串中某个字母的替代功能
Python实现字符串中某个字母的替代功能 今晚想实现这样一个功能:将输入字符串中的字母 "i" 变成字母 "p".当时想的很简单,直接用for循环遍历,然后替 ...
- python量化策略源码_Python量化交易进阶讲堂-创建自定义量化回测框架
欢迎大家订阅<Python实战-构建基于股票的量化交易系统>小册子,小册子会陆续推出与小册内容相关的专栏文章,对涉及到的知识点进行更全面的扩展介绍,并且会有选择地收录至小册中,更便于广大读 ...
- python爬网页源码_python爬虫爬取网页的内容和网页源码不同?
可以看到这里id为k_total的元素值不同,爬出来是1,网页源码是55. 附还未完成的代码:import requests from bs4 import BeautifulSoup import ...
最新文章
- jquery即时搜索查询插件jquery.search.js
- 聊聊、Zookeeper 客户端 Curator
- openstack——horizon篇
- java二维码生成技术
- OpenResty请求参数处理
- LINUX用iptable完成端口映射
- 20181220 Oracle程序包基本开发逻辑
- data-index在react里怎样表达_对牛弹琴,在英语里该怎样地道表达?
- mc java 连接超时_Java进程CPU占用高导致的网页请求超时的故障排查
- [转]5个JavaScript面试题
- intellij 专业版 TomCat9
- linux配置超时_自动退出登录TMOUT
- 10大人生感悟助你走向成功之路
- cookie的工作原理、cookie的重要性
- Infopath2007表单转化成word2007
- 【GAN】Mode Collapse 和 Mode Dropping 问题定义
- GAT, Self Attention, Cross Attention对比以及在自动驾驶轨迹预测任务中的pytorch应用
- 只有7步,就能将任何魔方6面还原
- stl文件怎么用Java读取_vtk对stl文件进行下采样
- OpenGL BRDF和IBL渲染
热门文章
- matlab卡农,又用Mathematica写了一段卡农
- 黑鹰红客基地VIP美工教程系列
- Contour 学习笔记(二):使用级联功能实现蓝绿部署和金丝雀发布
- typec扩展坞hdmi没反应_TYPE-C用不溜,可能你缺一个扩展坞
- 自动拍照扫描识别身份证信息SDK
- 国内外主要射频器件厂商介绍
- 笔记本突然没有WiFi了,网卡驱动带有感叹号,Intel(R) Wireless-AC 9462 #2 : 对本驱动程序而言,版本号错误。
- python爬取4k高清壁纸(多线程版)
- WinXP共享密码设置
- java gis 最短路径_用Postgis算最短路径(在任意位置选择起点终点)(下)