python 含有文本_python – 查找不包含某些文本字符串的所有文本文件
我在
Python 2.7.1上,我正在尝试识别所有不包含某些文本字符串的文本文件.
该程序似乎首先工作,但每当我将文本字符串添加到文件时,它就会不断出现,就好像它不包含它一样(误报).当我检查文本文件的内容时,字符串显然存在.
我试着编写的代码是
def scanFiles2(rdir,sstring,extens,start = '',cSens = False):
fList = []
for fol,fols,fils in os.walk(rdir):
fList.extend([os.path.join(rdir,fol,fil) for fil in fils if fil.endswith(extens) and fil.startswith(start)])
if fList:
for fil in fList:
rFil = open(fil)
for line in rFil:
if not cSens:
line,sstring = line.lower(), sstring.lower()
if sstring in line:
fList.remove(fil)
break
rFil.close()
if fList:
plur = 'files do' if len(fList) > 1 else 'file does'
print '\nThe following %d %s not contain "%s":\n'%(len(fList),plur,sstring)
for fil in fList:
print fil
else:
print 'No files were found that don\'t contain %(sstring)s.'%locals()
scanFiles2(rdir = r'C:\temp',sstring = '!!syn',extens = '.html', start = '#', cSens = False)
我想代码中有一个缺陷,但我真的没有看到它.
UPDATE
代码仍然会出现许多误报:包含搜索字符串但被识别为不包含搜索字符串的文件.
文本编码可能会成为问题吗?我使用U作为搜索字符串的前缀来考虑Unicode编码,但它没有任何区别.
Python以某种方式缓存文件内容吗?我不这么认为,但这可能在一定程度上解释了文件在纠正后仍然弹出.
某种恶意软件会引起这样的症状吗?对我来说似乎不太可能,但我有点想要解决这个问题.
python 含有文本_python – 查找不包含某些文本字符串的所有文本文件相关推荐
- python 输入文件名查找_python 查找文件名包含指定字符串的方法
编写一个程序,能在当前目录以及当前目录的所有子目录下查找文件名包含指定字符串的文件,并打印出绝对路径. import os class searchfile(object): def __init__ ...
- python类型转换异常_python知识:json格式文本;异常处理;字符串处理;unicode类型和str类型转换...
python进程中的实例和json格式的字符串之间的映射关系是非常直接的,相当于同一个概念被编码成不同的表示: stream in json form ----json.loads(str)----- ...
- 使用 grep 查找所有包含指定文本的文件
目标:本文提供一些关于如何搜索出指定目录或整个文件系统中那些包含指定单词或字符串的文件. 难度:容易 约定: # - 需要使用 root 权限来执行指定命令,可以直接使用 root 用户来执行也可以使 ...
- python预处理删除特殊字符_python - 如何删除包含特殊字符的字符串?_others_酷徒编程知识库...
我试图删除所有包含特殊字符的字符串.description_list = ['$', '2,850', 'door', '.', 'sale', '...', 'trades', '.', 'pay' ...
- php sql 长字符串 查找被包含的短字符串_PHP字符串
PHP语言中字符串的使用是非常灵活的 一 什么是字符串变量 字符串变量就是定义一个变量并且给它赋上文本值,那么他就是一个字符串变量 我们在之前的"数据类型"课程里讲到过字符串需要用 ...
- python不包含某字符,查找不包含某些文本字符串的所有文本文件
我使用的是python2.7.1,我试图识别所有不包含文本字符串的文本文件.在 这个程序一开始似乎还在工作,但每当我把文本字符串添加到一个文件中时,它总是像不包含它一样出现(误报).当我检查文本文件的 ...
- python离线语音转文本_Python实现自动化语音转文本,彻底解放你的双手
当对一个或多个人的谈话进行记录时,采用一种高度准确和自动化的方式将口语提取为文本非常有用.转换成文字后,便可以将其用于进一步分析或用作其他功能. 我们将使用称为AssemblyAI(https://w ...
- 神经网络python实例分类_Python使用神经网络进行简单文本分类
原文链接:http://tecdat.cn/?p=8613tecdat.cn 深度学习无处不在.在本文中,我们将使用Keras进行文本分类. 准备数据集 出于演示目的,我们将使用 20个新闻组 数据 ...
- 利用python处理pdf文本_Python用于NLP :处理文本和PDF文件
原标题:Python用于NLP :处理文本和PDF文件 提示:代码图片可以点击全屏查看,双指操作还可以放大缩小. 这是我的Python用于自然语言处理(NLP)系列文章的第一篇文章.在本文中,我们将从 ...
最新文章
- 深度学习入门Fast.ai 2.0上线!自带中文字幕,所有笔记、资源全部免费!
- 充分的总结分析系统,来调整CMDB及流程。
- 20211006 线性变换
- 数组名的地址,和数组名取地址的讨论
- 砥志研思SVM(二) 拉格朗日乘子法与KKT条件
- c语言单片机彩灯程序设计,用C语言实现键控彩灯系统
- Dos命令使用Latex编写“Hello Latex.”
- STL之双向循环链表(List)的内部关系
- oracle 12创建一个表,oracle 12 c 创建表空间,用户名,及表
- 程序员如何才算真正的高效编程?
- m3u8手机批量转码_M3U8批量转换app-M3U8批量转换MP4软件下载v1.0 安卓版-西西软件下载...
- 外汇交易的主服务器中心,常见外汇交易商服务器ip地址汇总【转载】
- css设置ios 默认字体,让iOS在CSS中选择系统字体Helvetica Neue或旧金山
- matlab绘制雷达图
- 问题 J: LZY订单查询
- win7无损合并分区,win7合并磁盘分区
- Ubuntu系统英文大小写CapsLock切换混乱解决方法!
- app封装源码|app分发源码免签H5一键封装
- 基于ssm框架的农产品扶农商农平台的设计与实现
- clock_gettime 函数笔记
热门文章
- java工程师待遇杭州招聘_【华为杭州研究所工资】java开发工程师待遇-看准网
- nginx-web服务器
- linux stoping redis,linux服务器保险—— 一次redis攻击的遭遇
- math: 判断两个向量之间夹角是逆时针或顺时针
- 前端-解除事件的绑定
- 防护DDoS还仅局限于网络层吗?还这么想你就亏大了
- ssl服务器无响应,iOS上的IBM AppCenter 6.2.0 + SSL - 连接服务器时显示永久加载视图(无响应失败/成功/超时))...
- 计算机毕业设计ssm宠物领养信息管理系统5gcp7系统+程序+源码+lw+远程部署
- 射线追踪(ray tracing)
- 通俗理解广义回归神经网络(GRNN)