本段代码为根据想要内容(数字1),把所有txt文件中有数字1的复制保存至其他文件夹

# 提取全部txt文件中 含有pf缺陷的txt文件 保存至其他文件夹中import os
import shutil# 读取给定目录下的所有 .txt 文件的文件名
def read_txt_files(path):# 创建文件名列表file_names = []# 遍历给定目录及其子目录下的所有文件for root, dirs, files in os.walk(path):# 遍历所有文件for file in files:# 如果是 .txt 文件,则加入文件名列表if file.endswith('.txt'): # endswith () 方法用于判断字符串是否以指定后缀结尾,如果以指定后缀结尾返回True,否则返回False。file_names.append(os.path.join(root, file))# 返回文件名列表return file_names# 读取 .txt 文件中的每一行,并返回每一行的第一个元素的列表
def read_txt_file(file_name):# 打开文件with open(file_name, 'r') as file:# 读取文件中的所有行lines = file.readlines()# 返回每一行的第一个元素的列表first_elements = [line.split()[0] for line in lines]return first_elements# 主函数
def main(path,new_save_path ):# 获取所有 .txt 文件的文件名file_names = read_txt_files(path)# 遍历所有 .txt 文件sum=0name=[]for file_name in file_names:# name.append(file_name.split(".txt")[0])  # 提取txt文件名# src_file_list=[]# img_src_dir = r"D:\YWJ\数据集处理0211\数据清洗"# for imges_all in name:#     src_file_list.append(img_src_dir + imges_all + ".jpg")  # 提取txt文件名对应的jpg文件# for srcfile in src_file_list:#     shutil.copy(srcfile, r'D:\YWJ\数据集处理0211\only_PF_img')# 读取 .txt 文件中的每一行的第一个元素first_elements = read_txt_file(file_name)# 如果列表中存在数字 1,则输出该文件的文件名 并且复制到指定文件夹保存if '1' in first_elements:sum+=1print('File with number 1 found:', file_name)src_file = os.path.join(path, file_name)# dst_file = os.path.join(new_save_path,file_name)dst_file = new_save_pathif os.path.abspath(src_file) != os.path.abspath(dst_file):shutil.copy(src_file, dst_file)else:print(f'{src_file} and {dst_file} are the same file, skipping copy.')print("共输出",sum)# 如果当前脚本被直接运行,则调用主函数
if __name__ == '__main__':# 设置 .txt 文件所在目录的路径path = r"D:\YWJ\数据集处理0211\all_abels"new_save_path = r"D:\YWJ\数据集处理0211\SJD陷\SJD_label"main(path,new_save_path)

 下端代码为根据txt文件名提取相对于img图片:

# srcfile 需要复制、移动的文件
# dstpath 目的地址
# 代码实现功能,根据txt文件名提取并提取出对应文件名的图片  功能一  要修改
# 根据images图片名提取并提出对应的txt文件名            功能二  要修改
import os
import shutil
from glob import glob
def mycopyfile(srcfile, dstpath):  # 复制函数if not os.path.isfile(srcfile):print("%s not exist!" % (srcfile))else:fpath, fname = os.path.split(srcfile)  # 分离文件名和路径if not os.path.exists(dstpath):os.makedirs(dstpath)  # 创建路径shutil.copy(srcfile, dstpath + fname)  # 复制文件print("copy %s -> %s" % (srcfile, dstpath + fname))src_dir = r'D:\YWJ\数据集处理0211\数据清洗/'  # 要提取对应图片的文件夹路径  or  txt提取  记得加斜杠
dst_dir = r'D:\YWJ\数据集处理0211\ytx缺陷\ytx_IMG/'  # 目的路径记得加斜杠 保存的地址
txt_path = r'D:\YWJ\数据集处理0211\ytx缺陷\ytx_label'     # txt文件名提取 or jpg图片提取
name=[]
# with open(txt_path) as f1:
txt_names = os.listdir(txt_path)
for i in range(len(txt_names)):# per_txt_path=os.path.join(txt_path,txt_names[i].split(".txt")[0]+".txt")name.append(txt_names[i].split(".txt")[0])   # 提取txt文件名# name.append(txt_names[i].split(".jpg")[0])   # 提取jpg文件名src_file_list=[]
for imges_all in name:src_file_list.append(src_dir+imges_all+".jpg")  #提取txt文件名对应的jpg文件# src_file_list.append(src_dir+imges_all+".txt")  #提取图片对应的txt文件
# print(src_file_list)
for srcfile in src_file_list:mycopyfile(srcfile, dst_dir)  # 复制文件

python:批量处理txt文件,读取txt文件内容,根据内容(例子为数字1)提取出对应txt文件到其他文件夹,后根据txt文件名提取对应名字图片。相关推荐

  1. windows文件读取 xxe_XXE任意文件读取(当xml解析内容有输出时)

    利用XXE漏洞读取文件 参考:https://www.jianshu.com/p/4fc721398e97 首先找到登录源码如下: 由题目可以利用XXE漏洞读取文件 先登录用Burp Suite抓包: ...

  2. Python批量检查docx文档中文本框的内容是否正确

    推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社,2018.8出版,2021.7第12次印刷 图书详情: 配套资源: 用书教师可 ...

  3. 利用python读取tomcat中log文件提取出错误日志生成新的文件

    人生苦短,我用python 废话不多说,直接上代码! #!/usr/bin/env python # coding=utf-8 import redef find_error_log(log_name ...

  4. CDays-3 习题二 (字典及文件读取练习)及相关内容解析。Python 基础教程

    读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关键词 => 文档序 ...

  5. C# 文件读取方法,自己写的例子,保存一下,备用

    /// <summary>/// 将output.config内容传到app.config/// </summary>string ReadString;//两个地址strin ...

  6. 编程doc转html,Python批量将word转html,并将html内容发布至网站。

    搜索热词 下面是编程之家 jb51.cc 通过网络收集整理的代码片段. 编程之家小编现在分享给大家,也给大家做个参考. #coding=utf-8 __author__ = 'zhm' from wi ...

  7. python批量读取文件夹的图片并处理成模型输入格式

    我们知道在训练图像模型时,需要从文件夹里读取图片. 这里演示下,怎样从文件夹里批量读取图片,并处理成我们想要的 x,y 即特征和标签. 输入维度理解 以卷积神经网络为例子. 我们知道卷积神经网络con ...

  8. 一文贯通python文件读取

    不论是数据分析还是机器学习,乃至于高大上的AI,数据源的获取是所有过程的入口. 数据源的存在形式多为数据库或者文件,如果把数据看做一种特殊格式的文件的话,即所有数据源都是文件.获得数据,就是读取文件的 ...

  9. 一文贯通python文件读取 1

    版权声明:本文为半吊子子全栈工匠(wireless_com,同公众号)原创文章,未经允许不得转载. https://blog.csdn.net/wireless_com/article/details ...

  10. python文件审计_Python代码审计实战案例总结之CRLF和任意文件读取

    文章目录 介绍 CRLF和任意文件读取的审计实战 CRLF 审计实战 urllib CRLF漏洞(CVE-2019-9740和CVE-2019-9947) httplib CRLF 漏洞 任意文件读取 ...

最新文章

  1. java数组的协变_Java数组协变与范型不变性
  2. 批量模糊查询_模糊匹配,Power Query的这个功能太实用了,可惜Excel还没有
  3. leetcode 377. Combination Sum IV | 377. 组合总和 Ⅳ(动态规划)
  4. 线框图用什么软件_为什么要在线框中着色?
  5. oracle批量更新数据从另一表_【案例】Oracle t-sql 更新大批量数据 更新两张大数据表案例...
  6. static变量和static函数的用法摘抄
  7. 构造函数模式知识的扩展
  8. Asp用FSO读写文件
  9. 拓端tecdat|R语言多项式线性模型:最大似然估计二次曲线
  10. 企业之haproxy
  11. [渝粤教育] 西南科技大学 成本会计 在线考试复习资料(1)
  12. 看了那些Google大神Jeff Dean的传说后,我跪了!
  13. oracle自动清理归档,Oracle rman 自动清理归档日志
  14. 把我本科2年爬过的坑,送给高考完想要选计算机专业的你,成为人们眼中的大神吧
  15. C++语言Qt实现 实时任务调度仿真软件 任务参数可配置和随机生成支持多核调度
  16. 当地特色旅游系统 计算机毕业设计 微信小程序开发
  17. 自适应中值滤波器python实现
  18. 读取图片文件到剪贴板时的html格式
  19. React 源码中的 Object.seal
  20. python查文献_自从用了Python,轻松查文献,释放80%的重复劳动时间

热门文章

  1. 怎么使用python统计人名_python中人名最多统计
  2. 周易六十四卦——泽地萃卦
  3. C语言试卷分析表程序,试卷分析模板(试卷分析表格模板)
  4. html短信验证代码是什么意思,如何让验证码显示出来 在手机找到短信选项并进入...
  5. (五)深入理解蓝牙BLE之“Beacon包格式详解”
  6. Downloading from maven-default-http-blocker的解决办法
  7. 电改背景下,售电公司如何利用需求侧响应模式
  8. IT人需要了解的认证大全(持续补充)
  9. ES6 模块 export 用法(三种方式)
  10. 一篇文章带你学会 Spring 中的 JdbcTemplate 增删改查操作