• 情况说明:当在一个文件夹下面有好几十个或几百个文件需要删除,此时一一去挑选费时费力,特别是在Linux下面。因此,需要批量删除文件。

对训练样本(图像)和测试样本(图像)进行评估时候,需要查看是数据本身问题还是自己模型的问题,因此需要将错误分类的样本(图像)挑选出来,看到底是标注本身问题,还是说模型没有训练好。当是样本本身问题,需要将错误样本删除。

在3W多个训练样本中,查询到400多个是错误标注的数据,需要在数据集中删除。

将要删除的文件路径放入txt,用Python的os读取文件,存入txt。然后在用os.remove()删除读出来的路径所指文件。

由于我在Windows下面查看样本方便点,所以在Windows下面把文件相对路径写入txt,这里是第1段代码。

然后在Linux服务器上,去执行批量删除文件的代码,这是第2段代码。(因此,复制本段代码需要注意路径问题!!!)

  1. 先将错误文件挑选出来,放在一个文件夹下的data_reduce.txt下面。

    import os
    from os import listdir
    # 错误文件放在reduce下面。
    anchor_dir='E:/WrongData/reduce/'
    anchor_files = [t for t in listdir(anchor_dir)]
    i=0
    #在wrongdata文件夹下面创建一个txt,保存错误文件的名字。
    with open('E:/WrongData/data_reduce.txt','w') as f:for f1 in anchor_files:path1 = anchor_dir+f1+'\n'print(path1)#设置文件对象f.write(path1)i +=1print(i)
  2. 读取data_reduce.txt中的文件路径,然后利用os.remove()删除这些文件。
    import os
    data_dir = "E:/train/4_classes/"
    file_handle=open('E:/WrongData/data_reduce_4.txt',mode='r')
    all_line = file_handle.readlines()
    for line in all_line:image_path=lineprint(image_path)# 需要去掉路径最后的换行符号。'\n'os.remove(image_path.strip('\n'))
    print("remove ok!")

用Python在Windows或Linux下批量删除文件夹中指定的文件相关推荐

  1. linux 批量选中文本删除,教程 | 【七牛云】Qshell Linux下批量删除文件教程

    原标题:教程 | [七牛云]Qshell Linux下批量删除文件教程 项目内容 本文将教您使用七牛云提供的Qshell工具在linux下安装并且使用批量查询和批量删除命令行进行远程删除文件. 项目教 ...

  2. python打不开xls文件,wps下用vba实现合并文件夹中所有excel文件

    python打不开xls文件,用wps下vba解决问题 用了常用的三种python读写xls文件的方法都报错 xlrd openpyxl pandas 原因 解决方法 用vba实现合并文件夹中所有ex ...

  3. Windows下如何用C语言清空特定文件夹中的所有文件

    #include "iostream.h"    //由于该博客系统发布是不能显示正常,代码如需调试,只需将改成""即可 #include "stri ...

  4. Linux 中如何复制和删除文件夹中的所有文件?

    Linux 中如何复制和删除文件夹中的所有文件? 1.复制文件 目标文件目录必须存在 (1) 直接复制 cp /hone/user/temp/test.c /home/user/ (2) 复制并重命名 ...

  5. windows文件夹中的哪些文件可以删除

    经过以下的设置后,你的系统会更加清爽.简洁.高效! 1.打开"我的电脑"-"工具"-"文件夹选项"-"查看"-在&quo ...

  6. r读取文件夹下的所有csv文件_[R语言]读取文件夹下所有子文件夹中的excel文件,并根据分类合并。...

    解决的问题:需要读取某个大文件夹下所有子文件夹中的excel文件,并汇总,汇总文件中需要包含的2部分的信息:1.该条数据来源于哪个子文件夹:2.该条数据来源于哪个excel文件.最终,按照子文件夹单独 ...

  7. Python学习:获取文件夹中最新的文件/文件夹

    文章概述 获取最新修改文件 关于lambda的用法 os.path.getmtime用法 获取最新修改文件 获取文件夹中,最新修改过的文件或者文件夹 import os # 文件夹目录 path=&q ...

  8. 使用.NET Core 3.1构建Windows Worker服务以删除文件夹中的旧文件

    目录 免责声明 介绍 解决方案 添加配置设置 添加带有文件夹列表的配置文件 我们的代码 将应用程序转换为Windows服务 创建Windows服务曾经是一个繁琐的过程,但是随着.NET Core 3. ...

  9. php 向文件夹中添加HTML文件,批量向html中插入内容

    网站有很多html页面,现在需要做移动适配,需要在这些html的页面中插入一行JS引用, 插入这样的 请教下能不能用php批量修改插入,因为这些页面结构都是一样的,还是只能手动一个个的修改 回复讨论( ...

最新文章

  1. MySQL基础:数据类型
  2. 无线节能组信标为什么会自动切换? 排查故障的过程真的像谜一样无法解释
  3. sql 行转列_想要表格行转列?简单几行Python代码搞定
  4. Battery historian安装及使用
  5. 8月第4周国内IT网站/频道Top15:太平洋降至第三
  6. dial up network
  7. 休眠:在sqlRestriction上使用联接表别名
  8. 一步一步写算法(之克鲁斯卡尔算法 下)
  9. oracle unpivot 索引_Oracle 行转列pivot 、列转行unpivot 的Sql语句总结
  10. MySQL Front远程连接数据库
  11. Ubuntu samba 安装与配置 实现windows和虚拟机中的Ubuntu共享文件
  12. python列表去重函数_对python中两种列表元素去重函数性能的比较方法
  13. python输入长和宽计算面_python案例1
  14. win10自动更新系统导致 点击睡眠之后直接关机
  15. 【钢结构·技术】国内经典的钢结构建筑BIM应用
  16. 互联网思维到底是什么?
  17. 【cvpr2022】ReSTR: Convolution-free Referring Image Segmentation Using Transformers
  18. Python实现将一张图片切成9宫格
  19. Unity【Dynamic Bone】- 关于人物模型头发、衣物等细节的处理
  20. 软件和硬件的质量曲线

热门文章

  1. 2022-2028年中国橡胶带行业市场运营格局及未来前景分析报告
  2. Go 学习笔记(81)— Go 性能分析工具 pprof
  3. c语言使用指定字符串替换特定的子串
  4. 3分钟4 步快速带你在win10电脑装上openCV3.4 (python使用)
  5. Python中yield和yield from的用法
  6. pytorch lstm crf 代码理解 重点
  7. GPU上的快速光谱图分区
  8. 基于至强® 平台的内存数据库解决方案
  9. 目标识别的选择性搜索
  10. Python:机器视觉与Tesseract介绍