去掉文件名中的特殊符号及中文
文章目录
做深度学习算法收集数据时,来源各种各样,导至文件名混有各种特殊符号,所在这里有一段代码,可以把文件名进行处理,只保留数字、字母和下划线,然后对文件进行重命名。
import os
import re
import random
import string
from glob import glob
from tqdm import tqdm
def convert_filename(file_lists):"""_summary_Args:file_lists (list ): file abs or relative path list """for file in tqdm(file_lists):basepath = os.path.dirname(file)basename = os.path.basename(file)name,suffix = os.path.splitext(basename)if len(re.findall('[\W\u4e00-\u9fa5]',name)): #中文及除数字字母下划线的符号newname = re.sub('[\W\u4e00-\u9fa5]','',name) # 这些特殊符号全部被删除if len(newname)==0: #所有符号全部都是特殊的,除去之后没有了,那就随机生成一个length=random.randint(3,10)letters = string.ascii_lowercasenewname = ''.join(random.choice(letters) for i in range(length))newfilename=newname+suffixif newfilename.isupper(): #把文件名及后缀全部改成写,在图片中有jpg,又有JPG直的烦newfilename=newfilename.lower()print(f"old:{basename} new:{newfilename}")newpath = os.path.join(basepath,newfilename)os.rename(file,newpath)else:continue
fs = glob("data/*.jpg")
convert_filename(fs)
去掉文件名中的特殊符号及中文相关推荐
- python去掉文件名中的_normal,_abnor后缀
去掉文件名中的_normal,_abnor后缀 需求描述: test3.list内容如下: D:\normal\191205132058_00002\s001_normal.jpg D:\normal ...
- java文件名特殊符号_linux命令行下文件名中包含特殊符号如何的处理方法
问题描述 前面<Jenkins系列之--07 实现SQL脚本批量执行>在实际运行过程中碰到如下问题 某次一模块SQL脚本执行完成后,再次执行还会运行,即备份执行完成的脚本这个功能没起作用, ...
- 电脑文件管理,怎么批量删除文件名中的指定符号
朋友还不知道如何快速删除文件名中的指定字符或文字,一个一个重命名删除,效率会低很多,那么今天小编给大家分享一个文件处理技巧,下面一起来试试效果. 需要哪些工具? 一台电脑 文件素材 怎么快速处理? 打 ...
- 数据清洗:用一行Python代码去掉文本中的各种符号
前言 在搜集了很多文本语料之后,会开始漫长的数据清洗过程,通常要不断迭代. 1. 问题描述 有些文本数据中,会包含一些特殊符号. 猜想可能是从某些富文本编辑器中直接粘贴到了网页. 如果要清除这些特殊符 ...
- linux命令(44):sed,vim;去掉文件中的^M 符号,去掉行首空格和制表符
注:下面的直接粘贴会出错,要重新输入^M 如何输入^M,先 ctrl+v,然后 ctrl+m 第一种方法: cat -A filename 就可以看到windows下的断元字符 ^M 要去除他,最简单 ...
- windows批量去掉文件名中的括号
在需要修改的文件夹中新建一个txt文件,把下面的代码写进去,保存,修改后缀名为.bat,双击运行即可 @Echo Off&SetLocal ENABLEDELAYEDEXPANSION FOR ...
- python怎么去掉视频字幕_python实现去除下载电影和电视剧文件名中的多余字符的方法...
本文实例讲述了python实现去除下载电影和电视剧文件名中的多余字符的方法,是一个非常实用的技巧,分享给大家供大家参考.具体如下: 有时候我们讨厌下载电影和电视剧文件名中的多余字符(如网址和广告字样) ...
- 教你把文件的文件名中繁体中文翻译成简体中文重命名
文件重命名是我们常遇到的问题,而且一些文件的文件名中有些文字是繁体中文,那么如何将其翻译成简体中文重命名?下面就来试试这个新技巧吧.一起看操作. 准备工具: 一台WIN电脑 文件 开始操作: 在电脑浏 ...
- 超链接下载文件包含特殊符号和中文的处理
超链接的href路径中包含特殊符号和中文,在点击后,文件下载失败,提示404. 查看了请求的路径,发现从#号后面的部分被浏览器自动截掉了,所以文件是不存在的. 解决方法是把文件名称编码后再请求: 初始 ...
最新文章
- linux /etc/profile和/etc/bashrc
- pytorch CenterLoss
- springMVC--(讲解5)文件上传与传参测试
- vue ui 报错errno:-4058解决办法
- CentOS下Yum使用
- iOS-----使用NSURLConnection
- long转string mybatis_Spring+Mybatis类型转换的问题,oracle数据库中有一个clob类型,怎样在查询以后转换为String类型?...
- 从零开始学习mitmproxy源码阅读
- 20145309 《网络对抗技术》信息搜集与漏洞扫描
- springboot冲突导致的发版失败
- 同步fifo的串并_同步FIFO笔记
- windows8 认识及使用
- python从入门到实践第二版_【Python入门教程】第二季网络爬虫基础
- 基于TI CC2540汽车检测蓝牙4.0 BLE方案
- 局域网计算机网卡启动,远程启动局域网内电脑
- 力扣(104.101)补9.7
- android各个版本的新特性
- 笔记本外接显示器感觉鼠标有延迟解决办法
- JavaEE中,考勤(签到签退)功能的实现
- NAO机器人的多功能
热门文章
- html页面全面屏手机,/* js 判断手机是否全面屏 */
- cv2.putText字体比较
- 算法的优雅(三)卡牌的秘密
- 什么是 SAP Commerce Cloud 的 Flexible Search?
- 脖子痛、腰痛、膝盖痛、髋关节痛...教你一招立马不痛了!
- SketchUp的二次开发探索 (二)菜单栏中放入自己写的插件
- 华为智选推出高性能电驱轿跑SUV;沃尔沃将用绿色钢铁制造概念车;大陆集团开发250米长距雷达 | 美通企业日报...
- web前端入门到实战:前端高手在CSS 开发效率的必备片段
- Word里公式和文字不对齐的解决方法
- VUE的6种事件修饰符