Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj
Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj
1. 俩个问题::识别垃圾文件与清理策略1
2. 如何识别垃圾图片1
2.1. 体积过小文件<10kb1
2.2. 增加扩展名对于无扩展名文件1
2.3. 清理非图片(bmp,jpg,jpeg,png)的文件2
2.4. 尺寸过小图片(210*150)2
2.5. 清理广告图片(高度宽度不成比例)超长超宽图片2
2.6. 清理重复图片(此结果不能加入指纹库)2
2.7. 非本类别的图片(人工识别)2
3. 垃圾图片文件指纹库3
3.1. 根据垃圾文件指纹库(模式结果固化)3
3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)3
4. 人工识别垃圾图片策略3
5. 清理策略3
6. Code3
6.1. 文件去重4
1. 俩个问题::识别垃圾文件与清理策略
2. 如何识别垃圾图片
2.1. 体积过小文件<10kb
2.2. 增加扩展名对于无扩展名文件
package com.attilax.clr;
import com.attilax.clr.imp.MoveExcuter;
import com.attilax.clr.imp.NoPicReconer;
import com.attilax.clr.imp.tooMinSizePicClrerPartImp;
import com.attilax.clr.imp.tooMiniPixPicClrerPartImp;
public class ClrerPicClrer extends ClrerAbs {
public static void main(String[] args) {
ClrerPicClrer c=new ClrerPicClrer();
c.dir="d:\\ati\\isheo";
c.dir="D:\\ati\\p2015\\pic_p";
NoExtnameCheckerImp neImp=new NoExtnameCheckerImp();
c.PreProcessor=neImp;
c.traveDir(c.dir);
System.out.println("--f");
2.3. 清理非图片(bmp,jpg,jpeg,png)的文件
Gif js
2.4. 尺寸过小图片(210*150)
2.5. 清理广告图片(高度宽度不成比例)超长超宽图片
长宽比大于2的图片
2.6. 清理重复图片(此结果不能加入指纹库)
部分重复文件是广告文件,所以容易重复
2.7. 非本类别的图片(人工识别)
作者:: 老哇的爪子 Attilax 艾龙, EMAIL:1466519819@qq.com
转载请注明来源: http://blog.csdn.net/attilax
3. 垃圾图片文件指纹库
3.1. 根据垃圾文件指纹库(模式结果固化)
3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)
4. 人工识别垃圾图片策略
不好的isho
不能like的pic
误删除的文件专门集中放在isho_manu文件夹中,人工处理
5. 清理策略
生成清理脚本(或者直接java程序模式)
移动到制定文件夹(推荐)
6. Code
AtibrowPrj
public class ClrerPicClrer extends ClrerAbs {
public static void main(String[] args) {
ClrerPicClrer c=new ClrerPicClrer();
c.dir="d:\\ati\\isheo";
//c.GabFileRecongers.add(new NoPicReconer());
tooMiniPixPicClrerPartImp ClrerPartImp = new tooMiniPixPicClrerPartImp();
ClrerPartImp.dir=c.dir;
ClrerPartImp.targetDir="d:\\ati\\tooMiniPixPic_files";
c.IClrerParts.add(ClrerPartImp);
tooMinSizePicClrerPartImp tmsc=new tooMinSizePicClrerPartImp();
tmsc.dir=c.dir;
tmsc.targetDir="d:/ati/tooMinSize_files";
c.IClrerParts.add(tmsc);
c.traveDir(c.dir);
System.out.println("--f");
}
6.1. 文件去重
DeduliAbs_ByMoveToNewFolder.java
Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj相关推荐
- Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj...
Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj 1. 俩个问题::识别垃圾文件与清理策略1 2. 如何识别垃圾图片1 2.1. 体积过小文件<1 ...
- Atitit.论垃圾文件的识别与清理 文档类型垃圾文件 与api概要设计pa6.doc
Atitit.论垃圾文件的识别与清理 文档类型垃圾文件 与api概要设计pa6.doc 1. 俩个问题::识别垃圾文件与清理策略1 1.1. 文件类型:pic,doc,v,m cc,isho pose ...
- android判断某文件下是否you_android判断图片类型 判断文件是否为图片文件 - 电脑常识 - 服务器之家...
android判断图片类型 判断文件是否为图片文件 发布时间:2017-03-15 来源:服务器之家 判断文件是否为图片,仅通过后缀名判断很不全面,如果把一个txt文件后缀改成gif都会被认为是图片, ...
- 计算机清理垃圾文件丢失怎么恢复,清理电脑后怎样恢复丢失数据_电脑数据恢复_迷你兔...
清理电脑后怎样恢复丢失数据_电脑数据恢复_迷你兔 分类:数据恢复常见问题|最后更新:2019年5月10日 许多人会有规划地对自己的电脑进行清理工作,这么做的原因有可能是电脑垃圾文件太多,也可能是电脑剩 ...
- SDWebImage 判断图片类型
SDWebImage 判断图片类型 判断文件类型方法基本有两种: 通过文件后缀来判断 (简单,快捷 但是不准确,之前 公司android 客户端禁止用户上传 GIF , 前端默认可以播放 GIF ,有 ...
- 清理系统垃圾文件的常用脚本
把下面的所有内容存放到文本文件当中,然后重命名为一个以bat结尾的文件当中,以后每隔1周左右就执行一次这个bat文件,系统里的很多垃圾文件就会被清理掉!!!感谢大家的支持!!!!!!! @echo o ...
- linux有必要清理内存么,Linux系统需要清理垃圾文件和优化系统吗?
Linux系统需要清理垃圾文件和优化系统吗? 前言 首先这个是windows带来的习惯,Linux系统并不需要清理垃圾文件和优化系统! 清理垃圾 Linux下没有什么垃圾文件,最多的就是程序的缓存文件 ...
- macbook如何清除数据?Mac如何清理长时间的垃圾文件?
在Macbook中,可以创建多个用户,用于管理不同的资料,但是有些用户不使用了,而他的数据还保存在电脑中,这时候就要清除这些数据来腾出Macbook有限的空间,下面分享在macbook中清除这些数据的 ...
- scala类型推断及库方法设计原则和==与java有何差别
scala类型推断 方法msortSwapped(abcd)(_>_) 通常,一旦有需要推断多台方法类型参数的任务时,类型推断器就只参考第一个参数列表中所有参数类型,但不会参考之后其他参数.因为 ...
- Rust图片类型识别
Rust图片类型识别 Rust的image库提供了各种的图片操作方法,对于常用的图片类型,我们可以通过简单的方法打开图片: use image::io::Reader;let img = Reader ...
最新文章
- SQL Server开发人员应聘常被问的问题妙解汇总
- iScience | 大规模表征学习寻找分子间相互作用
- springmvc请求参数获取(自动绑定)的几种方法
- android socket io和服务器_Java socket通讯服务器和客户端教学版
- Vijos 1603 ----迷宫(矩阵乘法,矩阵快速幂)
- nvidia显卡linux 7.2,科学网—悲喜录:服务器 CentOS 7.2 安装Nvidia显卡驱动(64bit) - 袁伟的博文...
- oracle中的自增关键字,Oracle中设置自增字段
- 让Latex支持中文
- 贪婪算法matlab程序,matlab贪婪算法
- 面试经历(纯属个人经历,仅供观看参考)
- Linux安装wordpress
- 在电子电路中,为什么要进行电气隔离?
- matplotlib 网格线不要覆盖柱状图
- 纯电动汽车架构设计(一) :电动车架构设计核心与前悬架选择
- 中国最美的一千个汉字 : 千字文5
- WAF(网络应用防火墙)是什么
- 十三届双11,一部电商流量变迁史
- 如何利用ASP实现邮箱访问(转)
- 网站建设:简单动态网站搭建
- 【Umi+Dva入门实战】简述Dva、Umi和路由的理解