Atitit.论图片类型 垃圾文件的识别与清理  流程与设计原则 与api概要设计 v2 pbj

1. 俩个问题::识别垃圾文件与清理策略1

2. 如何识别垃圾图片1

2.1. 体积过小文件<10kb1

2.2. 增加扩展名对于无扩展名文件1

2.3. 清理非图片(bmp,jpg,jpeg,png)的文件2

2.4. 尺寸过小图片(210*150)2

2.5. 清理广告图片(高度宽度不成比例)超长超宽图片2

2.6. 清理重复图片(此结果不能加入指纹库)2

2.7. 非本类别的图片(人工识别)2

3. 垃圾图片文件指纹库3

3.1. 根据垃圾文件指纹库(模式结果固化)3

3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)3

4. 人工识别垃圾图片策略3

5. 清理策略3

6. Code3

6.1. 文件去重4

1. 俩个问题::识别垃圾文件与清理策略

2. 如何识别垃圾图片

2.1. 体积过小文件<10kb

2.2. 增加扩展名对于无扩展名文件

package com.attilax.clr;

import com.attilax.clr.imp.MoveExcuter;

import com.attilax.clr.imp.NoPicReconer;

import com.attilax.clr.imp.tooMinSizePicClrerPartImp;

import com.attilax.clr.imp.tooMiniPixPicClrerPartImp;

public class ClrerPicClrer extends ClrerAbs {

public static void main(String[] args) {

ClrerPicClrer c=new ClrerPicClrer();

c.dir="d:\\ati\\isheo";

c.dir="D:\\ati\\p2015\\pic_p";

NoExtnameCheckerImp  neImp=new NoExtnameCheckerImp();

c.PreProcessor=neImp;

c.traveDir(c.dir);

System.out.println("--f");

2.3. 清理非图片(bmp,jpg,jpeg,png)的文件

Gif js

2.4. 尺寸过小图片(210*150)

2.5. 清理广告图片(高度宽度不成比例)超长超宽图片

长宽比大于2的图片

2.6. 清理重复图片(此结果不能加入指纹库)

部分重复文件是广告文件,所以容易重复

2.7. 非本类别的图片(人工识别)

作者:: 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com

转载请注明来源: http://blog.csdn.net/attilax

3. 垃圾图片文件指纹库

3.1. 根据垃圾文件指纹库(模式结果固化)

3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)

4. 人工识别垃圾图片策略

不好的isho

不能like的pic

误删除的文件专门集中放在isho_manu文件夹中,人工处理

5. 清理策略

生成清理脚本(或者直接java程序模式)

移动到制定文件夹(推荐)

6. Code

AtibrowPrj

public class ClrerPicClrer extends ClrerAbs {

public static void main(String[] args) {

ClrerPicClrer c=new ClrerPicClrer();

c.dir="d:\\ati\\isheo";

//c.GabFileRecongers.add(new NoPicReconer());

tooMiniPixPicClrerPartImp ClrerPartImp = new tooMiniPixPicClrerPartImp();

ClrerPartImp.dir=c.dir;

ClrerPartImp.targetDir="d:\\ati\\tooMiniPixPic_files";

c.IClrerParts.add(ClrerPartImp);

tooMinSizePicClrerPartImp tmsc=new tooMinSizePicClrerPartImp();

tmsc.dir=c.dir;

tmsc.targetDir="d:/ati/tooMinSize_files";

c.IClrerParts.add(tmsc);

c.traveDir(c.dir);

System.out.println("--f");

}

6.1. 文件去重

DeduliAbs_ByMoveToNewFolder.java

Atitit.论图片类型 垃圾文件的识别与清理  流程与设计原则 与api概要设计 v2 pbj相关推荐

  1. Atitit.论图片类型 垃圾文件的识别与清理  流程与设计原则 与api概要设计 v2 pbj...

    Atitit.论图片类型 垃圾文件的识别与清理  流程与设计原则 与api概要设计 v2 pbj 1. 俩个问题::识别垃圾文件与清理策略1 2. 如何识别垃圾图片1 2.1. 体积过小文件<1 ...

  2. Atitit.论垃圾文件的识别与清理 文档类型垃圾文件 与api概要设计pa6.doc

    Atitit.论垃圾文件的识别与清理 文档类型垃圾文件 与api概要设计pa6.doc 1. 俩个问题::识别垃圾文件与清理策略1 1.1. 文件类型:pic,doc,v,m cc,isho pose ...

  3. android判断某文件下是否you_android判断图片类型 判断文件是否为图片文件 - 电脑常识 - 服务器之家...

    android判断图片类型 判断文件是否为图片文件 发布时间:2017-03-15 来源:服务器之家 判断文件是否为图片,仅通过后缀名判断很不全面,如果把一个txt文件后缀改成gif都会被认为是图片, ...

  4. 计算机清理垃圾文件丢失怎么恢复,清理电脑后怎样恢复丢失数据_电脑数据恢复_迷你兔...

    清理电脑后怎样恢复丢失数据_电脑数据恢复_迷你兔 分类:数据恢复常见问题|最后更新:2019年5月10日 许多人会有规划地对自己的电脑进行清理工作,这么做的原因有可能是电脑垃圾文件太多,也可能是电脑剩 ...

  5. SDWebImage 判断图片类型

    SDWebImage 判断图片类型 判断文件类型方法基本有两种: 通过文件后缀来判断 (简单,快捷 但是不准确,之前 公司android 客户端禁止用户上传 GIF , 前端默认可以播放 GIF ,有 ...

  6. 清理系统垃圾文件的常用脚本

    把下面的所有内容存放到文本文件当中,然后重命名为一个以bat结尾的文件当中,以后每隔1周左右就执行一次这个bat文件,系统里的很多垃圾文件就会被清理掉!!!感谢大家的支持!!!!!!! @echo o ...

  7. linux有必要清理内存么,Linux系统需要清理垃圾文件和优化系统吗?

    Linux系统需要清理垃圾文件和优化系统吗? 前言 首先这个是windows带来的习惯,Linux系统并不需要清理垃圾文件和优化系统! 清理垃圾 Linux下没有什么垃圾文件,最多的就是程序的缓存文件 ...

  8. macbook如何清除数据?Mac如何清理长时间的垃圾文件?

    在Macbook中,可以创建多个用户,用于管理不同的资料,但是有些用户不使用了,而他的数据还保存在电脑中,这时候就要清除这些数据来腾出Macbook有限的空间,下面分享在macbook中清除这些数据的 ...

  9. scala类型推断及库方法设计原则和==与java有何差别

    scala类型推断 方法msortSwapped(abcd)(_>_) 通常,一旦有需要推断多台方法类型参数的任务时,类型推断器就只参考第一个参数列表中所有参数类型,但不会参考之后其他参数.因为 ...

  10. Rust图片类型识别

    Rust图片类型识别 Rust的image库提供了各种的图片操作方法,对于常用的图片类型,我们可以通过简单的方法打开图片: use image::io::Reader;let img = Reader ...

最新文章

  1. SQL Server开发人员应聘常被问的问题妙解汇总
  2. iScience | 大规模表征学习寻找分子间相互作用
  3. springmvc请求参数获取(自动绑定)的几种方法
  4. android socket io和服务器_Java socket通讯服务器和客户端教学版
  5. Vijos 1603 ----迷宫(矩阵乘法,矩阵快速幂)
  6. nvidia显卡linux 7.2,科学网—悲喜录:服务器 CentOS 7.2 安装Nvidia显卡驱动(64bit) - 袁伟的博文...
  7. oracle中的自增关键字,Oracle中设置自增字段
  8. 让Latex支持中文
  9. 贪婪算法matlab程序,matlab贪婪算法
  10. 面试经历(纯属个人经历,仅供观看参考)
  11. Linux安装wordpress
  12. 在电子电路中,为什么要进行电气隔离?
  13. matplotlib 网格线不要覆盖柱状图
  14. 纯电动汽车架构设计(一) :电动车架构设计核心与前悬架选择
  15. 中国最美的一千个汉字 : 千字文5
  16. WAF(网络应用防火墙)是什么
  17. 十三届双11,一部电商流量变迁史
  18. 如何利用ASP实现邮箱访问(转)
  19. 网站建设:简单动态网站搭建
  20. 【Umi+Dva入门实战】简述Dva、Umi和路由的理解

热门文章

  1. 当Python中混进一只薛定谔的猫……
  2. 机器人到底会不会有情感?
  3. 基于FTP服务器搭建yum源
  4. maven安装jar包到本地仓库
  5. Oracle中sql相关的命令
  6. 【转】android:windowSoftInputMode属性详解
  7. Java中HttpURLConnection使用代理服务器
  8. 路由器DHCP配置及中继配置
  9. [Zju 2112][逆序对统计] 线段树(四) {线段树扩展}
  10. UNIX环境C语言进程控制