根据文件后缀来判断文件类型,往往是不靠谱的,因为要考虑到,可能人为的更改文件后缀,导致一些问题。

因此,下面是详细的根据文件头信息来判断文件类型。

文件头的十六进制以后继续补充。

package com.sample.utils;

import javax.net.ssl.HttpsURLConnection;

import javax.net.ssl.SSLContext;

import javax.net.ssl.TrustManager;

import javax.net.ssl.X509TrustManager;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import java.net.URL;

import java.net.URLConnection;

import java.security.cert.CertificateException;

import java.security.cert.X509Certificate;

import java.util.HashMap;

/**

* @Description: ...

* @Author: Li Yalei - Robin

* @Date: 2020/12/28 16:37

*/

public class MineTypeUtils {

/**

* 缓存文件头信息-文件头信息

*/

public static final HashMap mFileTypes = new HashMap();

static {

// images

mFileTypes.put("FFD8FF", "jpg");

mFileTypes.put("89504E47", "png");

mFileTypes.put("47494638", "gif");

mFileTypes.put("49492A00", "tif");

mFileTypes.put("424D", "bmp");

/*CAD*/

mFileTypes.put("41433130", "dwg");

mFileTypes.put("38425053", "psd");

/* 日记本 */

mFileTypes.put("7B5C727466", "rtf");

mFileTypes.put("3C3F786D6C", "xml");

mFileTypes.put("68746D6C3E", "html");

// 邮件

mFileTypes.put("44656C69766572792D646174653A", "eml");

mFileTypes.put("D0CF11E0", "doc");

//excel2003版本文件

mFileTypes.put("D0CF11E0", "xls");

mFileTypes.put("5374616E64617264204A", "mdb");

mFileTypes.put("252150532D41646F6265", "ps");

mFileTypes.put("255044462D312E", "pdf");

mFileTypes.put("504B0304", "docx");

//excel2007以上版本文件

mFileTypes.put("504B0304", "xlsx");

mFileTypes.put("52617221", "rar");

mFileTypes.put("57415645", "wav");

mFileTypes.put("41564920", "avi");

mFileTypes.put("2E524D46", "rm");

mFileTypes.put("000001BA", "mpg");

mFileTypes.put("000001B3", "mpg");

mFileTypes.put("6D6F6F76", "mov");

mFileTypes.put("3026B2758E66CF11", "asf");

mFileTypes.put("4D546864", "mid");

mFileTypes.put("1F8B08", "gz");

}

/**

*

Title:getFileType

*

Description: 根据文件路径获取文件头信息

*

* @param filePath 文件路径(非网络文件)

* @return 文件头信息

*/

public static String getFileType(String filePath) {

//返回十六进制 如:504B0304

//System.out.println(mFileTypes.get(getFileHeader(filePath))); //xlsx

return mFileTypes.get(getFileHeader(filePath));

}

/**

*

Title:getFileTypeByFileInputStream

*

Description: 根据文件流获取文件头信息

*

* @param is 文件流

* @return 文件头信息

*/

public static String getFileTypeByFileInputStream(InputStream is) {

return mFileTypes.get(getFileHeaderByFileInputStream(is));

}

/**

*

Title:getFileHeader

*

Description: 根据网络文件路径获取文件类型信息

*

* @param netFilePath

* @return 文件类型 @see mFileTypes

* @throws Exception

*/

public static String getFileTypeByNetFilePath(String netFilePath) throws Exception {

trustAllHosts();

URLConnection url = new URL(netFilePath).openConnection();

url.connect();

return getFileTypeByFileInputStream(url.getInputStream());

}

/**

*

Title:getFileHeader

*

Description: 根据文件路径获取文件头信息

*

* @param filePath 文件路径

* @return 十六进制文件头信息

*/

private static String getFileHeader(String filePath) {

FileInputStream is = null;

String value = null;

try {

is = new FileInputStream(filePath);

byte[] b = new byte[4];

/*

* int read() 从此输入流中读取一个数据字节。int read(byte[] b) 从此输入流中将最多 b.length

* 个字节的数据读入一个 byte 数组中。 int read(byte[] b, int off, int len)

* 从此输入流中将最多 len 个字节的数据读入一个 byte 数组中。

*/

is.read(b, 0, b.length);

value = bytesToHexString(b);

} catch (Exception e) {

} finally {

if (null != is) {

try {

is.close();

} catch (IOException e) {

}

}

}

return value;

}

/**

*

Title:getFileHeaderByFileInputStream

*

Description: 根据文件流获取文件头信息

*

* @param is 文件流

* @return 十六进制文件头信息

*/

private static String getFileHeaderByFileInputStream(InputStream is) {

String value = null;

try {

byte[] b = new byte[4];

/*

* int read() 从此输入流中读取一个数据字节。int read(byte[] b) 从此输入流中将最多 b.length

* 个字节的数据读入一个 byte 数组中。 int read(byte[] b, int off, int len)

* 从此输入流中将最多 len 个字节的数据读入一个 byte 数组中。

*/

is.read(b, 0, b.length);

value = bytesToHexString(b);

} catch (Exception e) {

} finally {

if (null != is) {

try {

is.close();

} catch (IOException e) {

}

}

}

return value;

}

/**

*

Title:bytesToHexString

*

Description: 将要读取文件头信息的文件的byte数组转换成string类型表示

*

* @param src 要读取文件头信息的文件的byte数组

* @return 文件头信息

*/

private static String bytesToHexString(byte[] src) {

StringBuilder builder = new StringBuilder();

if (src == null || src.length <= 0) {

return null;

}

String hv;

for (int i = 0; i < src.length; i++) {

// 以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式,并转换为大写

hv = Integer.toHexString(src[i] & 0xFF).toUpperCase();

if (hv.length() < 2) {

builder.append(0);

}

builder.append(hv);

}

//System.out.println(builder.toString());

return builder.toString();

}

/**

* 解决网络证书问题

* 如下异常: unable to find valid certification path to requested target

*

* @throws Exception

*/

public static void trustAllHosts() throws Exception {

// Create a trust manager that does not validate certificate chains

TrustManager[] trustAllCerts = new TrustManager[]{new X509TrustManager() {

@Override

public java.security.cert.X509Certificate[] getAcceptedIssuers() {

return new java.security.cert.X509Certificate[]{};

}

@Override

public void checkClientTrusted(X509Certificate[] chain, String authType)

throws CertificateException {

}

@Override

public void checkServerTrusted(X509Certificate[] chain, String authType)

throws CertificateException {

}

}

};

try {

SSLContext sc = SSLContext.getInstance("TLS");

sc.init(null, trustAllCerts, new java.security.SecureRandom());

HttpsURLConnection.setDefaultSSLSocketFactory(sc.getSocketFactory());

} catch (Exception e) {

e.printStackTrace();

}

}

}

测试:

@Test

public void testSparkRun() throws Exception{

String panFile = "https://fft.xyyv.domain/s/b1Ll23rv?direct=1&access=DRaf9I";

String type = MineTypeUtils.getFileTypeByNetFilePath(panFile);

System.out.println(type);

}

输出:

image.png

注意:xlsx和docx是文件头是一样的,xls和doc的文件头是一样的,目前还没有找到合适的方式区分,欢迎留言告诉我你的解决办法。

java 文件类型判断_Java:判断文件类型(支持网络文件)相关推荐

  1. java阅读doc文件格式_java – 正确区分.xls和.doc文件的方法?

    .doc / .xls文档都可以以OLE2存储格式存储. org.apache.poi.poifs.filesystem.FileMagic可以帮助您仅检测文件存储格式,而不仅仅是为了区分.doc / ...

  2. java中属性文件读取案例_java相关:Spring中属性文件properties的读取与使用详解

    java相关:Spring中属性文件properties的读取与使用详解 发布于 2020-6-3| 复制链接 摘记: Spring中属性文件properties的读取与使用详解实际项目中,通常将一些 ...

  3. java高效复制文件并移动_Java 7:复制和移动文件和目录

    java高效复制文件并移动 这篇文章是我对Java 7 java.nio.file软件包的系列文章的继续,这次涵盖了文件的复制和移动以及完整的目录树. 如果您曾经对Java缺少copy和move方法感 ...

  4. java类型提升_java表达式中类型的自动提升(转)

    java表达式中类型的自动提升(转)[@more@]除了赋值,还有另外一种类型变换:在表达式中.想要知道原因,往下看.在表达式中,对中间值的精确要求有时超过任何一个操作数的范围.例如,考虑下面的表达式 ...

  5. java url类下载_Java根据url下载图片或文件的工具类-Fun言

    package cn.funyan.utils; import java.io.FileOutputStream; import java.io.IOException; import java.io ...

  6. 描述java泛型引入原则_Java/泛型的类型擦除/README.md · oslo/LearningNotes - Gitee.com

    前言 Java 泛型(Generic)的引入加强了参数类型的安全性,减少了类型的转换,但有一点需要注意:Java 的泛型在编译器有效,在运行期被删除,也就是说所有泛型参数类型在编译后都会被清除掉,看下 ...

  7. java 字符是否存在_java判断字符是否存在的方法

    java判断字符是否存在的方法 发布时间:2020-06-10 09:41:51 来源:亿速云 阅读:165 作者:Leah 这篇文章给大家分享的是java判断字符是否存在的方法.小编觉得挺实用的,因 ...

  8. java 类型推理_java 11 局部变量类型推断

    什么是局部变量类型推断? var javastack = "javastack"; System.out.println(javastack); 大家看出来了,局部变量类型推断就是 ...

  9. java ajax多文件上传插件_ajaxFileUpload.js插件支持多文件上传的方法

    前提条件: ajaxFileUpload.js插件多文件上传 步骤: 1.修改源码,(源码只支持单个文件的上传): //修改前代码------- //var oldElement = jQuery(' ...

最新文章

  1. python求向量函数的雅可比矩阵_在python Numpy中求向量和矩阵的范数实例
  2. 小样本学习 | Learning to Compare: Relation Network for Few-Shot Learning
  3. 算法训练 字符串编辑 java
  4. Java内部类实例测试及总结
  5. [译]CSS3实现柱状图的3D立体动画效果
  6. IIS7 经典模式和集成模式的区别分析(转载)
  7. 图像处理工具包ImagXpress使用教程:多页TIFF编辑API的使用(二)
  8. 解决git push报错error: failed to push some refs to 的问题
  9. iOS app 启动 crash XCode 11 NSPOSIXErrorDomain Code=2 “No such file or directory“
  10. 项目视频讲解_基于SSH2+Maven+EasyUI+MySQL技术实战开发易买网电子商务交易平台
  11. 码神之路博客部署总结补充
  12. JAVA输入五中水果英文名称_水果英文名称大全
  13. 【原创】笔记本键盘故障的心得一二
  14. linux查找与替换练习
  15. python类计算器开发_开发一个简单的python计算器
  16. 计算思维运用计算机的例子,计算思维案例及平时成绩讨论题资料.doc
  17. 自媒体视频剪辑,怎样去掉视频中的字幕和水印
  18. springboot动态调整日志级别
  19. Spark 算子之groupBy使用
  20. 基于普中科技的单片机开发实验仪编写的数字表

热门文章

  1. [译] SwiftUI 官方教程 (五)
  2. 2022全球开发者薪资曝光:中国排在第19名,使用Go语言最赚钱
  3. 张小龙1.5万字最新演讲:微信十周年,回答一切
  4. excel如何做条件判断
  5. Nunjucks模板入门
  6. html表格取消内部竖线的五个步骤,实例在线
  7. python numba教程_numba从入门到精通(1)—为什么numba能够加速
  8. 使用simhash计算文本相似度
  9. 恐怖黎明稳定服务器,恐怖黎明服务器不匹配 | 手游网游页游攻略大全
  10. java学习小结:set集合原理及特点