java 文件类型判断_Java:判断文件类型(支持网络文件)
根据文件后缀来判断文件类型,往往是不靠谱的,因为要考虑到,可能人为的更改文件后缀,导致一些问题。
因此,下面是详细的根据文件头信息来判断文件类型。
文件头的十六进制以后继续补充。
package com.sample.utils;
import javax.net.ssl.HttpsURLConnection;
import javax.net.ssl.SSLContext;
import javax.net.ssl.TrustManager;
import javax.net.ssl.X509TrustManager;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.security.cert.CertificateException;
import java.security.cert.X509Certificate;
import java.util.HashMap;
/**
* @Description: ...
* @Author: Li Yalei - Robin
* @Date: 2020/12/28 16:37
*/
public class MineTypeUtils {
/**
* 缓存文件头信息-文件头信息
*/
public static final HashMap mFileTypes = new HashMap();
static {
// images
mFileTypes.put("FFD8FF", "jpg");
mFileTypes.put("89504E47", "png");
mFileTypes.put("47494638", "gif");
mFileTypes.put("49492A00", "tif");
mFileTypes.put("424D", "bmp");
/*CAD*/
mFileTypes.put("41433130", "dwg");
mFileTypes.put("38425053", "psd");
/* 日记本 */
mFileTypes.put("7B5C727466", "rtf");
mFileTypes.put("3C3F786D6C", "xml");
mFileTypes.put("68746D6C3E", "html");
// 邮件
mFileTypes.put("44656C69766572792D646174653A", "eml");
mFileTypes.put("D0CF11E0", "doc");
//excel2003版本文件
mFileTypes.put("D0CF11E0", "xls");
mFileTypes.put("5374616E64617264204A", "mdb");
mFileTypes.put("252150532D41646F6265", "ps");
mFileTypes.put("255044462D312E", "pdf");
mFileTypes.put("504B0304", "docx");
//excel2007以上版本文件
mFileTypes.put("504B0304", "xlsx");
mFileTypes.put("52617221", "rar");
mFileTypes.put("57415645", "wav");
mFileTypes.put("41564920", "avi");
mFileTypes.put("2E524D46", "rm");
mFileTypes.put("000001BA", "mpg");
mFileTypes.put("000001B3", "mpg");
mFileTypes.put("6D6F6F76", "mov");
mFileTypes.put("3026B2758E66CF11", "asf");
mFileTypes.put("4D546864", "mid");
mFileTypes.put("1F8B08", "gz");
}
/**
*
Title:getFileType
*
Description: 根据文件路径获取文件头信息
*
* @param filePath 文件路径(非网络文件)
* @return 文件头信息
*/
public static String getFileType(String filePath) {
//返回十六进制 如:504B0304
//System.out.println(mFileTypes.get(getFileHeader(filePath))); //xlsx
return mFileTypes.get(getFileHeader(filePath));
}
/**
*
Title:getFileTypeByFileInputStream
*
Description: 根据文件流获取文件头信息
*
* @param is 文件流
* @return 文件头信息
*/
public static String getFileTypeByFileInputStream(InputStream is) {
return mFileTypes.get(getFileHeaderByFileInputStream(is));
}
/**
*
Title:getFileHeader
*
Description: 根据网络文件路径获取文件类型信息
*
* @param netFilePath
* @return 文件类型 @see mFileTypes
* @throws Exception
*/
public static String getFileTypeByNetFilePath(String netFilePath) throws Exception {
trustAllHosts();
URLConnection url = new URL(netFilePath).openConnection();
url.connect();
return getFileTypeByFileInputStream(url.getInputStream());
}
/**
*
Title:getFileHeader
*
Description: 根据文件路径获取文件头信息
*
* @param filePath 文件路径
* @return 十六进制文件头信息
*/
private static String getFileHeader(String filePath) {
FileInputStream is = null;
String value = null;
try {
is = new FileInputStream(filePath);
byte[] b = new byte[4];
/*
* int read() 从此输入流中读取一个数据字节。int read(byte[] b) 从此输入流中将最多 b.length
* 个字节的数据读入一个 byte 数组中。 int read(byte[] b, int off, int len)
* 从此输入流中将最多 len 个字节的数据读入一个 byte 数组中。
*/
is.read(b, 0, b.length);
value = bytesToHexString(b);
} catch (Exception e) {
} finally {
if (null != is) {
try {
is.close();
} catch (IOException e) {
}
}
}
return value;
}
/**
*
Title:getFileHeaderByFileInputStream
*
Description: 根据文件流获取文件头信息
*
* @param is 文件流
* @return 十六进制文件头信息
*/
private static String getFileHeaderByFileInputStream(InputStream is) {
String value = null;
try {
byte[] b = new byte[4];
/*
* int read() 从此输入流中读取一个数据字节。int read(byte[] b) 从此输入流中将最多 b.length
* 个字节的数据读入一个 byte 数组中。 int read(byte[] b, int off, int len)
* 从此输入流中将最多 len 个字节的数据读入一个 byte 数组中。
*/
is.read(b, 0, b.length);
value = bytesToHexString(b);
} catch (Exception e) {
} finally {
if (null != is) {
try {
is.close();
} catch (IOException e) {
}
}
}
return value;
}
/**
*
Title:bytesToHexString
*
Description: 将要读取文件头信息的文件的byte数组转换成string类型表示
*
* @param src 要读取文件头信息的文件的byte数组
* @return 文件头信息
*/
private static String bytesToHexString(byte[] src) {
StringBuilder builder = new StringBuilder();
if (src == null || src.length <= 0) {
return null;
}
String hv;
for (int i = 0; i < src.length; i++) {
// 以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式,并转换为大写
hv = Integer.toHexString(src[i] & 0xFF).toUpperCase();
if (hv.length() < 2) {
builder.append(0);
}
builder.append(hv);
}
//System.out.println(builder.toString());
return builder.toString();
}
/**
* 解决网络证书问题
* 如下异常: unable to find valid certification path to requested target
*
* @throws Exception
*/
public static void trustAllHosts() throws Exception {
// Create a trust manager that does not validate certificate chains
TrustManager[] trustAllCerts = new TrustManager[]{new X509TrustManager() {
@Override
public java.security.cert.X509Certificate[] getAcceptedIssuers() {
return new java.security.cert.X509Certificate[]{};
}
@Override
public void checkClientTrusted(X509Certificate[] chain, String authType)
throws CertificateException {
}
@Override
public void checkServerTrusted(X509Certificate[] chain, String authType)
throws CertificateException {
}
}
};
try {
SSLContext sc = SSLContext.getInstance("TLS");
sc.init(null, trustAllCerts, new java.security.SecureRandom());
HttpsURLConnection.setDefaultSSLSocketFactory(sc.getSocketFactory());
} catch (Exception e) {
e.printStackTrace();
}
}
}
测试:
@Test
public void testSparkRun() throws Exception{
String panFile = "https://fft.xyyv.domain/s/b1Ll23rv?direct=1&access=DRaf9I";
String type = MineTypeUtils.getFileTypeByNetFilePath(panFile);
System.out.println(type);
}
输出:
image.png
注意:xlsx和docx是文件头是一样的,xls和doc的文件头是一样的,目前还没有找到合适的方式区分,欢迎留言告诉我你的解决办法。
java 文件类型判断_Java:判断文件类型(支持网络文件)相关推荐
- java阅读doc文件格式_java – 正确区分.xls和.doc文件的方法?
.doc / .xls文档都可以以OLE2存储格式存储. org.apache.poi.poifs.filesystem.FileMagic可以帮助您仅检测文件存储格式,而不仅仅是为了区分.doc / ...
- java中属性文件读取案例_java相关:Spring中属性文件properties的读取与使用详解
java相关:Spring中属性文件properties的读取与使用详解 发布于 2020-6-3| 复制链接 摘记: Spring中属性文件properties的读取与使用详解实际项目中,通常将一些 ...
- java高效复制文件并移动_Java 7:复制和移动文件和目录
java高效复制文件并移动 这篇文章是我对Java 7 java.nio.file软件包的系列文章的继续,这次涵盖了文件的复制和移动以及完整的目录树. 如果您曾经对Java缺少copy和move方法感 ...
- java类型提升_java表达式中类型的自动提升(转)
java表达式中类型的自动提升(转)[@more@]除了赋值,还有另外一种类型变换:在表达式中.想要知道原因,往下看.在表达式中,对中间值的精确要求有时超过任何一个操作数的范围.例如,考虑下面的表达式 ...
- java url类下载_Java根据url下载图片或文件的工具类-Fun言
package cn.funyan.utils; import java.io.FileOutputStream; import java.io.IOException; import java.io ...
- 描述java泛型引入原则_Java/泛型的类型擦除/README.md · oslo/LearningNotes - Gitee.com
前言 Java 泛型(Generic)的引入加强了参数类型的安全性,减少了类型的转换,但有一点需要注意:Java 的泛型在编译器有效,在运行期被删除,也就是说所有泛型参数类型在编译后都会被清除掉,看下 ...
- java 字符是否存在_java判断字符是否存在的方法
java判断字符是否存在的方法 发布时间:2020-06-10 09:41:51 来源:亿速云 阅读:165 作者:Leah 这篇文章给大家分享的是java判断字符是否存在的方法.小编觉得挺实用的,因 ...
- java 类型推理_java 11 局部变量类型推断
什么是局部变量类型推断? var javastack = "javastack"; System.out.println(javastack); 大家看出来了,局部变量类型推断就是 ...
- java ajax多文件上传插件_ajaxFileUpload.js插件支持多文件上传的方法
前提条件: ajaxFileUpload.js插件多文件上传 步骤: 1.修改源码,(源码只支持单个文件的上传): //修改前代码------- //var oldElement = jQuery(' ...
最新文章
- python求向量函数的雅可比矩阵_在python Numpy中求向量和矩阵的范数实例
- 小样本学习 | Learning to Compare: Relation Network for Few-Shot Learning
- 算法训练 字符串编辑 java
- Java内部类实例测试及总结
- [译]CSS3实现柱状图的3D立体动画效果
- IIS7 经典模式和集成模式的区别分析(转载)
- 图像处理工具包ImagXpress使用教程:多页TIFF编辑API的使用(二)
- 解决git push报错error: failed to push some refs to 的问题
- iOS app 启动 crash XCode 11 NSPOSIXErrorDomain Code=2 “No such file or directory“
- 项目视频讲解_基于SSH2+Maven+EasyUI+MySQL技术实战开发易买网电子商务交易平台
- 码神之路博客部署总结补充
- JAVA输入五中水果英文名称_水果英文名称大全
- 【原创】笔记本键盘故障的心得一二
- linux查找与替换练习
- python类计算器开发_开发一个简单的python计算器
- 计算思维运用计算机的例子,计算思维案例及平时成绩讨论题资料.doc
- 自媒体视频剪辑,怎样去掉视频中的字幕和水印
- springboot动态调整日志级别
- Spark 算子之groupBy使用
- 基于普中科技的单片机开发实验仪编写的数字表