如何知道一个文件是否改变了呢?当然是用比较文件hash值的方法,文件hash又叫文件签名,文件中哪怕一个bit位被改变了,文件hash就会不同。

比较常用的文件hash算法有MD5和SHA-1。
我用的是MD5算法,java中,计算MD5可以用MessageDigest这个类。

下面提供两个工具类(请使用第一个工具类,第二个有问题

第一个工具类:

代码如下:

package com.test;  import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStream;
import java.math.BigInteger;
import java.security.MessageDigest;  public class MD5Util {  public static void main(String[] args) {  try {  //此处我测试的是我本机jdk源码文件的MD5值 String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";String md5Hashcode = md5HashCode(filePath);String md5Hashcode32 = md5HashCode32(filePath);  System.out.println(md5Hashcode + ":文件的md5值");  System.out.println(md5Hashcode32+":文件32位的md5值"); //System.out.println(-100 & 0xff);} catch (FileNotFoundException e) {  e.printStackTrace();  }  }  /*** 获取文件的md5值 ,有可能不是32位* @param filePath  文件路径* @return* @throws FileNotFoundException*/public static String md5HashCode(String filePath) throws FileNotFoundException{  FileInputStream fis = new FileInputStream(filePath);  return md5HashCode(fis);  }  /*** 保证文件的MD5值为32位* @param filePath   文件路径* @return* @throws FileNotFoundException*/public static String md5HashCode32(String filePath) throws FileNotFoundException{  FileInputStream fis = new FileInputStream(filePath);  return md5HashCode32(fis);  }  /*** java获取文件的md5值  * @param fis 输入流* @return*/public static String md5HashCode(InputStream fis) {  try {  //拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256  MessageDigest md = MessageDigest.getInstance("MD5"); //分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。byte[] buffer = new byte[1024];  int length = -1;  while ((length = fis.read(buffer, 0, 1024)) != -1) {  md.update(buffer, 0, length);  }  fis.close();//转换并返回包含16个元素字节数组,返回数值范围为-128到127byte[] md5Bytes  = md.digest();BigInteger bigInt = new BigInteger(1, md5Bytes);//1代表绝对值 return bigInt.toString(16);//转换为16进制} catch (Exception e) {  e.printStackTrace();  return "";  }  }  /*** java计算文件32位md5值* @param fis 输入流* @return*/public static String md5HashCode32(InputStream fis) {try {//拿到一个MD5转换器,如果想使用SHA-1或SHA-256,则传入SHA-1,SHA-256  MessageDigest md = MessageDigest.getInstance("MD5");//分多次将一个文件读入,对于大型文件而言,比较推荐这种方式,占用内存比较少。byte[] buffer = new byte[1024];int length = -1;while ((length = fis.read(buffer, 0, 1024)) != -1) {md.update(buffer, 0, length);}fis.close();//转换并返回包含16个元素字节数组,返回数值范围为-128到127byte[] md5Bytes  = md.digest();StringBuffer hexValue = new StringBuffer();for (int i = 0; i < md5Bytes.length; i++) {int val = ((int) md5Bytes[i]) & 0xff;//解释参见最下方if (val < 16) {/*** 如果小于16,那么val值的16进制形式必然为一位,* 因为十进制0,1...9,10,11,12,13,14,15 对应的 16进制为 0,1...9,a,b,c,d,e,f;* 此处高位补0。*/hexValue.append("0");}//这里借助了Integer类的方法实现16进制的转换 hexValue.append(Integer.toHexString(val));}return hexValue.toString();} catch (Exception e) {e.printStackTrace();return "";}}/*** 方法md5HashCode32 中     ((int) md5Bytes[i]) & 0xff   操作的解释:* 在Java语言中涉及到字节byte数组数据的一些操作时,经常看到 byte[i] & 0xff这样的操作,这里就记录总结一下这里包含的意义: * 1、0xff是16进制(十进制是255),它默认为整形,二进制位为32位,最低八位是“1111 1111”,其余24位都是0。 * 2、&运算: 如果2个bit都是1,则得1,否则得0; * 3、byte[i] & 0xff:首先,这个操作一般都是在将byte数据转成int或者其他整形数据的过程中;使用了这个操作,最终的整形数据只有低8位有数据,其他位数都为0。 * 4、这个操作得出的整形数据都是大于等于0并且小于等于255的*/}

运行结果如下图:

第二个工具类:

结果一定为32位的,具体可看代码,代码如下:

package com.test;import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.nio.ByteBuffer;
import java.nio.channels.FileChannel;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.Arrays;/*** Md5校验工具类*/
public class MD5Util2 {private static final char[] hexDigits = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9','a', 'b', 'c', 'd', 'e', 'f'};public static void main(String[] args) {//此处我测试的是我本机jdk源码文件的MD5值String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";String md5Hashcode2 = MD5Util2.getFileMD5(new File(filePath));System.out.println("MD5Util2计算文件md5值为:" + md5Hashcode2);System.out.println("MD5Util2计算文件md5值的长度为:" + md5Hashcode2.length());}/*** Get MD5 of a file (lower case)* @return empty string if I/O error when get MD5*/public static String getFileMD5( File file) {FileInputStream in = null;try {in = new FileInputStream(file);FileChannel ch = in.getChannel();return MD5(ch.map(FileChannel.MapMode.READ_ONLY, 0, file.length()));} catch (FileNotFoundException e) {return "";} catch (IOException e) {return "";} finally {if (in != null) {try {in.close();} catch (IOException e) {// 关闭流产生的错误一般都可以忽略}}}}/*** MD5校验字符串* @param s String to be MD5* @return 'null' if cannot get MessageDigest*/private static String getStringMD5( String s) {MessageDigest mdInst;try {// 获得MD5摘要算法的 MessageDigest 对象mdInst = MessageDigest.getInstance("MD5");} catch (NoSuchAlgorithmException e) {e.printStackTrace();return "";}byte[] btInput = s.getBytes();// 使用指定的字节更新摘要mdInst.update(btInput);// 获得密文byte[] md = mdInst.digest();// 把密文转换成十六进制的字符串形式int length = md.length;char str[] = new char[length * 2];int k = 0;for (byte b : md) {str[k++] = hexDigits[b >>> 4 & 0xf];str[k++] = hexDigits[b & 0xf];}return new String(str);}@SuppressWarnings("unused")private static String getSubStr( String str, int subNu, char replace) {int length = str.length();if (length > subNu) {str = str.substring(length - subNu, length);} else if (length < subNu) {// NOTE: padding字符填充在字符串的右侧,和服务器的算法是一致的str += createPaddingString(subNu - length, replace);}return str;}private static String createPaddingString(int n, char pad) {if (n <= 0) {return "";}char[] paddingArray = new char[n];Arrays.fill(paddingArray, pad);return new String(paddingArray);}/*** 计算MD5校验* @param buffer* @return 空串,如果无法获得 MessageDigest实例*/private static String MD5(ByteBuffer buffer) {String s = "";try {MessageDigest md = MessageDigest.getInstance("MD5");md.update(buffer);byte tmp[] = md.digest(); // MD5 的计算结果是一个 128 位的长整数,// 用字节表示就是 16 个字节char str[] = new char[16 * 2]; // 每个字节用 16 进制表示的话,使用两个字符,// 所以表示成 16 进制需要 32 个字符int k = 0; // 表示转换结果中对应的字符位置for (int i = 0; i < 16; i++) { // 从第一个字节开始,对 MD5 的每一个字节// 转换成 16 进制字符的转换byte byte0 = tmp[i]; // 取第 i 个字节str[k++] = hexDigits[byte0 >>> 4 & 0xf]; // 取字节中高 4 位的数字转换, >>>,// 逻辑右移,将符号位一起右移str[k++] = hexDigits[byte0 & 0xf]; // 取字节中低 4 位的数字转换}s = new String(str); // 换后的结果转换为字符串} catch (NoSuchAlgorithmException e) {e.printStackTrace();}return s;}}

运行结果如下图:

两个工具类的对比:

测试代码如下:

package com.test;import java.io.File;
import java.io.FileNotFoundException;public class test {public static void main(String[] args) {try {//此处我测试的是我本机jdk源码文件的MD5值String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";long start = System.currentTimeMillis();String md5Hashcode = MD5Util.md5HashCode(filePath);long end = System.currentTimeMillis();String md5Hashcode2 = MD5Util2.getFileMD5(new File(filePath));long end1 = System.currentTimeMillis();System.out.println("MD5Util 计算文件md5值为:" + md5Hashcode + " --useTime:"+(end-start));System.out.println("MD5Util2计算文件md5值为:" + md5Hashcode2 + " --useTime:"+(end1-end));} catch (FileNotFoundException e) {e.printStackTrace();}}
}

运行结果如下图:

结论:

虽然对比用时,感觉使用第二个工具类效率更高!

但是 NIO的FileChannel 存在一个巨大的BUG使用它会一直不释放文件句柄,即生成MD5的文件不能操作(移动或删除等),这个BUG网上吵得沸沸扬扬,至今没有解决,毕竟是SUN的BUG,解铃还需系铃人啊!所以推荐使用文件分块读取的方法-

即应该用第一个工具类!

即应该用第一个工具类!

即应该用第一个工具类!

番外篇:

其实还有一个重点,就是如何知道自己生成的MD5值是否正确呢?

方法很多,其实有一个挺简单的方法,不需要另外安装什么软件。

使用windows自带的命令即可:certutil -hashfile [文件路径] MD5,

例子如下:

Java计算文件的hash值相关推荐

  1. 【转】Java计算文件的hash值

    原文地址:http://blog.csdn.net/qq_25646191/article/details/78863110 如何知道一个文件是否改变了呢?当然是用比较文件hash值的方法,文件has ...

  2. Linux和Windows下计算文件的Hash值

    Linux和Windows下计算文件的Hash值 MD和SHA简介 MD SHA MD5 SHA1标识文件唯一性 Linux Windows 不需要下载工具,也不需要写代码. MD和SHA简介 MD ...

  3. 使用Java计算文件的MD5值(含修改MD5值的方法)

    什么是 MD5 ? MD5(Message Digest Algorithm,信息摘要算法),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hash value),用于确保 ...

  4. 计算文件的hash值方法 | 使用powershell 以及 使用python

    使用windows的powershell进行get-filehash命令计算 使用python的hashlib库,进行文件的hash运算

  5. windows10下用PowerShell命令(Get-FileHash)校验文件的Hash值(MD5、SHA1、SHA256等)

    前言 以前校验hash值都是用另外一软件,比如"hash.exe".今天查了一下,发现windows10的PowerShell命令自带的Get-FileHash命令可以直接用来计算 ...

  6. vue 计算文件hash值_vue项目打包文件增加hash值

    vue项目打包文件增加hash值 vue-cli2项目 修改vue项目根目录下的 build/webpack.prod.conf.js文件 js文件: output: { path: config.b ...

  7. linux 文件md5,Linux下计算文件的MD5值

    脚本功能 脚本使用Perl编写,计算文件的MD5值 脚本用途 服务器在安装完操作系统后,计算PATH变量里面所有的二进制文件的MD5.计算单个文件MD5值.计算某个目录(包括子目录)下所有的文件的MD ...

  8. 存储 dict 的元素前是计算 key 的 hash 值?

    dict 的高性能与其存储方式是分不开的,我们知道 dict 的存储是基于哈希表(又称散列表),需要计算 hash 值,那么是计算谁的 hash 值呢?是像别人说的:存储 dict 元素前计算 key ...

  9. c语言md5函数 linux,Linux下C语言计算文件的md5值(长度32)

    google了好久都没有找到合适的,其实我只需要一个函数,能计算文件的 md5 值就好, 后来找到了 md5.h 和 md5.c 的源文件,仿照别人的封装了个函数(他那个有问题,和 md5sum 计算 ...

最新文章

  1. C程序设计-----第1次作业
  2. awk取文本列_awk命令结构/内置变量/获取文本某行或某列
  3. vorwerk 机器人_福维克(Vorwerk)--吸尘器行业的quot;安利quot;
  4. 1053 Path of Equal Weight
  5. Draft-微软出品的云原生下的本地开发辅助工具
  6. python 常用算法学习(1)
  7. (九)HTML5本地存储——本地数据库SQLLite的使用
  8. 人工神经网络matlab啊6,MATLAB人工神经网络教程
  9. 【贯穿】.NET6结合Docker傻瓜式实现容器编排
  10. ReadDirectoryChangesW 函数
  11. 网易新闻 时事新闻抓取链接
  12. PC软件开发技术之二:用C#开发基于自动化接口的OPC客户端
  13. 树莓派摄像头_Arducam 8MP重磅来袭,为树莓派4B构建完全同步的双摄像头方案~
  14. weak password
  15. html ui 下拉列表,html - 如何给样式Material-ui选择字段下拉菜单?
  16. TCP和TCP/IP的区别
  17. 将Excel中的信息生成奖状
  18. EXCEL数组公式(3)---数组公式的基础应用,理解数组公式
  19. 【坐标转换】四参数和七参数计算,并正向转换坐标(附完整源代码地址)
  20. 八佰(800)低代码精耕行业细分领域数字化转型

热门文章

  1. 输出21世纪中截止某个年份以来的所有闰年年份。注意:闰年的判别条件是该年年份能被4整除但不能被100整除、或者能被400整除。
  2. linux搭建本地YUM源配置详细步骤
  3. PT展现场直击,广和通5G模组点亮数字化未来
  4. Doxygen使用指南,Doxygen介绍一
  5. 拖库还是撞库?网易邮箱罗生门
  6. ARCore之路-放置物体
  7. 2017考研复试:过来人总结经验教训
  8. 存储需求大幅增长,企业如何应对挑战?
  9. 如何在Ubuntu系统 上登录北理工教务处查看选项(转自FTP联盟)亲测成功
  10. matlab计算数据潮汐因子,基于MATLAB的重力固体潮理论值计算