1. Introduction
MD5算法是一种消息摘要算法(Message Digest Algorithm),此算法以任意长度的信息(message)作为输入进行计算,产生一个128-bit(16-byte)的指纹或报文摘要(fingerprint or message digest)。两个不同的message产生相同message digest的几率相当小,从一个给定的message digest逆向产生原始message更是困难(不过据说我国的某个教授很善于从message digest构造message),因此MD5算法适合用在数字签名应用中。MD5实现简单,在32位的机器上运行速度也相当快,当然实际应用也不仅仅局限于数字签名。

2. MD5 Algorithm Description
假设输入信息(input message)的长度为b(bit),我们想要产生它的报文摘要,在此处b为任意的非负整数:b也可能为0,也不一定为8的整数倍,且可能是任意大的长度。设该信息的比特流表示如下:

M[0] M[1] M[2] ... M[b-1]

计算此信息的报文摘要需要如下5步:
2.1 Append Padding Bits
信息计算前先要进行位补位,设补位后信息的长度为LEN(bit),则LEN%512 = 448(bit),即数据扩展至
K*512+448(bit)。即K*64+56(byte),K为整数。补位操作始终要执行,即使补位前信息的长度对512求余的结果是448。具体补位操作:补一个1,然后补0至满足上述要求。总共最少要补1bit,最多补512bit。

2.2 Append Length
将输入信息的原始长度b(bit)表示成一个64-bit的数字,把它添加到上一步的结果后面(在32位的机器上,这64位将用2个字来表示并且低位在前)。当遇到b大于2^64这种极少的情况时,b的高位被截去,仅使用b的低64位。经过上面两步,数据就被填补成长度为512(bit)的倍数。也就是说,此时的数据长度是16个字(32bit)的整数倍。此时的数据表示为:

M[0 ... N-1]

其中的N是16的倍数。

2.3 Initialize MD Buffer
用一个四个字的缓冲器(A,B,C,D)来计算报文摘要,A,B,C,D分别是32位的寄存器,初始化使用的是十六进制表示的数字,注意低字节在前:

word A: 01 23 45 67
        word B: 89 ab cd ef
        word C: fe dc ba 98
        word D: 76 54 32 10

2.4 Process Message in 16-Word Blocks
首先定义4个辅助函数,每个函数的输入是三个32位的字,输出是一个32位的字:

F(X,Y,Z) = XY v not(X) Z
        G(X,Y,Z) = XZ v Y not(Z)
        H(X,Y,Z) = X xor Y xor Z
        I(X,Y,Z) = Y xor (X v not(Z))

NOTE:not(X)代表X的按位补运算,X v Y 表示X和Y的按位或运算,X xor Y代表X和Y的按位异或运算,XY代表X和Y的按位与运算。

具体过程如下:

 1 /* Process each 16-word block. */
 2    For i = 0 to N/16-1 do
 3 
 4      /* Copy block i into X. */
 5      For j = 0 to 15 do
 6        Set X[j] to M[i*16+j].
 7      end /* of loop on j */
 8 
 9      /* Save A as AA, B as BB, C as CC, and D as DD. */
10      AA = A
11      BB = B
12      CC = C
13      DD = D
14 
15      /* Round 1. */
16      /* Let [abcd k s i] denote the operation
17           a = b + ((a + F(b,c,d) + X[k] + T[i]) <<< s). */
18      /* Do the following 16 operations. */
19      [ABCD  0  7  1]  [DABC  1 12  2]  [CDAB  2 17  3]  [BCDA  3 22  4]
20      [ABCD  4  7  5]  [DABC  5 12  6]  [CDAB  6 17  7]  [BCDA  7 22  8]
21      [ABCD  8  7  9]  [DABC  9 12 10]  [CDAB 10 17 11]  [BCDA 11 22 12]
22      [ABCD 12  7 13]  [DABC 13 12 14]  [CDAB 14 17 15]  [BCDA 15 22 16]
23 
24      /* Round 2. */
25      /* Let [abcd k s i] denote the operation
26           a = b + ((a + G(b,c,d) + X[k] + T[i]) <<< s). */
27      /* Do the following 16 operations. */
28      [ABCD  1  5 17]  [DABC  6  9 18]  [CDAB 11 14 19]  [BCDA  0 20 20]
29      [ABCD  5  5 21]  [DABC 10  9 22]  [CDAB 15 14 23]  [BCDA  4 20 24]
30      [ABCD  9  5 25]  [DABC 14  9 26]  [CDAB  3 14 27]  [BCDA  8 20 28]
31      [ABCD 13  5 29]  [DABC  2  9 30]  [CDAB  7 14 31]  [BCDA 12 20 32]
32 
33      /* Round 3. */
34      /* Let [abcd k s t] denote the operation
35           a = b + ((a + H(b,c,d) + X[k] + T[i]) <<< s). */
36      /* Do the following 16 operations. */
37      [ABCD  5  4 33]  [DABC  8 11 34]  [CDAB 11 16 35]  [BCDA 14 23 36]
38      [ABCD  1  4 37]  [DABC  4 11 38]  [CDAB  7 16 39]  [BCDA 10 23 40]
39      [ABCD 13  4 41]  [DABC  0 11 42]  [CDAB  3 16 43]  [BCDA  6 23 44]
40      [ABCD  9  4 45]  [DABC 12 11 46]  [CDAB 15 16 47]  [BCDA  2 23 48]
41 
42      /* Round 4. */
43      /* Let [abcd k s t] denote the operation
44           a = b + ((a + I(b,c,d) + X[k] + T[i]) <<< s). */
45      /* Do the following 16 operations. */
46      [ABCD  0  6 49]  [DABC  7 10 50]  [CDAB 14 15 51]  [BCDA  5 21 52]
47      [ABCD 12  6 53]  [DABC  3 10 54]  [CDAB 10 15 55]  [BCDA  1 21 56]
48      [ABCD  8  6 57]  [DABC 15 10 58]  [CDAB  6 15 59]  [BCDA 13 21 60]
49      [ABCD  4  6 61]  [DABC 11 10 62]  [CDAB  2 15 63]  [BCDA  9 21 64]
50 
51      /* Then perform the following additions. (That is increment each
52         of the four registers by the value it had before this block
53         was started.) */
54      A = A + AA
55      B = B + BB
56      C = C + CC
57      D = D + DD
58 
59    end /* of loop on i */

2.5 Output
报文摘要的产生后的形式为:A,B,C,D。也就是低位字节A开始,高位字节D结束。

3. C++ Implementation
有了上面5个步骤的算法描述,用C++实现起来就很直接了。需要注意的是在具体实现的时候上述5个步骤的顺序会有所变动,因为在大多数情况下我们都无法或很难提前计算出输入信息的长度b(如输入信息来自文件或网络)。因此在具体实现时Append Padding Bits和Append Length这两步会放在最后面。

4. Test Suite
由于实现代码比较长,在这里就不贴出来了,在本文后面会提供下载。MD5类的public接口如下:
md5.h

 1 class MD5 {
 2 public:
 3     MD5();
 4     MD5(const void *input, size_t length);
 5     MD5(const string &str);
 6     MD5(ifstream &in);
 7     void update(const void *input, size_t length);
 8     void update(const string &str);
 9     void update(ifstream &in);
10     const byte* digest();
11     string toString();
12     void reset();
13     ...
14 };

下面简单介绍一下具体用法:
1.计算字符串的MD5值
下面的代码计算字符串"abc"的MD5值并用cout输出:

1 MD5 md5;
2 md5.update("abc");
3 cout << md5.toString() << endl;
4 //或者更简单点
5 cout << MD5("abc").toString() << endl;

2.计算文件的MD5值
下面的代码计算文本文件"D:\test.txt"的MD5值并用cout输出,如果是二进制文件打开的时候记得要指定ios::binary模式。另外需要注意的是用来计算的文件必须存在,所以最好在计算前先判断下ifstream的状态。
(本来判断ifstream是否有效不该是客户的责任,原本想在ifstream无效时用文件名做参数抛出FileNotFoundException之类的异常,后来却发现从ifstream中居然无法得到文件名...)

1 MD5 md5;
2 md5.update(ifstream("D:\\test.txt"));
3 cout << md5.toString() << endl;
4 //或者更简单点
5 cout << MD5(ifstream("D:\\test.txt")).toString() << endl;

3.最基本的用法
上面的用来计算字符串和文件MD5值的接口都是为了方便才提供的,其实最基本的接口是:
void update(const void *input, size_t length);
update的另外两个重载都是基于它来实现的,下面的代码用上述接口来实现FileDigest函数,该函数用来计算文件的MD5值:

 1 string FileDigest(const string &file) {
 2 
 3     ifstream in(file.c_str(), ios::binary);
 4     if (!in)
 5         return "";
 6 
 7     MD5 md5;
 8     std::streamsize length;
 9     char buffer[1024];
10     while (!in.eof()) {
11         in.read(buffer, 1024);
12         length = in.gcount();
13         if (length > 0)
14             md5.update(buffer, length);
15     }
16     in.close();
17     return md5.toString();
18 }

下面看看测试代码:
test.cpp

 1 #include "md5.h"
 2 #include <iostream>
 3 
 4 using namespace std;
 5 
 6 void PrintMD5(const string &str, MD5 &md5) {
 7     cout << "MD5(\"" << str << "\") = " << md5.toString() << endl;
 8 }
 9 
10 int main() {
11 
12     MD5 md5;
13     md5.update("");
14     PrintMD5("", md5);
15 
16     md5.update("a");
17     PrintMD5("a", md5);
18 
19     md5.update("bc");
20     PrintMD5("abc", md5);
21 
22     md5.update("defghijklmnopqrstuvwxyz");
23     PrintMD5("abcdefghijklmnopqrstuvwxyz", md5);
24 
25     md5.reset();
26     md5.update("message digest");
27     PrintMD5("message digest", md5);
28 
29     md5.reset();
30     md5.update(ifstream("D:\\test.txt"));
31     PrintMD5("D:\\test.txt", md5);
32 
33     return 0;
34 }

测试结果:
MD5("") = d41d8cd98f00b204e9800998ecf8427e
MD5("a") = 0cc175b9c0f1b6a831c399e269772661
MD5("abc") = 900150983cd24fb0d6963f7d28e17f72
MD5("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b
MD5("message digest") = f96b697d7cb7938d525a2f31aaf161d0
MD5("D:\test.txt") = 7ac66c0f148de9519b8bd264312c4d64

源代码下载:点击下载

MD5算法的C++实现相关推荐

  1. [js] MD5算法

    js版md5算法: /** * * MD5 (Message-Digest Algorithm) * http://www.webtoolkit.info/ * **/var MD5 = functi ...

  2. MD5算法之C#程序

    MD5算法比较特别,最适合用汇编语言来写,好多高级语言对之无能无力或效率极低. 比如我最开始尝试用Python和Euphoria编写,发现不太容易.相比而言,C#作为C家簇 中新兴的一门.net语言, ...

  3. T-SQL MD5算法实现

    转自:http://www.cnblogs.com/yeagen/archive/2009/02/08/1386374.html 函数代码: /**************************** ...

  4. MD5算法了解(JAVA实现)

    MD5算法:尽管已经被破解,但任然广泛应用于各个领域中 如文件校验:当我们下载文件时为了保证文件的安全性,我们能够在其站点上找到相应的md5值进行校验,假设md5值不一致,也就是说文件被人动过(一般都 ...

  5. C#的加密解密算法,包括Silverlight的MD5算法

    C#的加密解密算法,包括Silverlight的MD5算法 下面是一段加密解密工具类,其中的WinFormMD5Encrypt方法可以使得Winform和WebForm下的MD5加密结果一致,默认他们 ...

  6. java md5包_JAVA中有没有提供MD5算法的包啊?

    拉莫斯之舞 有,在java.security包的MessageDigest类.例子:import java.security.MessageDigest;public class Test2 {pub ...

  7. 【中级软考】RSA、IDEA、RC4、MD5算法分别是什么?

    RSA(Rivest Shamir Adlemen,一种因特网加密和认证体系) IDEA Internationale Data Encrypt Algorithm 一种国际数据加密算法 RC4 (R ...

  8. 《ASCE1885的信息安全》の使用Crypto++的MD5算法对字符串进行哈希

    使用Crypto++的MD5算法对字符串进行哈希,先在VS2010中新建Win32 Console Application,取工程名为:Crypto-MD5.在工程主目录中新建文件夹include,将 ...

  9. 【建议收藏】MD5 算法的Java Bean

    MD5信息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传输 ...

  10. 你怕是对MD5算法有误解

    大家常听到"MD5加密"."对称加密"."非对称加密",那么MD5属于哪种加密算法? 面试官问这样的问题,准是在给你挖坑. "MD ...

最新文章

  1. stm32难不难学,没学51单片机可以直接学STM32吗?
  2. xx是一个类型 这在给定的上下文_基于上下文的派发:挂起临时变量内存
  3. Android实现一个自己定义相机的界面
  4. QT Creator应用程序开发——QT程序设计基本知识
  5. react 开源项目_2020年2月Github上最热门的JavaScript开源项目
  6. Codeforces 1140F 线段树 分治 并查集
  7. unity 如何获取到屏幕中间_请问如何获得场景的中心点在屏幕上的坐标?
  8. Http代理抓包 Fiddler与Charles
  9. 在Ubuntu 将PHP5升级到PHP7.0 PHP7.1
  10. MATLAB符号运算小技巧
  11. scheme 语言概述
  12. 计算机桌面图片怎么设置大小,怎样设置电脑桌面背景与屏幕大小相同 这些知识你不一定知道...
  13. wechat微信小程序 :对应的服务器证书无效
  14. 好看可乐的韩剧综艺-推荐两部
  15. php网页解析器,浅析php插件 HTMLPurifier HTML解析器
  16. 设值单元格字体和背景色的颜色-实例
  17. HTML中input:file标签的使用
  18. python 花括号、中括号以及小括号的区别
  19. 随机信号处理笔记 - ING
  20. 让海航买不起的当当究竟值多少钱?90亿够不够?

热门文章

  1. python字符串转换为数字_Python不使用int()函数把字符串转换为数字的方法
  2. leetcode Best Time to Buy and Sell Stock专题
  3. Ubuntu dpkg 常用命令教程
  4. L3-001 凑零钱 (30 分)—团体程序设计天梯赛
  5. Vue学习手记02-路由创建
  6. xshell访问内网虚拟机
  7. 品牌logo在EDM数据营销中的运用
  8. 交互设计实用指南系列(8)—深广度平衡
  9. mybatis 3.2.3 maven dependency pom.xml 配置
  10. 我来到这世上,却不曾歌唱