一个文件里面的内容到底是啥?用惯了Windows的人肯定是看后缀。但是后缀这个东西说改就改,不可靠。所以,最保险的还是把文件类型信息写到文件里面,通常来说,也就是写到文件开头的那几个字节。这是最方便,最快捷的用来辨别一个文件真实内容的方法。下面举几个例子:

  • Java class文件的魔数

每一个Java Class文件都是以0x CAFEBABE开头的。Java这么做的原因就是为了快速判断一个文件是不是有可能为class文件,以及这个class文件有没有受损(文件受损,文件开头受损的可能性最大)。
为什么是CAFEBABE呢?这个只能猜了,首先,16进制里面的字母只有A到F,十分的有限。Java一直以咖啡为代言,CAFEBABE可以认为是 Cafe Babe,读音上和Cafe Baby很近。所以这个也许就是代表Cafe Baby的意思。

  • 文本文件的BOM

比如说,对于文本文件,开头的几个字节可以叫做BOM(Byte Order Mark),它的作用是用来标记文本文件内部是用的哪种Unicode编码,以及其字节码顺序。UTF-8,UTF-16BE,UTF-16LE等等各种Unicode编码都有自己独一无二的BOM。一般的文本编辑器也都支持 BOM。这样就不会出现乱码了。

  • Zip文件的P.K.

所有的zip文件,都是以PK这两个字母开头的。所以,无论怎么去修改zip文件的后缀,解压程序都可以简单的判断一个文件是不是有可能为zip文件。
不信可以用二进制文本编辑器打开看看,比如notepad++:

PK代表的不是游戏里的Person Kill,而是zip算法(PKZIP算法)的发明者菲尔·卡茨(Phil Katz)名字首字母的缩写。
Phil Katz 在当时也算是个大牛级人物,不想为了一个压缩软件付钱就一跺脚自己写了一个更好的压缩算法,而且还完全无偿开放这个标准。不过,Phil Katz成就了 zip算法,zip算法却没有拯救Phil Katz。zip没有给他带来一分钱,这位无私奉献的工程师生活不顺,死于酗酒,甚至现在连一张像样的照片都流传下来,一声叹息呀。

常用文件的文件头如下:

1. MIDI (mid),文件头:4D546864

2.  JPEG (jpg),文件头:FFD8FF

3.  PNG (png),文件头:89504E47

4.  GIF (gif),文件头:47494638

5.  TIFF (tif),文件头:49492A00

6.  Windows Bitmap (bmp),文件头:424D

7.  CAD (dwg),文件头:41433130

8.  Adobe Photoshop (psd),文件头:38425053

9.  Rich Text Format (rtf),文件头:7B5C727466

10. XML (xml),文件头:3C3F786D6C

11. HTML (html),文件头:68746D6C3E

12. Email [thorough only] (eml),文件头:44656C69766572792D646174653A

13. Outlook Express (dbx),文件头:CFAD12FEC5FD746F

14. Outlook (pst),文件头:2142444E

15. MS Word/Excel (xls.or.doc),文件头:D0CF11E0

16. MS Access (mdb),文件头:5374616E64617264204A

17. WordPerfect (wpd),文件头:FF575043

18. Postscript (eps.or.ps),文件头:252150532D41646F6265

19. Adobe Acrobat (pdf),文件头:255044462D312E

20. Quicken (qdf),文件头:AC9EBD8F

21. Windows Password (pwl),文件头:E3828596

22. ZIP Archive (zip),文件头:504B0304

23. RAR Archive (rar),文件头:52617221

24. Wave (wav),文件头:57415645

25. AVI (avi),文件头:52494646

26. Real Audio (ram),文件头:2E7261FD

27. Real Media (rm),文件头:2E524D46

28. Windows Media Audio(wma)(asf),文件头:3026b2758e66cf

29. wrf, 文件头:574f5446000600

29. MPEG (mpg),文件头:000001BA

30. MPEG (mpg),文件头:000001B3

31. Quicktime (mov),文件头:6D6F6F76

32. Windows Media (asf),文件头:3026B2758E66CF11

写一个代码测试一下:

[java] view plain copy
  1. public static String bytesToHexString(byte[] src) {
  2. StringBuilder stringBuilder = new StringBuilder();
  3. if (src == null || src.length <= 0) {
  4. return null;
  5. }
  6. for (int i = 0; i < src.length; i++) {
  7. int v = src[i] & 0xFF;
  8. String hv = Integer.toHexString(v);
  9. if (hv.length() < 2) {
  10. stringBuilder.append(0);
  11. }
  12. stringBuilder.append(hv);
  13. }
  14. return stringBuilder.toString();
  15. }
  16. public static void main(String[] args) throws Exception {
  17. FileInputStream is = new FileInputStream("E:\\学习\\Java面试宝典2014版.pdf");
  18. byte[] b = new byte[7];
  19. is.read(b, 0, b.length);
  20. System.out.println(bytesToHexString(b));
  21. }

转载于:https://www.cnblogs.com/jinhengyu/p/10258081.html

[科普]关于文件头的那些事相关推荐

  1. IDEA中如何设置文件头注释和方法注释(详解)

    文件头注释和方法注释的两种方式 方法一: 文件头注释: 打开File–>Settings–>Editor–>File and Code Templates–>includes– ...

  2. FFmpeg源码分析:写媒体文件头avformat_write_header()

    FFmpeg在libavformat模块提供mux封装视频的API,包括avformat_write_header()写文件头.av_write_frame()写音视频帧.av_write_trail ...

  3. bmp文件头_「正点原子FPGA连载」第十九章SD卡读BMP图片LCD显示

    1)摘自[正点原子]领航者 ZYNQ 之嵌入式开发指南 2)实验平台:正点原子领航者ZYNQ开发板 3)平台购买地址:https://item.taobao.com/item.htm?&id= ...

  4. PE文件和COFF文件格式分析——签名、COFF文件头和可选文件头3

    <PE2>中介绍了一些可选文件头中重要的属性,为了全面起见,本文将会讲解那些不是那么重要的属性.虽然不重要,但是还是可以发现很多好玩的情况.首先看一下32位的可选文件头详细定义.(转载请指 ...

  5. PE文件和COFF文件格式分析——签名、COFF文件头和可选文件头2

    之前的博文中介绍了IMAGE_FILE_HEADER结构,现在来讨论比较复杂的"可选文件头"结构体.(转载请指明来自breaksoftware的csdn博客)先看下其声明 type ...

  6. PE文件和COFF文件格式分析——签名、COFF文件头和可选文件头1

    本文将讨论PE文件中非常重要的一部分信息.(转载请指明来源于breakSoftware的CSDN博客) 首先说一下VC中对应的数据结构."签名.COFF文件头和可选文件头"这三部分 ...

  7. ctf 文件头crc错误_[CTF隐写]png中CRC检验错误的分析

    [CTF隐写]png中CRC检验错误的分析 最近接连碰到了3道关于png中CRC检验错误的隐写题,查阅了相关资料后学到了不少姿势,在这里做一个总结 题目来源: bugku-MISC-隐写2 bugku ...

  8. mysql文件头标记_通过文件头准确识别PHP上传的文件类型 ( 一 )

    /** * 通过文件名,获得文件类型* * @version 0.1 * $filename="d:/1.png";echo cFileTypeCheck::getFileType ...

  9. 分享:bbed修改数据文件头推进scn与其他数据文件相同

    2019独角兽企业重金招聘Python工程师标准>>> 场景简介: 物理copy表空间数据文件,数据库发生完全检查点,删除该表空间下的数据文件,使该表空间数据文件头的scn与其他数据 ...

  10. 8 pycharm 快捷键_Pycharm自动添加文件头注释和函数注释参数

    Pycharm应该是学python必用的编辑器了,关于它的使用之前已经写过几篇文章,今天再给大家继续介绍两个pycharm的小技巧,希望对大家有用. 1.自动添加文件头注释 文件头模板设置路径 Set ...

最新文章

  1. 2019.03.01 bzoj2555: SubString(sam+lct)
  2. DDL修改表,删除表
  3. SQl inner LOOP | HASH | MERGE join--指定Join的方法
  4. mac mysql
  5. mysql判断表存在的sql语句_SQL 语句判断已知表是否存在_MySQL
  6. oracle数据库扩容方案_数据库一体机替代IOE架构,在财税行业的崛起
  7. sae mysql_connect_SAE连接数据库 - zxm的个人空间 - OSCHINA - 中文开源技术交流社区
  8. 前端工程师技能之photoshop巧用系列第一篇——准备篇
  9. 虚幻4 游戏引擎(一):材质教学
  10. 网易支付分布式事务实战-java课堂笔记
  11. 网络分析仪自动化测试软件,高效矢量网络分析仪自动测试方法
  12. 网站重要的推广方式——博客推广(上:什么是博客推广)
  13. 电磁干扰、电磁兼容性和电磁屏蔽区别及联系
  14. aps生产计划排产的计划类型
  15. 从钉钉后台获取考勤数据(其他数据获取类似)
  16. [论文阅读]Structure-from-Motion Revisited
  17. 基于java基于javaweb的管理系统设计与实现怎样选题思路分享
  18. 数列求和 (Java实现)
  19. 2876: [Noi2012]骑行川藏
  20. Linux中文件的压缩和解压缩

热门文章

  1. MFC函数——CWnd::OnCreate
  2. [js插件]分享一个文章内容信息提示插件Colortip
  3. java排序算法学习(一)--冒泡排序
  4. YYAsyncLayer 源码剖析:异步绘制
  5. VS2008安装deffactory.dat文件错误解决方法
  6. 电脑获取手机文件的一种方式(通过手机建立ftp)
  7. Trafodion的介绍
  8. JNI学习积累之三 ---- 操作JNI函数以及复杂对象传递
  9. selenium webdriver学习(一)------------快速开始(转载JARVI)
  10. # heapsort