1. TIFF概述

TIFF是Tagged Image File Format的缩写。在现在的标准中,只有TIFF存在, 其他的提法已经舍弃不用了。做为一种标记语言,TIFF与其他文件格式最大的不同在于除了图像数据,它还可以记录很多图像的其他信息。它记录图像数据的方式也比较灵活, 理论上来说, 任何其他的图像格式都能为TIFF所用, 嵌入到TIFF里面。比如JPEGLossless JPEGJPEG2000和任意数据宽度的原始无压缩数据都可以方便的嵌入到TIFF中去。由于它的可扩展性, TIFF在数字影像、遥感、医学等领域中得到了广泛的应用。TIFF文件的后缀是.tif或者.tiff

2. TIFF文件构成

2.1 概述

谈到TIFF文件结构,这里不得不要提出三个关键词:IFH(图像文件头)、IFD(图像文件目录)和DE(目录项)。其中,IFH包含三项功能,分别是字节顺序标志位、TIFF标志位和第一个IFD偏移量。最后一个功能负责指向IFD的开端。当然,从IFH到第一个IFD还有一段字节,小编表示还没弄明白。对于IFDDE,他们是包含的关系。一个TIFF文件可以有多个IFD。而每个IFD有记录了DE的个数以及DE的详细内容,最后还记录了下一个IFD的偏移量。在此,大家可以想一下为什么这里记录的是偏移量,而不是直接下一个IFD。下图就是一个tif文件的详细结构。

2.2 IFH(图像文件头)

根据上图可知IFH包括三部分组成,详细介绍如下:

2.2.1 字节顺序标志位

占用两个字节(byte 0-1),值为II或者MM。II表示小字节在前, 又称为little-endian。MM表示大字节在前,又成为big-endian

2.2.2 TIFF标志位

占用两个字节(byte 2-3),一般都是42。

2.2.3 第一个IFD的偏移量

占用两个字节(byte 4-7),可以在任意位置, 但必须是在一个字的边界,也就是说必须是2的整数倍。需要注意的是,这里是IFD的偏移量。也就是说,从这个位置到第一个IFD中间还有一些字节。

2.3 IFD(图像文件目录)

图像文件目录也包括三部分组成。

2.3.1 DE个数

占用两个字节(byte 0~1),当然这里的0表示的是相对位置,表示此IFD包含多少个DE,假设数据为n个。

2.3.2 DE的详细描述

占用n * 12 个字节,这一部分是DE的详细描述,每个DE占用12个字节(详细后面会说),所以n个DE总共占用2~(n*12+1)。这里可以想一下为什么要加1。

2.3.3 下一个IFD偏移量

占用4个字节,IFD偏移量,如果没有,则为0。

2.4 DE(图像目录项)

这一项有四部分组成,详细介绍如下。

2.4.1 TAG标识符

还记得TIFF的全程吗?不错,都出现了TAG。足以见到这一部分的重要性。这可以说是数据项的唯一标识符。关于的tag的详细说明见下表。

名称 简短描述
十进制码 十六进制码
254 00FE NewSubfileType 新的子文件类型标识 LONG 长度为1
用比特来标识图像的类型
Bit0如果是1代表缩略图
Bit1如果是1代表多页图像中的某一页
Bit2如果是2代表它是透明度掩码图像
其余的位数暂时没有定义。与SubfileType的是,此Tag
用比特位来区分文件类型而不是用值来区分
255 00FF SubfileType 子文件类型标识SHORT长度为1
1 全分辨率图像
2 缩小分辨率的图像
3 多页图像的某一页
过时的Tag,已不再使用
256 0100 ImageWidth 图像宽度 SHORT或者LONG 长度为1
257 0101 ImageLength 图像高度 SHORT或者LONG 长度为1
258 0102 BitsPerSample 每个分量的Bit数 SHORT 长度为SamplesPerPixel
259 0103 Compression 压缩类型 SHORT 长度为1
随着TIFF的不断扩张,目前支持多达几十种的压缩方式。就我个人看来,最需要关注的有以下两个值:
Compression=1: 没有压缩
Compression=7:JPEG压缩。 如果是RGB图像并且SamplesPerPixel=3,则是标准的有损JPEG压缩。如果是CFA图像,则是Lossless JPEG
262 0106 PhotometricInterpretation 颜色空间 SHORT 长度为1
0 = WhiteIsZero. 应用于灰度或者二值图像, 0对应最亮灰度.
1 = BlackIsZero. 应用于灰度或者二值图像. 0对应最暗灰度。
Compression=2 = RGB. 正常RGB图像,存储顺序为R,G,B.
3 = Palette color. 索引图像, ColorMap必须定义,SamplesPerPixel必须1.
32803 = CFA (Color Filter Array)
263 0107 Threshholding 定义了转换成二值图像的阈值,忽略之
264 0108 CellWidth The width of the dithering or halftoning matrix used to create a dithered or halftoned bilevel file.
265 0109 CellLength The length of the dithering or halftoning matrix used to create a dithered or halftoned bilevel file.
266 010A FillOrder 在同一字节中的逻辑顺序。一般不做定义,要定义的话建议用1
270 010E ImageDescription 字符串, 对图像的描述
271 010F Make 字符串, 生产厂商的描述
272 0110 Model 字符串
273 0111 StripOffsets 每个Strip的偏移量 SHORT或者LONG,N = StripsPerImage for PlanarConfiguration equal to 1; N = SamplesPerPixel * StripsPerImage for PlanarConfiguration equal to 2
274 0112 Orientation The orientation of the image with respect to the rows and columns.
277 0115 SamplesPerPixel 每个象素的通道数 SHORT 长度为1
278 0116 RowsPerStrip 每个Strip有多少行 SHORT或者LONG 长度为1。
Default是无限大
StripsPerImage = floor ((ImageLength + RowsPerStrip - 1) / RowsPerStrip).
279 0117 StripByteCounts 每个Strip的长度 SHORT或者LONG
N = StripsPerImage for PlanarConfiguration equal to 1; N = SamplesPerPixel * StripsPerImage for PlanarConfiguration equal to 2
280 0118 MinSampleValue The minimum component value used.
281 0119 maxsamplevalue The maximum component value used.
282 011A XResolution The number of pixels per ResolutionUnit in the ImageWidth direction.
283 011B YResolution The number of pixels per ResolutionUnit in the ImageLength direction.
284 011C PlanarConfiguration How the components of each pixel are stored.
288 0120 FreeOffsets For each string of contiguous unused bytes in a TIFF file, the byte offset of the string.
289 0121 FreeByteCounts For each string of contiguous unused bytes in a TIFF file, the number of bytes in the string.
290 0122 GrayResponseUnit The precision of the information contained in the GrayResponseCurve.
291 0123 GrayResponseCurve For grayscale data, the optical density of each possible pixel value.
296 0128 ResolutionUnit The unit of measurement for XResolution and YResolution.
305 0131 Software Name and version number of the software package(s) used to create the image.
306 0132 DateTime Date and time of image creation.
315 013B Artist Person who created the image.
316 013C HostComputer The computer and/or operating system in use at the time of image creation.
320 0140 ColorMap 调色板
338 0152 ExtraSamples Description of extra components.
33432 8298 Copyright Copyright notice.

2.4.2 数据类型

占字节数(2-3),数据类型。在TIFF6.0中,定义了12种数据类型,分别是:

  • 1 = BYTE 8-bit unsigned integer.
  • 2 = ASCII 8-bit byte that contains a 7-bit ASCII code; the last byte
    must be NUL (binary zero).
  • 3 = SHORT 16-bit (2-byte) unsigned integer.
  • 4 = LONG 32-bit (4-byte) unsigned integer.
  • 5 = RATIONAL Two LONGs: the first represents the numerator
  • 6 = SBYTE An 8-bit signed (twos-complement) integer.
  • 7 = UNDEFINED An 8-bit byte that may contain anything, depending on
    the definition of the field.
  • 8 = SSHORT A 16-bit (2-byte) signed (twos-complement) integer.
  • 9 = SLONG A 32-bit (4-byte) signed (twos-complement) integer.
  • 10 = SRATIONAL Two SLONG’s: the first represents the numerator of a
    fraction, the second the denominator.
  • 11 = FLOAT Single precision (4-byte) IEEE format.
  • 12 = DOUBLE Double precision (8-byte) IEEE format.

2.4.3 数量

占用4个字节数(4-7)。通过类型和数量可以确定存储此TAG的数据需要占据的字节数

2.4.4 数值或指针

占用4个字节(8-11), 如果占用的字节数少于4, 则数据直接存于此。 如果超过4个,则这里存放的是指向实际数据的指针。

3. 实例说明

下面创建了一个5*3像素的tif文件。我们可以详细分析一下:

3.1 分析IFH

IFH共占用8个字节,根据上图可知为:49 49 2a 00 3a 00 00 00

  • 字节顺序标志位(49 49

    49转换为16进制为73,对应字母为I,即标志位位II,也就是小字节在前。

  • TIFF标志位(2a 00)

    表示42。

  • IFD偏移量(3a 00 00 00)

    所以我们直接跳到3a查询第一个IFD,也就是第4行(00000030),第a列,所得数值为0f

3.2 IFD

  • DE个数(0f 00)

    说明有15个DE。接下来,我们分析几个DE。

3.3 DE

我们复习一下DE组成,分为TAG(2)、数据类型(2)、数量(4)、数值或指针(4)。

这里需要说明的是字节是要按照从右向左方向读取。

例如有两个字节(00 10),那么应该编译成01 00。

3.3.1 第一个DE(起始3c)

  • TAG(fe 00)

    通过查阅上表为NewSubfileType。

  • 数据类型(04 00)

    通过查询数据类型表格可知,数据类型为4 = LONG 32-bit (4-byte) unsigned integer.

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(00 00 00 00)

    数值为0,具体含义参见上表或者链接地址说明。

3.3.2 第二个DE(起始48)

  • TAG(00 01)

    通过查阅上表代码(0100)为ImageWidth。

  • 数据类型(04 00)

    通过查询数据类型表格可知,数据类型为4 = LONG 32-bit (4-byte) unsigned integer.

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(00 00 00 05)

    数值为5,印证了上面说的这个tif宽为5个像素。

3.3.3 第三个DE(起始54)

  • TAG(01 01)

    通过查阅上表代码(0101)为ImageLength。

  • 数据类型(04 00)

    通过查询数据类型表格可知,数据类型为4 = LONG 32-bit (4-byte) unsigned integer.

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(00 00 00 03)

    数值为3,印证了上面说的这个tif高为3个像素。

3.3.4 第四个DE(起始60)

  • TAG(02 01)

    通过查阅上表代码(0102)为BitsPerSample。

  • 数据类型(03 00)

    通过查询数据类型表格可知,数据类型为3 = SHORT 16-bit (2-byte) unsigned integer

  • 数量(03 00 00 00)

    所以数量为3

  • 数值(f4 00 00 00)

    数值为f4。

3.3.5 第五个DE(起始6c)

  • TAG(03 01)

    通过查阅上表代码(0103)为Compression。

  • 数据类型(03 00)

    通过查询数据类型表格可知,数据类型为3 = SHORT 16-bit (2-byte) unsigned integer

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(05 00 00 00)

    数值为5,5 = LZW

3.3.6 第六个DE(起始78)

  • TAG(06 01)

    通过查阅上表代码(0106)为PhotometricInterpretation。

  • 数据类型(03 00)

    通过查询数据类型表格可知,数据类型为3 = SHORT 16-bit (2-byte) unsigned integer

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(02 00 00 00)

    数值为2,2 = RGB. 正常RGB图像,存储顺序为R,G,B.

3.3.7 第七个DE(起始84)

  • TAG(11 01)

    通过查阅上表代码(0111)为StripOffsets。

  • 数据类型(04 00)

    通过查询数据类型表格可知,数据类型为4 = LONG 32-bit (4-byte) unsigned integer.

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(08 00 00 00)

    数值为8.

3.3.8 第八个DE(起始90)

  • TAG(15 01)

    通过查阅上表代码(0115)为SamplesPerPixel。

  • 数据类型(03 00)

    通过查询数据类型表格可知,数据类型为3 = SHORT 16-bit (2-byte) unsigned integer

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(03 00 00 00)

    数值为3,也就是RGB三个通道。

3.3.9 第九个DE(起始9c)

  • TAG(16 01)

    通过查阅上表代码(0116)为RowsPerStrip。

  • 数据类型(04 00)

    通过查询数据类型表格可知,数据类型为4 = LONG 32-bit (4-byte) unsigned integer.

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(03 00 00 00)

    数值为3,这里的3指的高为3个像素。

3.3.10 第十个DE(起始a8)

  • TAG(17 01)

    通过查阅上表代码(0117)为StripByteCounts。

  • 数据类型(04 00)

    通过查询数据类型表格可知,数据类型为4 = LONG 32-bit (4-byte) unsigned integer.

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(32 00 00 00)

    数值为50

3.3.11 第十一个DE(起始b4)

  • TAG(1a 01)

    通过查阅上表代码(011a)为XResolution。

  • 数据类型(05 00)

    通过查询数据类型表格可知,数据类型为5 = RATIONAL Two LONGs: the first represents the numerator

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(fa 00 00 00)

    数值为fa

3.3.12 第十二个DE(起始c0)

  • TAG(1b 01)

    通过查阅上表代码(011b)为YResolution。

  • 数据类型(05 00)

    通过查询数据类型表格可知,数据类型为5 = RATIONAL Two LONGs: the first represents the numerator

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(02 01 00 00)

    数值为102

3.3.13 第十三个DE(起始cc)

  • TAG(1c 01)

    通过查阅上表代码(011c)为PlanarConfiguration。

  • 数据类型(03 00)

    通过查询数据类型表格可知,数据类型为3 = SHORT 16-bit (2-byte) unsigned integer

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(01 00 00 00)

    数值为1

3.3.14 第十四个DE(起始d8)

  • TAG(28 01)

    通过查阅上表代码(0128)为ResolutionUnit。

  • 数据类型(03 00)

    通过查询数据类型表格可知,数据类型为3 = SHORT 16-bit (2-byte) unsigned integer

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(02 00 00 00)

    数值为2

3.3.15 第十五个DE(起始e4)

  • TAG(3d 01)

    通过查阅上表代码(013d)为****。

  • 数据类型(03 00)

    通过查询数据类型表格可知,数据类型为3 = SHORT 16-bit (2-byte) unsigned integer

  • 数量(01 00 00 00)

    所以数量为1

  • 数值(02 00 00 00)

    数值为2

TIFF文件结构详解相关推荐

  1. PE文件结构详解(六)重定位

    前面两篇 PE文件结构详解(四)PE导入表 和 PE文件结构详解(五)延迟导入表 介绍了PE文件中比较常用的两种导入方式,不知道大家有没有注意到,在调用导入函数时系统生成的代码是像下面这样的: 在这里 ...

  2. PE文件结构详解(五)延迟导入表

    by evil.eagle 转载请注明出处. http://blog.csdn.net/evileagle/article/details/12718845 PE文件结构详解(四)PE导入表讲了一般的 ...

  3. PE文件结构详解(四)PE导入表

    PE文件结构详解(二)可执行文件头的最后展示了一个数组,PE文件结构详解(三)PE导出表中解释了其中第一项的格式,本篇文章来揭示这个数组中的第二项:IMAGE_DIRECTORY_ENTRY_IMPO ...

  4. PE文件结构详解(三)PE导出表

    上篇文章 PE文件结构详解(二)可执行文件头 的结尾出现了一个大数组,这个数组中的每一项都是一个特定的结构,通过函数获取数组中的项可以用RtlImageDirectoryEntryToData函数,D ...

  5. PE文件结构详解(二)可执行文件头

    by evil.eagle 转载请注明出处. http://blog.csdn.net/evileagle/article/details/11903197 在PE文件结构详解(一)基本概念里,解释了 ...

  6. 【转】PE文件结构详解--(完整版)

    (一)基本概念 PE(Portable Execute)文件是Windows下可执行文件的总称,常见的有DLL,EXE,OCX,SYS等,事实上,一个文件是否是PE文件与其扩展名无关,PE文件可以是任 ...

  7. PE文件结构详解 --(完整版)

    From:https://blog.csdn.net/adam001521/article/details/84658708 PE结构详解:https://www.cnblogs.com/zheh/p ...

  8. PE文件结构详解(一)基本概念

    (一)基本概念 PE(Portable Execute)文件是Windows下可执行文件的总称,常见的有DLL,EXE,OCX,SYS等,事实上,一个文件是否是PE文件与其扩展名无关,PE文件可以是任 ...

  9. TIFF图像文件详解

    TIFF图像文件格式详解(1) http://blog.csdn.net/dcraw/article/details/6443537 1 什么是TIFF?  TIFF是Tagged Image Fil ...

  10. Java类文件结构详解

    概述: Class文件结构是了解虚拟机的重要基础之一,如果想深入的了解虚拟机,Class文件结构是不能不了解的. Class文件是一组以8位字节为基础单位的二进制流,各项数据项目严格按照顺序紧凑地排列 ...

最新文章

  1. 双一流高校通知「19级硕士秋季学期不开学!」决定引热议,你怎么看?
  2. 命名空间_python基础 13 类命名空间于对象、实例的命名空间,组合方法
  3. 初一计算机下册理论知识,初中信息技术七年级下册(第七版)
  4. java se5和8_javaSE_8系列博客——Java语言的特性(三)--类和对象(5)--定义方法...
  5. python基础语法手册-python语法大全,python语法手册
  6. mysql主从搭建_手把手教你搭建MySQL主从架构
  7. java右移位_Java移位运算
  8. Hacker's Technique programme pdf+源码
  9. 在线订餐系统php心得体会_php网上订餐管理系统
  10. stc单片机id加密c语言,STC单片机内部ID读取
  11. somachine3.1安装
  12. Excel 复制粘贴筛选出来的数据行
  13. jetbrains projector远程开发使用入门
  14. 华为手机提示更新包与已安装应用的签名不一致
  15. 如何用Deeplink为快应用提供多个快速直达入口
  16. ZGC学习笔记:ZGC简介和JDK17对ZGC的优化
  17. 关于最小二乘估计的一点理解和感悟
  18. 软件架构设计最佳实践(课程大纲)
  19. 今天的日子只属于你!
  20. 百囚徒问题(100 prisoners problem)

热门文章

  1. 激光雷达在自动驾驶中的应用
  2. web项目接入指纹识别+识别过程信息推送
  3. Ubuntu 安装rabbitvcs
  4. 当前网络上迅雷各版本实际效果研究报告
  5. CHM提示无法连接Internat
  6. java 8 list to map_Java8中list转map
  7. Netty 基本原理
  8. 2018年苏大计算机考研872真题及解析
  9. 初次联系导师短信模板_申博经验分享|如何联系导师?
  10. 配置无线AP 采用POE供电模块怎么配置无线AP没有POE交换机