[转]TIF图像数据结构之研究

2010-09-24 20:27

TIF文件格式最早是为了存储扫描仪图像而设计的。它的最大的特点就是与计算机的结构、操作系统以及图形硬件系统无关。它可处理黑白、灰度、彩色图像。在存储真彩色图像时和BMP格式一样，直接存储RGB三原色的浓度值而不使用彩色映射（调色板）。对于介质之间的交换，TIF称得上是位图格式的最佳选择之一。
　　TIF的全面性也产生了不少问题，它的包罗万象造成结构较为复杂，变体很多，兼容性较差，它需要大量的编程工作来全面译码。例如，TIF图像数据可以用几种不同的方法压缩，用一个程序来读出所有的TIF几乎是不可能的。
　　TIF图一般由三个部分组成：文件头（简称IFH）、文件目录（简称IFD）、图像数据。
一、图像文件头（Image File Header）
　　IFH数据结构包含3个成员共计8个字节（见表一）：
表一 IFH结构描述
------------------------------------------------------------
名称　　　　　　　　字节数　数据类型   说明
------------------------------------------------------------
Byteorder            2 Integer TIF标记，其值为4D4D或4949
Version                2 Integer 版本号，其值恒为2A00
Offset to first IFD   4 Long    第一个IFD的偏移量
------------------------------------------------------------
表一说明
　　1.Byteorder：可能是H4D4D或H4949，H4D4D表示该图是摩托罗拉整数格式，H4949表示该图是Intel整数格式。
　　2.Version：总是H2A00，它可能是tif文件的版本，也可能用于进一步校验该文件是否为TIF格式。
　　3.Offset to first IFD：第一个IFD相对文件开始处的偏移量（因为可能会有多个顺序排列的IFD）。IFD数据结构并不一定紧跟在IFH后面，相反，它常常位于第三部分图像数据的后面，即TIF图像文件的一般组织形式是：IFH——图像数据——IFD。
二、图像文件目录（Image File Directory）
　　IFD是TIF图像文件中重要的数据结构，它包含了三个成员。由于一个TIF文件中可以有多个图像，而一个IFD只标识一个图像的所有属性（有的文章把“属性”称之为“标签”），所以，一个TIF文件中有几个图像，就会有几个IFD。IFD的结构见表二：
表二 IFD结构描述
-----------------------------------------------------------------
名称　　　　　　　　　字节数　数据类型   说明
-----------------------------------------------------------------
Directory Entry Count 2 Integer 本IFD中DE的数量
Directory Entry(1)       12    简称DE，中文译义“目录项”
Directory Entry(2)      12
……
Directory Entry(N)       12
Offset to next IFD         4 Long    下一个IFD的偏移量
-----------------------------------------------------------------
表二说明
　　1.Directory Entry Count：指出在该IFD中DE的个数；
　　2.Directory Entry：共12个字节，结构见表三。需要指出的是，DE的个数是不定的，因为每个DE只标识了图像的一个属性，那么这幅图像有N个属性就会有N个DE，用户甚至可添加自定义的标记属性，这就是为什么称TIF格式文件为“可扩充标记的文件”的原因。
　　3.Offset to next IFD Or NULL：下一个IFD相对于文件开始处的位置，这是一个链式构成。如果该数字为0，表示已经是最后一个IFD。当然，如果该TIF文件只包含了一幅图像，那么就只有一个IFD，显然这个偏移量也会等于0。
表三 DE结构描述
--------------------------------------------------
名称　　　　　字节数　　数据类型   说明
--------------------------------------------------
tag          2    Integer 本属性的标签编号
type           2    Integer 本属性值的数据类型
length       4    Long    该类型数据的数量
valueOffset 4    Long    属性值的存放偏移量
--------------------------------------------------
表三说明
　　由DE标识的图像属性有：图像的大小、分辨率、是否压缩、像素的行列数、颜色深度（单色、16色、256色、真彩色）等等。其中：
　　①tag：是该属性的标签编号（TagID），在图像文件目录中，它是按照升序排列的（但不一定是连续的）。这些编号在TIF格式官方白皮书中可以查到相应的含义，但遗憾的是，我们到哪儿可以找到官方白皮书呢？所以，笔者只能把网上能找得到资料（再结合自己的实验结果）罗列出来，见表四。
　　②type：表示该属性数据的类型，一般认为TIF官方指定的有5种数据类型（但也有说12种数据类型的）。见表五。
　　③length：该种类型的数据的个数，而不是某个数据的长度。
　　④valueOffset：是tagID代表的变量值相对文件开始处的偏移量，但如果变量值占用的空间不多于4个字节（例如只有1个Integer类型的值），那么该值就直接存放在valueOffset中，没必要再另外指向一个地方了。
表四 DE中标签编号的含义
-------------------------------------------------------------------------
TagID   属性名称       type 说明
-------------------------------------------------------------------------
0100 图像宽             0003
0101 图像高             0003
0102 颜色深度          0003   值＝1为单色，＝4为16色，＝8为256色。
　　　　　　　　　　　　　　　　如果该类型数据个数＞2个，说明是真彩图像
0103 图像数据是否压缩    0003   值＝05表示压缩

按照adobe的文档，这里应该是tiff的压缩算法，K<0是G4，否则是G3

A code identifying the encoding scheme used:

< 0 Pure two-dimensional encoding (Group 4)

=0 Pure one-dimensional encoding (Group 3, 1-D)

>0 Mixed one- and two-dimensional encoding (Group 3, 2-D), in which a line encoded one-dimensionally may be followed by at most K − 1 lines encoded two-dimensionally

The filter shall distinguish among negative, zero, and positive values of K to determine how to interpret the encoded data; however, it shall not distinguish between different positive Kvalues. Default value: 0.

0106 图像是否采用反色显示    0003   值＝01表示反色，否则表示不反色
0111 图像扫描线偏移量    0004   图像数据起始字节相对于文件开始处的位置
0116 图像扫描线的数量       0004   表示图像有几行扫描线，实际上等于图像高度
0117 图像数据字节总数    0003   如果不是偶数，那么实际存放时会在后面加0
011A 水平分辩率偏移量    0005   常用计量单位是：像素/英寸
011B 垂直分辩率偏移量    0005   常用计量单位是：像素/英寸
0131 生成该图像的软件名    0002   文本类型
0132 生成该图像的时间    0002   文本类型
0140 调色板偏移量       0003   256色和16色图像才有此属性，而且有连续2个
　　　　　　　　　　　　　　　　　调色板，但属性的length值只表示出1个调色板
-------------------------------------------------------------------------
表四说明
　　①“水平（垂直）分辩率”是分数型的属性，其值要占用8个字节，所以在valueOffset中存放的肯定是它的具体数值的偏移量，而不是数值本身。
　　②“生成图像的软件名称”和“生成图像的时间”这两个字符型属性，它们的值所占用的空间也会大于4字节，所以在valueOffset中存放的也是它们的值的偏移量，而不是值本身。
　　③“图像数据字节总数”一般是个偶数，如果是奇数，那么实际存放时会在后面加一个0，但这个0不会计算在字节总数之内。
表五 DE中的数据类型
--------------------------------------------------------------------
type值　数据类型　说明
--------------------------------------------------------------------
0001 Byte
0002 Ascii     文本类型，7位Ascii码加1位二进制0
0003 Integer
0004 Long
0005 RATIONAL   分数类型，由两个Long组成，第1个是分子，第2个是分母
--------------------------------------------------------------------
三、图像数据。

这些数据可能是压缩的，也可能是未压缩的。如果经过压缩，那么压缩算法又有许多种，所以，图像数据是TIF文件中最为复杂的部分，暂还没有哪个软件能译出所有的压缩算法。
四、一个 Tif 文件的实例
　　让我们自己动手做一个实验，以加深理性认识。
　　用系统自带的画图程序新建一个17*15的白色图像，另存为TIF文件，它的全部数据如下（因设备差异你的数据也许会有些微不同）：
0000: 49 49 2A 00 4E 00 00 00 80 3F E0 50 38 24 16 0D
0010: 07 84 42 61 50 B8 64 36 1D 0F 88 44 62 51 38 A4
0020: 56 2D 17 8C 46 63 51 B8 E4 76 3D 1F 90 48 64 52
0030: 39 24 96 4D 18 80 80 00 60 00 00 00 01 00 00 00
0040: 60 00 00 00 01 00 00 00 08 00 08 00 08 00 0F 00
0050: FE 00 04 00 01 00 00 00 00 00 00 00 00 01 03 00
0060: 01 00 00 00 11 00 00 00 01 01 03 00 01 00 00 00
0070: 0F 00 00 00 02 01 03 00 03 00 00 00 48 00 00 00
0080: 03 01 03 00 01 00 00 00 05 00 00 00 06 01 03 00
0090: 01 00 00 00 02 00 00 00 11 01 04 00 01 00 00 00
00A0: 08 00 00 00 15 01 03 00 01 00 00 00 03 00 00 00
00B0: 16 01 04 00 01 00 00 00 0F 00 00 00 17 01 04 00
00C0: 01 00 00 00 2F 00 00 00 1A 01 05 00 01 00 00 00
00D0: 38 00 00 00 1B 01 05 00 01 00 00 00 40 00 00 00
00E0: 1C 01 03 00 01 00 00 00 01 00 00 00 28 01 03 00
00F0: 01 00 00 00 02 00 00 00 3D 01 03 00 01 00 00 00
0100: 01 00 00 00 00 00 00 00
简要分析（请注意转换16进制数据时，低位在前，高位在后）：
0000－0007：文件头，可以看出，该图是Intel整数格式，第一个IFD的偏移量为4E。
0008－0037：图像数据。注意最后那个0是补加的，它没有统计在“图像数据字节总数”属性值中。
0038－003F：水平分辩率值。
0040－0047：垂直分辩率值。
0048－004D：颜色深度值。
004E－0107：第一个IFD。Directory Entry Count的值（004E－004F）为F，表示这个IFD中有15个DE，每个DE占用12字节，15个DE共占用180字节，加上Directory Entry Count占用的2字节，再加上Offset to next IFD占用的4字节，这个IFD共占用186字节，换算为16进制就是BA，所以，它的数据结束于0107。Offset to next IFD的值（最后4个字节）均为0，表示整幅图像文件只有这一个IFD。其中15个DE的描述见表六。
表六一个Tif文件实例的DE描述
-------------------------------------------------------------------------
顺号偏移量 TagID   Type length valueOffset   说明
--------------------------------------------------------------------------
1 0050   00FE Long       1    00        未知属性值＝0
2 005C   0100 Integer       1    11        图像宽为17像素（10进制）
3 0068   0101 Integer       1    0F        图像高为15像素（10进制）
4 0074   0102 Integer       3    48        图像为真彩色，其值存放在48－4D
5 0080   0103 Integer       1    05        图像数据是压缩的
6 008C   0106 Integer       1    02        图像不反色显示
7 0098   0111 Long         1    08        图像数据起始字节为8
8 00A4   0115 Integer       1    03        未知属性值＝3
9 00B0   0116 Long         1    0F        图像扫描线有15行

10 00BC   0117 Long           1    2F        图像共有47个字节的压缩数据
11 00C8   011A RATIONAL   1    38        水平分辩率存放在38－3F
12 00D4   011B RATIONAL   1    40        垂直分辩率存放在40－47
13 00E0   011C Integer       1    01        未知属性值＝1
14 00EC   0128 Integer      1    02        未知属性值＝2
15 00F8   013D Integer       1    01        未知属性值＝1
--------------------------------------------------------------------------
表六说明
　　①水平分辩率值存放在0038－003F，占用8个字节，这8个字节是：60 00 00 00 01 00 00 00。由于它是分数类型，前4个字节是分子，其值为60000000，转换为10进制就是96，后4个字节是分母，其值是10000000，转换为10进制就是1，所以，分数值是：96/1，它表示每英寸96像素。
　　②垂直水平分辩率值存放在0040－0047，请参照①进行分析。
　　③颜色深度属性，它有3个Integer类型的值，共计6字节，所以valueOffset中存放的也是其值的偏移量。它的属性值存放在0048－004D，3个整形数据值都为8，表示这是一幅24位真彩色的图像。

[转]TIF图像数据结构之研究相关推荐

OpenCV中的三种图像数据结构CvMat, IplImage和Mat（二）IplImage
本文为原创,若有错误欢迎批评指正! 一. IplImage结构体构成 IplImage比CvMat要复杂一些,结构体组成如下: typedef struct _IplImage { int nSize ...
虹软人脸识别3.0 - 图像数据结构介绍（C++）
从虹软开放了2.0版本SDK以来,由于具有免费.离线使用的特点,我们公司在人脸识别门禁应用中使用了虹软SDK,识别效果还不错,因此比较关注虹软SDK的官方动态.近期上线了ArcFace 3.0 SDK ...
读“基于深度学习的图像风格迁移研究综述”有感
前言关于传统非参数的图像风格迁移方法和现如今基于深度学习的图像风格迁移方法. 基于深度学习的图像风格迁移方法:基于图像迭代和模型迭代的两种方法的优缺点. 基于深度学习的图像风格迁移方法的存在问题及其 ...
改进维纳滤波的实现——光学稀疏孔径成像系统图像恢复算法研究陈灏
本文简单实现了浙江大学陈灏硕士学位论文<光学稀疏孔径成像系统图像恢复算法研究>(2017)中4.2章节提及的改进维纳滤波算法. 前情提要:维纳滤波函数中不同K(噪声与原属图像功率谱之比)的 ...
使用SHP数据批量裁剪TIF图像并转为JPG格式
问题描述已有数据:1张大范围的遥感影像和1张裁剪为同一大小的shp数据使用工具:ArcPy 实现目标: 1.shp数据按照属性分块输出 2.使用shp数据批量裁剪遥感影像,将影像裁剪为小块的tif ...
Word中的TIF图像保存后再打开就模糊了
改论文的时候,好不容易把tif图按照期刊要求都改完了,保存了再打开一看,好家伙全变糊了. 原因:Word会自动压缩TIF图像. 解决办法:文件--选项--高级--不压缩文件中的图像.
基于目标检测的海上舰船图像超分辨率研究
基于目标检测的海上舰船图像超分辨率研究人工智能技术与咨询来源:< 图像与信号处理> ,作者张坤等关键词: 目标检测:生成对抗网络:超分辨率摘要: 针对海上舰船图像有效像素在整体像素 ...
【IEEE-CPS出版，往届已检索】第二届计算机图形学、图像与虚拟化研究国际会议（ICCGIV 2022）
2022 2nd International Conference on Computer Graphics, Image and Virtualization(ICCGIV 2022) 第二届计算机 ...
OPENCV中图像数据结构及其转化
OPENCV中图像数据结构及其转化 1. IplImage 它是openCV库中表示图像的结构体. 初始化: cvLoadImage(),cvCreateImage() 访问元素:[行指针] b = ...
opencv创建图像，图像像素值处理、生成单通道图像和生成tif图像方法的整理
就是做个小笔记,后面要查方便 1.创建设定尺寸图象 import numpy as np """h,w,c分别代表图像的高.宽和通道数""" ...

[转]TIF图像数据结构之研究

[转]TIF图像数据结构之研究相关推荐

最新文章

热门文章