PDF 与 PS页面描述语言与PDF文件解析(转)

页面描述语言
页面描述语言(Page Description Language,简称PDL)是一种面向输出效应的语言,用于描述打印或照排的版面,这种语言不仅具有版面描述功能,还具有计算机设计 的特点,即可处理文字,又可处理图象,各种软件 在排版和图形处理之后形成PDL形式,就可汇总在一页上输出。 ’
最早的页面描述语言是一些打印命令,例如EPSON公司的 ESC/P命令语言。为了输出复杂的版面就需要有更强大的页面描述语言。大多数图文出版软件都有自己的页面描述语言,在与输出装置相连时,都按自己选用的 输出设备的要求,把自己的一套图文描述语言译成相应的指令串,以支持自己的输出装置。在图形描述处理上,程序和输出装置间往往有些许差异,某些功能只能在 特定的一组输出设备上才能实现,也就是说页面描述语言只能在该厂家调试过的机种上才能达到一定的效果。
页面描述语言的种类很多,国内各出版系统都有自己的页面描述语言,功能大同小异,有代表性的是1986年由北京大学提出的华光系统版面描述语言,简称华光 PDL。而国际流行的是美国 Adobe System公司于1985年公布的PostScript PDL。这个页面描述语言首先在苹果公司的LASER WRITER印字机上大量推广。
PostScript语言拥有大量的、可以任意组合使用的图形算符,可以对文字、几何图形和外部输入的图形进行描述和处理,因此从理论上说可以描述任意复 杂的版面。其设计之成功使得该语言为许多厂家所采用而广泛流行,最终成为事实上的国际标准。 PostScript语言的成功,也使得开放式的电子出版系统在国际得以广泛流行。
一、页面描述语言的性质和功能
就出版物来讲,各种图文元素无论多么复杂,均可分成文字、几何图形和采样图象三类。页面描述语言对这三类元素可以分别作如下定义:
①文字。需要定义的有字体,由此选择不同的字库,文字代码,由此查找字库中的代码段;字号,由此决定缩放比例;文字起始点在版面上的位置(x、y坐标);以及文字的方向,也就是旋转的角度。
②几何图形。需要定义的有直线或曲线的类别、宽度、大小以及方向,以及几何图形在版面上的起始位置,由此可以生成一些简单的图形。 ’
③采样图象。指的是由图象扫描仪等输入设备采集到的图象数据,采样对象可以是照片、手绘稿或其它图象。需要定义的有采样图象起始点在版面上的位置、比例;以及图样翻转不翻转等。
页面描述语言把各种定义好的图文元素组合到当前页面上来。当前页面在开始执行页面描述语言的指令串时,是空白的版面,然后每一个指令将某一图文元素安排到 当前页面上。当两个指令的图文有所重合,重合的部位根据指令要求,或是重叠或是覆盖,将所有的指令串执行完毕后,所需的图形也就根据需要安排到当前版面 上,形成以点组成的二进制图象,该图象与输出装置的输出幅面、分辨力和其他成象信息相对应。最后这一组成的二进制
图象即可传送到输出设备上输出。
一般说来,页面描述语言功能越是强大,与它对应的前端排版
软件对图文的处理则越便利,因此也越容易组成各种复杂美观的
版面。反过来,虽然页面描述语言可以由编程人员编写程序而输
出图样,但大多数情况下还是由前端软件自动加以生成。
好的页面描述语言还具有下列功能:
①程序设计功能,可以以循环、判断等程序设计特点,简化指
令串,提高描述图形的复杂性。利用页面描述语言的编程功能,可
以设计出很多令人叹为观止的图象。

②剪裁。可通过设定剪裁路径,规定出所保留(或不保留)的
图文范围,去掉不需要的部分,而只输出剪裁后剩下的部分。
③坐标系统变换。包括原点平移;坐标轴旋转以及坐标轴比
例变换。这样可以使图形从用户平面经线性变换后转换成设备平
面。同样也要求图形可以旋转、缩放和变形。
④设备无关性。一个好的页面描述语言应尽量与设备无关,
尤其重要的是与输出分辨力无关。

二、PostScript页面描述语言

PostScript页面描述语言是一种描述图形、图象、文字的可编
程语言。前身是1978年美国Evans & Sutherland,计算机公司根
据John Graffney的想法完成的面向描述三维图形的Design
System(设计系统)语言。1978年由施乐Palo Alto研究中心的
John Warnock和Martin Newell重新实现,当时称为JAM语言。
1982年JohnWamock创立了Adobe系统公司后,将这套语言重
新整理、制作面定名为PostScript,此后经多次改进,在苹果公司激
光印字机上实现。1985年,Adobe公司出版了系统描述这种语言
的(Postscript语言参考手册)。自此,由于该语言丰富的图形功
能,高效率地描述极为复杂的版面,因此吸引了众多出版系统的排
版和图形软件(如PageMaker、OuarkXpress、CorelDraw、Ventura等)支持PostScript语言,使其在80年代末成为事实上的国际标准。
1989年以前,PostScript的速度,尤其是在高分辨力的 PostScript图象输出系统上,常比非PostScript系统低,不少厂商支持PostScriptLevel I的同时也继续使用自己的页面描述语言。进入90年代后,PostScript解释器由于CPU芯片速度提高得到提高,且PostScript解释算法也 有所改进,因此更具有竞争力。经过 5年的经验积累,以及众多PostScript产品的反馈,PostScript理论也得以发展,Adobe公司1990年底新推出的 PostScriptLevelⅡ在描述能力和效率方面做了许多扩充,如:
①采用CIEXYZ色空间代替Level I用的CMYK色空间,因此只要校准了显示器和印字机,即可在多台设备上得到一致的效果。
②采用更新的加网技术。
③支持包括中文、日文等东方文字在内的非罗马字符集 (Nonroman.Charactersets)及其编码。
④显示用PostScript(DiaplayPostScript)。
⑤提供表头(Form)功能,可以在同页或不同页面重复执行该版面元素,以提高效率。
⑥采用ATM字符复原技术,以及特征参数描述的PostScript LevelⅡ字库。
在语言上做了一些扩充和完善,以提高PostScript语言的处理效率,其中包括:
①引入高速缓存;
②提高了语言的设备无关性,这就是说,同一个活件可在300 dpi的激光印字机上输出,也能在2400dpi的照排机上输出,这种性质为照排机生产厂商所注意到,从而生成出用于图文记录机的 Postscript RIP,使Postscript语言的应用走出了办公室和桌面出版环境,进入了专业文字和图象处理的殿堂;
③增加了数据压缩和复原算子;
④改善了矢量 内存的管理机制。
这个新版本是Adobe公司作为其从低档的桌面出版系统发
展到高档彩色图象处理系统的基础。
PostScript的"post"指后缀表示法(postfix notation),“scrip"表
示图形描述语言。实际上这种语言也是用后缀表示法来描述图形
的。其具有一般语言所具有的数值运算、三角函数、逻辑运算等功
能,所有运算都基于堆栈的压入和弹出,以此组织数据和控制流
向,类似于FORTH解释性设计语言。该语言还有约占三分之一
的与页面描述有关的图形指令,用其控制文字、图形、图象的输出。
PostScript语言对页面的描述是一种与设备无关的高层次描述,其
页面描述功能包括:
①可由直线、圆弧、三次曲线构成任意图形形状,这些图形可
自由交*合并,可以有空洞和不连续部分。
②允许以任意宽度画出任意形状的轮廓,可以任意颜色填充
轮廓;可以任一图形轮廓作为剪裁路径(clipping path)剪裁其他图
形。
③图文一体。即任意文字可以当作图形处理,即PostScript
所有图形操作符都能对其进行处理。
④支持各种任意分辨力和各种动态范围的栅格图象。
⑤有一通用的坐标系支持所有线性变换的组合,也就是支持
任何可逆的仿射变换。可将各种平移、旋转、变倍反射和倾斜的功
能应用于页面中的各个元素(文字、图形、图象)。这样用
PostScript语言描述的页面可依赖于任何设备,可输出到任何设备
上。
PostScript对存储空间的管理采用了虚拟内存的概念,为提高
文字处理速度,引入了字库高速缓存(Font Cache)的机制。
PostScript语言与其他页面描述语言的主要区别在于:其他页
面描述语言对页面中出现的不同对象都给予直接的描述,如空心字有空心字指令,加阴影有加阴影指令,这样的页面描述语言的好处是指令简洁,但描述能力和扩充 性就受到影响。如指令间的组合往往不能实现,要增加新指令,也要对排版系统及输出作相应的改动。而PostScript语言并不对各种对象做直接描述,而 只提供最基本的指令和功能,*这些指令和功能的组合来实现所需要的页面描述。实际上并不*操作人员直接编写PostScript程序,而是图文处理的应用 软件中使用Postscript语言自动生成页面,然后由带PostScript解释器的输出设备解释PostScript语言描述的页面,输出最终结 果。因为利用了PostScript的丰富描述能力,图文处理软件才能生成令人叹为观止的版面。PostScript程序主要是用可打印字符书写的,因此 其描述的页面适合于存储,也适合于在不同计算机系统之间进行交换和传输,这种页面描述方式因此就不再依赖于计算机机型。
目前PC机上运行的大多数西文排版软件、CAD软件及 Windows环境下运行的图文处理软件都能支持Postscript输出。在苹果系统微机和Sun Sparc工作站上运行的图文处理系统也都能支持Postscript语言。
PostScript语言从开发之初就是输出设备控制器的一个组成部分,由于PostScript语言的成功,大多数输出设备生产厂家也竞相开发 PostScript语言的解释器,使用这种语言的产品也包括印字机、软片记录机(film recorder)、图文输出机、RIP单机(Stand- alone RIP),以及显示用Postscript。这些使用Postscript语言的输出设备接受、解释并执行PostScript的命令,将 PostScript语言描述的页面转换成位图输出。
用PostScript语言描述并用PostScript印字机输出的轮廓字库,也称为Postscript字库。
国内在Postscript LevelⅡ语言出现后也开始向Postscript标准*拢,北京大学计算机研究所于1992年底完成了PostScript LevelⅡ解释器,对中文出版系统采用这种语言打下了基础。

三、HP PCL语言

HP公司的页面描述语言是针对HP激光印字机写的语言。
由于HP激光印字机的用户多,许多应用软件都以HP激光印字
机作为可选输出设备之一,其他型号的激光印字机也常有采用或
仿真HP PCL语言的,现在市场上有1/3强的印字机都能使用HP
PCL语言,从而HP PCL语言也成为有影响的页面描述语言,成
为中低档和普及型激光印字机的事实上的工业标准。
HP PCL语言目前用得较多的是HP PCL4和HPPCL5。其
中PCL4是针对字处理和简单版面的描述的,PCL 5则是PCL 4
的提高,是针对高档桌面排版系统的,功能与PostScript语言的功
能相同,与PCL4的功能相比已大大增强,例如PCL 4的字模是
点阵字库,不同字号、不同倾斜度、不同高度的字体的点阵字库也
不同,PCL 4语言的印字机可旋转字体的不多,而且只能够旋转
90°,且不能将文字和图形(线条和基本图形除外)叠合。但能在同
一页中分开处理文字和图形,而PCL 5可对字符进行旋转、缩放、
加阴影、反白、填充花纹、叠加图案等操作。
PCL 5是一种命令语言,没有条件执行、过程和变量,因此每
接收到由驱动程序发的一条命令就立即加以执行。而PostScript
语言则需先接收整个PostScript语言文件,再由印字机上驻留的
软件对此文件进行解释才交付打印机构执行,从而得到所要的图
形。与PostScript语言相比,PCL 5的语言是比较初级的,要达到
相同的输出效果,PCL5需要更多条打印命令。
PCL 5有许多命令与分辨力有关,因此不能像PostScript语言
那样根据分辨力计算。
四、华光页面描述语言

华光页面描述语言(简称华光PDL)是国内应用广泛的一种
页面描述语言,是1986年由北京大学为华光激光照排系统所写的’页面描述语言。经过多年的发展,它能表示一页版面上任意位置上的多种字形,也能表示各种宽度的直线段、圆弧等,并能在一系列直线段和曲线段构成的封闭图形中填充几百种网纹。
华光PDL语言在国内目前的华光和方正电子出版系统中起了十分重要的作用,它将许多厂家独立开发的排版软件、绘图软件和图象处理软件的输出结果以统一的华 光PDL形式表示;通过一个PDL解释器把这些软件的输出结果汇总在一页中显示和输出,是国内有影响的页面描述语言之一。华光PDL语言在国内拥有一大批 用户,虽然功能不如PostScript语言强大,但其还将在一段时间里起重要的作用。

五、其他页面描述语言
1.Truelmage页面描述语言。这种语言是由微软公司和苹果公司推出的Postscript的派生语言,与PostScript完全兼容。该公司推 出时称为PostScript语言的发展,而不是简单的模仿。其开发之初衷是:PostScript语言强调独立于计算机系统,许多功能都在RIP上计 算,从而增加了成本,开发Tmelmage语言就是改变这种情况,它采用了不同的技术途径,能让同一页上的文字、图形和图象组合在一起。它与计算机图形操 作环境紧密地交织在一起,还使用部分屏上映象技术,使图象直接送至印字机,减少传递次数,当时速度可比PostScript高520倍。但由于缺乏自己的 特色,已用得不多。
Truelmage语言中描述字库的子集TrueType,结构灵活,能支持大字符集(如汉字),则用很广泛。
Truelmage也采用了Windows控制面板,积极为开发商提供环境,也因采用了Windows而得到推广。
2.InterPress语言。由施乐公司推出。
3.IPDS语言。由IBM公司推出,意为智能型印字机数据流
4.DDL。插图文件描述语言。 5.LIPS。日本佳能公司推出。与HP PCL近似。

PDF工作流程
Adobe公司提出的PDF(PortableDocumentFormat)是一种与设备无关的文档格式,利用这一格式可以使人们以更有效的方式共享、 观看和打印文档,从而让数字信息发挥更大的潜力。PDF格式通过建立可移植文档提高传播效率,这是一种自我依*的文件,无论 PDF文件是在何种硬件平台上观看,其效果总是一样的。此外,不管PDF文件在何种平台上产生,其最终结果也是一样的。当在计算机屏幕上观看时,文档的内 容和格式保持其整体性,保证观看者看到的仍然是文档创建时的原始版本。按照Adobe公司的解释,PDF格式提供的文档内容将与用户选择的传播媒体准确一 致。为了达到这一目标,PDF文档在整个传播过程中就像印刷工艺中的“底版”,例如从因特网上发布直至在印刷机上印刷。简言之,PDF文件是经过压缩的、 自我包含的结构性文件,特别适合于信息的数字传播。
PDF版本与通用特点
PDF文档格式依赖于PostScript语言的成像模型,它以与设备和分辨率无关的方式描述页面上的图文状态。为了改善文档的交互观看性能,PDF定义 了比多数PostScript语言程序更多的结构化格式。例如,PDF包含类似注解和超文本那样的对象,这些对象不是页面本身的内容,但对于交互式地观看 文档却是有用的。
PDF文件是由一系列编了号的对象建立的,这与PostScript语言中使用的对象相似。组成页面内容的文本、图形和图像用操作符表示,这些操作符以 PostScript语言中使用的操作符为基础,遵循Adobe lllustrator 3.0的页面描述操作符书写约定。此外, PDF文件不是 PostScript语言程序,它不能直接被PostScript解释器翻译。但是,一个PDF文件对页面的描述可以转换为PostScript语言程 序。
PDF第二版1.1简介
PDF1.1是Acrobat2.0产品家族的原始文件格式。与PDF1.0标准类似,PDF1.1标准定义了最低水平的交换功能。可移植文档格式是一种 可扩充的格式,这意味着PDF文件可包含没有被该标准定义的对象。用户用于阅读和解释PDF文件内容的应用程序能够正确地实现由PDF1.1定义对象的语 义,并尽可能忽略该应用程序无法理解的对象。在PDF的1.1版中包含如下功能。
(1)能用密码保护文档和限制对文档的操作;
(2)能将文本块联系在一起组成文章,使阅读文档更容易;
(3)可产生对象间的连接,使书签目标与动作相关联,也包括连接到其他PDF文件:

(4)可定义新的注解类型并为已存在的类型提供附加属性;
(5)在文档被打开时可定义默认设置参数和动作;
(6)文档中对象的颜色与设备无关;
(7)包含在文件中的标记使得核对文件的正确性变得很容易,即使在文件名不正确的场合也可核对文件的正确性;
(8)保存文档的二进制选项使得最终的文件更小;
(9)允许比较文件日期;
(10)可提供附加文件信息。
PDF第三版1.2简介
PDF 1.2是Acrobat3.0产品家族的原始文件格式,它是PDF 1.1版本的改进。PDF 1.2
版本包含的新功能如下:
(1)带有图文状态的交互式元素,例如按钮和核准框;
(2)支持放映来自文档外部的电影文件和声音文件,其中声音文件除来自外部文件外,
也可嵌入在PDF文件中,成为文档的一部分;
(3)可以在PDF格式的基础上交互式地将数据填入表格,这样的数据可输入、输出、
转换或从因特网接收;
(4)支持双字节字符,例如像中文、韩文和日文那样的大字符集;
(5)支持边框和加亮增强,以及通用外观注解等;
(6)支持对鼠标事件的反应;
(7)基本上不受超文本连接数量的限制,从而使PDF文档更适合于电子出版;
(8)支持开放印前界面OPI(Open Prepress Interface),因而可直接在PDF文档中实
现图像代换技术;
(9)先进的颜色表示和转换功能,例如从像素到半色调网点的转换、定义用于分色输出
的传递函数、支持图案和分色颜色空间,以及补漏白功能等。
PDF的通用特点
给定了使用PDF文件的目标后,PDF文档格式有几个显著的设计特点。
一、PostScript语言成像模型
PDF文档格式采用PostScript语言的成像模型表示文本和图形等对象,这与PostScript
语言程序类似,一个PDF页面描述通过在选中的区域中放置“颜料”画出一个页面。
(1)被着色过的对象可以是字符形状(轮廓)、由直线和曲线组合定义的简单或复杂区
域(路径)、照片的数字采样;
(2)可以对文字和图形对象使用任何颜色的“颜料”;
(3)图像可以被用户定义的裁剪路径裁剪成需要的形状,这样,仅在该形状内的这部分
图像才能出现在页面上;
(4)在开始描述页面时,页面是完全空的。页面建立后再由各种页面描述操作符将标记
放置到页面上,每一个新的标记将完全遮挡住被它覆盖的标记。
PDF页面标记操作符类似于PostScript语言的页面操作符,但有的PDF页面标记操作
符与PostScript页面描述操作符不同。PDF的某些页面标记操作符不同于PostScript语言页
面标记操作符的原因是: PDF不是一种编程语言,而是一种文档格式,因此它没有过程、
变量或控制结构。 PDF的这一特性降低了表示图文对象的灵活性,但换来的是该格式的操
作效率更高。一个典型的PostScript语言程序使用PostScript语言标记操作符定义了一套操
作符集,而PDF定义了自己的操作符集,它们对于描述大多数页面是足够的。PDF的操作符直接以机器编码的方式实现,不像PostScript那样使用语 言编码。因此,PDF的页面描述更快速。由于在PDF格式中不允许使用带有任意性的编程结构,应用程序可在一个PDF文档中更有效、更可*地定位文本字符 串。
二、可移植性
一个PDF文件可以是一个7位的ASCII编码文件或一个二进制编码的文件。如果PDF文件是一个7位的ASCII文件,则该文件仅使用7位的ASCII 编码加上空格、制表位、回车和换行这样的可打印编码子集;若PDF文件是一个二进制编码文件,则可以使用整个8位范围内的字符。 ASCII是最容易移植的形式,对不是完整的8位通道或行结束后的换行情况, ASCII编码是唯一能很好匹配的形式。但一个二进制文件却不能进行正确的转换,有些代理商在表达标有文本的信息时随心所欲地处理文档内容。例如,邮件传 输系统可能没有保留特定的7位字符以及行结束处的变化,这样会造成损坏PDF文件。因此,在可能将PDF文件标志为二进制编码形式时,我们建议;在文件开 始处附近包含几个编码大于127个二进制字符的注解,即使文件的其余部分是ASCII编码也可按此原则处理。这样,在文件中可能出现二进制编码时,就可保 证将该PDF文件处理为二进制文件,但仍然允许通过一个非二进制的通道进行转换,不会造成对文件的损坏。
三、压缩
为了减少文件尺寸, PDF文档格式支持多数工业标准压缩算法,它们有:
(1)彩色和灰度图像的JPEG压缩算法;
(2)单色图像的CCITT Group3、CCITT Group4、LZW(Lempel-Ziv-Welch)和行程长度压缩算法(Run Length):
(3)文本、图形和索引彩色图像的LZW和Flate压缩算法。
当采用JPEG压缩算法时,彩色或灰度图像的压缩比可达10:1或更高;单色图像的压缩效率取决于所使用的压缩算法和图像特点,但通常情况下压缩比为 2:1至8:1;文本和图形使用LZW压缩算法时压缩比大约是2:1。所有上述压缩算法产生的均是二进制数据,此后可以用ASCII方式重新编码,以保持 文件的可移植性。
四、字体独立性
管理字体是实现文档交换的基本要求。在通常情况下,收到文档的一方应该与发出文档的一方有相同的字体,否则将采用系统的默认字体取代,从而产生不可预测的 结果,因为默认字体的规格(宽度)与用户要使用的字体可能很不相同。文件的发出者可以将字体包含在文档中,但这很容易造成文件尺寸的增大,比如从10K增 大到250K。另一个可用的方法,是文件的发出者可以像传真机那样将文档的每一个页面转换成具有固定分辨率的图像。然而,即使采用了压缩方法,每一页的图 像仍然可能是很大的,例如当采样分辨率为200DPI时可达到45—60K。此外,这样做的结果是在文件中丧失了应有的智能,即文件的收取者将无法对文档 进行检索,也无法从文档中抽取需要的文本。
PDF格式提供了一种新的解决方案,使得一个文档可以与建立它时使用的字体无关。每一个PDF文件对文档中使用的每一种字体均包含了一个字体操作符,该字 体操作符包括字体的名字、字符规格和字型风格信息。这些信息对于模拟文档中“丢失”的字体是必要的,通常这样的信息对每一种字体仅为1~2K。
如果在观看PDF文件的计算机系统上有文档中使用的字体,则观看文件时将使用该计
算机上的字体;如果计算机上没有PDF文件中使用的字体,则将以逐个模拟原字体大小和
宽度为基础使用多用途的主字体,保持文档整体上的“颜色”和格式。在这一解决方案中
使用了Adobe公司的Typel字体和TrueType格式字体。
符号字体(Symbolic Font)必须以特殊的方式处理。一种符号字体是指不使用标准ISO
Latin1字符集的字体,例如Carta、Adobe Caslon Swash Italic、Minion Ornament和Lucida
Math等。对这样的字体,要有效地模拟是不可能的。
对于符号字体,光有字体操作符(包括字体规格和风格信息)是不够的。为了精确地
显示和打印文档,需要实际的字符形状。对于除Symbol和ITC Zapf Dingbats外的其他符号
字体, Type 1字体程序的压缩版本将包含在PDF文件中;而对于广为使用的符号字体
Symbol和ITCZapfDin9bats,则在发行时没有必要将它们包含在PDF文件中。
五、单向通过(Single-pass)文件的产生
由于系统限制和考虑到执行效率,在应用程序中实现以单向通过的方式产生PDF文件
不但需要,也很必要,例如PDF Writer就是这样的应用程序。这可能是由于应用程序只能
访问有限的内存,或者是不能打开一个临时文件。为此, PDF格式支持以单向通过的方式
产生文件, PDF文件要求某些对象包含定义它们字节长度的数字。该格式提供了一种机
制,允许在文件中的对象后定位它的长度。此外,在所有的页面被写入文件后可以将文档
中诸如页面数量这样的信息写入文件。

六、随机访问(Random Access)

从PostScript语言程序文件中准确抽取并显示一个选中页面需要使用一种工具,该工具
必须从该文件的开始处扫描,直至找到需要的页面。因此,观看页面所需要的平均时间不
仅与该页面的复杂程度有关,而且取决于文档中包含的总页数。当观看与页面数量无关的
文档中的页面时,若所需的时间作为主要的考虑因素,则上述工作方式对于交互式地观看
这样的文档是有问题的。
每一个PDF文件中包含一个交*参考表(Cross-reference Table),用于定位和直接访
问文件中的页面和其他的重要对象。交*参考表存储在PDF文件的结尾处,这样才能使得
以单向方式产生PDF文件的应用程序易于存储它,也使阅读该PDF文件的应用程序很容易
找到它。通过使用交*参考表,用于阅读PDF文件中指定页面所需的时间可以做到基本上
与文档中包含多少页面无关。
七、递增更新
应用程序允许用户修改包含上百页或更多页面的PDF文档,每次修改时,用户不必等
待整个文件重写到原来存储的文档中,因为PDF格式采用的方法是将修改内容扩充到原文
件的结尾处,原来的数据不变。当一个PDF文件被更新时,文件中的更新部分仅包含被修
改的对象或增加的对象,扩充的是附加的内容,并将更新信息包含到交*参考表中。支持
递增更新带来的好处是应用程序将修改信息存储到PDF文件时所需的时间正比于修改的
量,而不是正比于文件体积。此外,由于原来内容仍然保留在该文件中,通过删除一个或
更多附加内容就可恢复修改前的状态。
八、可扩展性
PDF格式在设计时就考虑到了可扩展性。毫无疑问,应用程序的开发者希望将PDF格
式现在还没有实现或没有考虑到的功能加到应用程序中,因此该格式的可扩展性为应用程序的开发者提供了实现的途径。
PDF格式设计时不仅考虑了可以增加新的功能,还考虑了应用程序在遇到早期版本还没有实现的功能时不会中断工作。PDF格式1.2版本规定了PDF文档阅读软件在读到一个无法理解的文件时应如何处理。 10.1.4 PDF版本号
每一个PDF文件均包含该文件的版本号,由主版本和次版本组成,版本号是PDF的头部分,应该写在文件的第一行,其形式为:
%PDF-M.m其中, M是主版本号, m是次版本号。
如果PDF格式以某种方式发生了改变,当前的文档观看程序在读文件时发生了严重错误,则主版本号将被增加到文档中。这里,严重错误指的是禁止观看页面。
如果PDF格式以某种方式发生了改变,文档观看程序显示一个出错信息但仍然继续工作,则次版本号将会改变。因为增加新的页面描述操作符要求改变次版本号。
如果PDF格式以某种方式发生了改变,而当前观看程序无法检查出这样的改变,则不必改变版本号。比如在文件中加入了私人数据,观看程序无法理解这样的数据时将忽略它。
Acrobat文档阅读软件将力图读出具有有效PDF头的任一文件,即使版本号比阅读程序本身新也如此;如果文件头中的版本号要比阅读程序本身老,它仍然 能够毫无错误地读出一个不要求插入模块的文件。为了显示跟随连接的注解或执行动作,某些文档可能需要插入模块的帮助。但是,对于显示一个页面的内容,是不 会需要插入模块的。
如果文档阅读程序用比它预计的新的主版本号打开文档,则它会警告用户不一定能成功地读出该文档,用户也不能改变或存储该文档。在处理与文档有关的第一个错 误处,阅读程序通知用户发生了一个错误,但以后不再报告发生的错误。但是,某些错误将自始至终被报告,包括文件的输入/输出错误、扩充软件装载错误、内存 溢出错误以及报告命令失效等。只要有可能,处理过程将继续进行。注意,Acrobat Exchange不允许将具有较新版本号的文档插入另一个文档。
此外,当文档阅读程序采用比它预计的新的主版本号打开文档时,则文档阅读软件会悄悄地记住该版本号,只有在遇到错误时它才会警告用户。此时,它通知用户文 档的版本号比期望的要新,发生了一个错误,但以后不会被报告。该文档将不能被递增更新存储,但可以存储为一个新文件,该存储的新文件具有新的版本号。用户 可以把一个具有较新次版本号的文档插入另一个文档,结果文档是可以存储的,其版本号将是原文档和插入原文档两者中的最大值。
在打开一个PDF文件时, Acrobat文档阅读软件将寻找有效的PDF头。所有的文档阅读程序允许PDF头出现在文件前1000个字节的任意位置上。 1.0版本的文档阅读程序只要求在头中出现“%PDF-'’,可以忽略头中的其余部分。以后的文档阅读程序将搜索前面描述头的形式,但它们也接受下面这样 形式的头:
%!PS-Adobe-N.nPDF-M.m其中,N.n是Adobe文档结构约定版本号,M.m是PDF版本号。
PDF技术概要
PDF的版本变动与通用特征已经在上一节中讨论过。本节要介绍的是PDF产生的背景、它在数字印前和数字印刷作业中的用途以及PDF技术的基本内容。 10.2.1 PDF技术的产生背景与用途
一、PDF技术适用于信息时代
我们生活在一个开放式的信息传播时代,时代特征需要对各种信息实现快速的访问。为此需要一种恰当的信息提交机制,以便通过大型的公共网(例如 Internet)或小型网络(例如Intranet)极其有效地传递信息。PDF就是能满足上述要求的技术,它是一种与设备无关的数字文件交换标准。每 一个PDF文件中包含了阅读或打印时需要的全部必要成分,包括系统、图形、图像等,甚至还可以包含用于阅读或打印PDF文件的程序PDFReader。 PDF技术将文档处理的灵活性提高到了一个新的水平,成为信息传播的基础。
二、PDF的来源
PDF有如此多的优点,它可以为人们带来众多利益,但为什么它还没有在数字印刷和数字印前作业中得到广泛应用。在设计PDF文档格式的初期, Adobe公司主要考虑的问题是如何使这一格式符合出版环境。因此,开始时Adobe公司并没有从高端技术环境的要求来设计PDF。不过,有不少企业却看 到了PDF格式的潜在能力,他们开始将PDF技术用到数字印前生产中。此后, Adobe公司着手扩展PDF技术,将更多为高端印前作业需要的功能集成到了PDF中。
三、 PDF在印前和印刷环境中的应用
1997年, Adobe公司开始与Agfa公司合作,目的是推动PDF技术在印前环境中的应用,并打算以该文档格式为基础开发出适用于印前作业的新产品,而不只是用 PDF来传递。文档。与此同时, Agfa公司宣布将开发一种新的产品,计划通过这种新产品建立新的工作流程, PDF将是这样的工作流程中使用的唯一文件格式,从而避免使用其他任何中间格式。这样的解决方案符合印刷工业对标准化生产的要求,使得在数字印刷和计算机 直接制版环境中有可能全面应用数字工作流程。采用这种数字工作流程后,用户就可以在PDF文件结构中表示CMYK页面,允许用户将PDF用作高效率生产流 程的基础。 Adobe公司正继续加强PDF标准,以满足印刷工业对PDF技术不断增长的需求。
四、采用PDF技术的意义
PDF对基础商业应用的意义十分明显,那就是它使得印前公司和印刷公司能够用更少的时间完成更多的作业任务。 PDF也能使印前公司或印刷公司保持住自己的客户,建立与客户更巩固的关系。 PDF技术可以显著地减少文件输出的准备时间,这是因为它有内置的符合工业标准的压缩方法,易于使用,轻巧灵便,有利于公司印前部门和印刷车间的各个成员 通过网络或电子邮件共享文件。
五、从现实的角度看PDF
PDF对印前的主要意义是工作流程管理和提高生产效率。但是,对PDF必须采取现实的态度, PDF不是魔术师,而是一种工具。能否有效地使用这一工具在某种程度上取决于使用它的人已经掌握的技巧以及受到何种等级的训练。 PDF确实能解决不少工作流程中的
障碍,因此对于受到过专业训练的人来说,利用PDF改善工作流程是最合适的。
由PDF引发的挑战和问题
PDF工作流程可定义为下述任意过程:建立或接受PDF文件,准备打印或输出,其中
输出方式包括记录到胶片、记录到印版或在数字印刷机上输出。重要的在于,采用PDF工
作流程并不意味着完全替代当前的PostScript工作流程或其他类似的工作流程。事实上,
PDF工作流程可以与现有流程并行处理,作为现有流程的补充而使之更完整。用户也可以
保留部分现有PostScript流程,然后选择适当的时机将PostScript文件转换为PDF文件。有
一点可以肯定,那就是采用PDF技术的公司会越来越多。随着软打样技术的日益成熟并为
越来越多的人接受,PDF技术的实现将变得更容易。
现在有许多公司正在从事PDF产品的开发和研究,构成从设计到印刷的完整生产流
程,其中不少产品虽然还在开发过程中,但关键部分已经生产出来。
一、跨越设计程序与PDF间的缺口
将设计程序、排版程序(例如QuarkXPress和PageMaker)与PDF集成得天衣无缝至
少在目前是不现实的,还有不少问题等待解决。最理想的是,设计程序应该允许用户建立
和准备PDF文件,这种文件用于在各种设备上打印输出,即设计软件需提供类似“SaveAs
PDF”这样的命令。此外,设计软件也应该具备打开和重新使用PDF文件的功能。但目前
很少有提供上述功能的设计软件,往往只能在设计软件中输出PostScript文件,再通过
Distiller转换为PDF文件。因此,无论哪一种PDF工作流程解决方案都应该指导用户如何
按自己使用的设备为Distiller设置正确的参数。
二、PDF文件的标准化问题
PDF工作流程的有效程度取决于被允许在流程中通行的文件质量。与其他文件格式类
似, PDF文件也需要一定程度的严密性,且需要检查,以保证在最终形成的文件中包含了
全部为生产工艺所必须的成分。在多数情况下, PDF文件是在公司外部建立的,例如由广
告代理商或设计公司建立。印前公司或印刷公司应该为这样的客户提供建立文件或文档的
准则,以尽可能减少重复劳动。
文档的建立者通常处在技术的最前沿,其中有相当数量的人已经在各种应用领域中使
用PDF文件,比如利用PDF文件与客户通讯。他们希望印前和印刷服务商能够很快地接受
他们提交的PDF文件,并以这样的PDF文件为基础为他们输出高质量的结果。他们对
Acrobat的认识往往是不全面的,认为Acrobat无论在何种高端印刷工作流程中总是能可*
地工作。但是,在PDF文件与印刷之间确实存在缺口,因而需要像Apogee这样的PDF工
作流程解决方案;生成PDF文件的有关参数必须正确设置,才能保证获得高质量的输出。
为了确保工作流程的有效性,需要对客户进行基本的培训,以及来自第三方的专门工具或
工具包。如果采取了上面这样的正确步骤,则客户不是简单地提供PDF文件,而是由他们
建立的PDF文件能够符合印前或印刷公司生产流程的要求,保证在输出设备上获得高等级
的记录质量。
PDF技术可以解决某些PostScript文件的常见问题(例如字体缺失),但仍须从一开始
就正确地建立文件。因此,在利用Apogee、Acrobat、Distiller等软件工具时还得小心谨
慎,对参与生产的人员加强培训应该是公司经常性的工作内容。此外,对客户的培训也十
分重要,这是保证工作流程高速和高效、减少处理时间、降低文件出现问题的前提条件之
一。
PDF文件进入工作流程时越准确,则处理过程中需要的调整时间就越少。据高端印前
和印刷生产人员估计,为了获得正确的输出结果,他们往往要花费大量时间调整接收到的
PostScript文件,大约要占总生产时间的20%以上。为了在PDF工作流程中避免这种情况
的出现,高端生产企业应该为他们的客户提供必要的工具,使客户们能正确地设置PDF文
件;客户也应该有自己的应用工具(例如Quark公司的模板与Extensis公司的Preflight Pro
等),以确保生成的PDF文件是可*的。
三、生产人员培训
与采用其他新技术一样, PDF技术也要求参与生产的人员改变他们的工作方式,才能
降低出现问题的概率,顺利地到达预定目标。 PDF工作流程的实现并不意味着工艺过程的
根本变化,其本质是对PostScript工作流程的改革。因此,如果公司的生产人员现在能成功
地接受PostScript文件,恰当地处理并成功地输出这样的文件,那么接下来采用PDF技术必
然是合符逻辑的选择。
四、印前作业的特殊问题
PDF格式的众多优点导致了一系列相关问题的讨论,其中最主要的是PDF能够做什
么,无法做到的又是什么。最近,对PDF标准的讨论集中在与印前功能有关的问题上,包
括处理多色调图像、叠印、图像代换技术和颜色管理等。
五、作业传票的用途 ’
便携式作业传票格式PJTF是一种用于PDF技术的作业传票格式,其设计目的是为了
PDF技术的基本用户,包括利用PDF文件在显示器上显示的用户。 PJTF格式不可能考虑
到印刷业不同性质、不同流程的需求,比如设计者、输出中心和印刷厂的需要往往并不相
同。为了以尽可能有效的方式操作和处理PDF文件,作业传票必须被用作传递与作业有关
信息的工具,从复制数量到记帐细节,比如颜色管理指令和处理指令等。
六、确定何时执行栅格化操作
与其他进入工作流程的文件类似, PDF文件也必须在输出到专门设备前进行栅格化处
理,不管是输出到数字印刷机还是输出到印版照排机。 PDF工作流程通常采用所谓的及时
栅格化技术(Just-in-time Rasterization),这是由PDF工作流程能为用户提供最后一分钟
修改机会的优点所决定的,因为文件被栅格化处理后已经转换为点阵描述的形式,当然不
具备可编辑的条件。因此,决定在工作流程的哪一位置上对PDF文件进行栅格化处理是问
题的关键所在。有的PDF流程解决方案选择过早的时间对文件进行栅格化处理,这样就损
失了PDF技术的固有优势,比如PDF文件的可搜索性和灵活性将损失殆尽。因此,应该在
刚好要输出前进行栅格化操作,这样才能实现最后一分钟的编辑修改功能,充分利用PDF
格式的灵活性优点。
七、保证文件内容可重复使用
PDF文件格式设计的主要目的是与设备无关。为了使PDF文件尽可能适合于高端印前
和印刷使用,色域映射总是不可避免的,但不能过早进行。否则,生成的PDF文件就只能
用于高端印前和印刷,而不能用于其他场合。比如,进入PDF工作流程的文件既可以在数
字印刷机上印刷,也能在Web上使用,如果过早地作了色域映射,则该文件只能用来印刷,
用到Web上就不合适了。
八、市场限制
至少到目前为止, PDF还不能全方位地应用,即PDF技术很难在某些特殊的印刷环境
中实现,例如柔性版印刷就是一个例子。原因在于,那些特殊的印刷作业环境将导致复杂
的处理要求,标准化的实现仍然有相当的难度。

PDF生产环境典型解决方案

Agfa 是首家在产品中应用PDF技术的印前设备和系统开发公司,该公司将PDF作为关键技术集成在自己的产品中,定义了下一代出版工作流程。Agfa的软件产品 Apogee提供了与PDF技术有关的完整解决方案,解决了如何在高生产效率与高级出版工作流程中使用 PDF技术的许多具体问题。在这一解决方案中, PDF面向对象的根本特性没有改变,即用户仍然能以多种方式使用PDF文件,例如在纸张上打印,在Web上观看,或输出到其他介质上。Apogee是一个 完整的数字作业系统,采用它的用户(印刷公司与印前公司等)可充分享受到PDF工作流程的优点,印刷公司或印前公司的客户们也因为PDF技术而有更多的灵 活性。
核心概念
Agfa公司的PDF工作流程以下述三个核心概念为基础。
一、PDF被用作可*的数字“底版”
在Agfa公司的PDF工作流程解决方案中,所有接收到的文件均尽可能在工作流程的前端解释为PDF页面,这些PDF文件将用作输出时的数字“底版”。在 工作流程前端已经解释成的PDF文件可以在输出前的最后一分钟观看、编辑、重新组织和打样,待效果满意后再输出。这种开放的作业方式不同于专用工作流程, 后者是在流程的前端将接收到的 PostScript文件或PDF文件转换为专用格式,这种区别是原则性的,因为在工作流程的前端将文件转换为专用格式将会失去PDF的真正优点(例如在 输出和记录介质上的灵活性),这些优点一旦转为专用格式后就消失了。
当一个PDF工作流程具有上述特点时,则其工作流程是开放式的,保证有一个动作相互协调、结果可预测的生产环境,参与这一生产过程的工作人员可以向前或向后通讯,相互间的协调良好,无需中间过程。
二、适时地执行栅格化操作
PDF的优点之一是灵活性。一个性能良好的PDF工作流程允许用户在输出前执行最后一分钟的编辑和修改操作,无需花费额外的时间重新对文件进行解释。 Agfa公司的PDF工作流程采用两个步骤的栅格化处理,这一方法允许PDF数字“底版”尽可能保持更长的时间。在这样的工作流程中,首先执行的是颜色管 理、数字打样、补漏白、拼大版、输出前改变页面内容、图像代换以及CMYK分色或高保真分色,所有这些操作均在PDF格式下处理,因而处理工作量小、效率 高,通过直接访问PDF文件的方式进行;第二步才是实质性的光栅化,但尽可能晚地进行。
三、作业传票增加了工作流程的灵活性和控制能力
Agfa公司的PDF工作流程以作业传票为基础,文件或页面组合在输出前必须能通过全部作业流程。 Apogee采用的作业传票技术对便携式作业传票格式PJTF (Portable Job Ticket Format,这一格式是Adobe公司Extreme的一个组成部分)标准进行了优化处理,能满足数字印前和印刷作业的特殊需要,它与页面内容无关。在 定义了某一工作流程后,如果有一个新的作业进入该系统,只要给它分配合适的传票就能在工作流程中传送。对同一个作业可以重复使用,只需在传送它时分配另一 个作业传票即可。作业传票还可以包含各、种类型的附加信息,例如页面计数、印前、印刷和印后处理功能等,这实际上扩充了工作流程的概念。
上面介绍的工作流程增强功能被嵌入在Apogee生产系统中,这是一个以PDF工作流程为基础的完整系统。Apogee是一种模块式的系统,它包括PDF Pilot、以PostScript 3为基础的Apogee PDF RIP和Apogee Print Drive。其中, PDF Pilot的作用是创建、接受、检查、存储和解释页面,执行图像代换操作,以及通过作业传票定义作业;以PostScript 3为基础的Apogee PDF RIP按作业传票的指示处理作业,并执行补漏白和分色操作; Apogee Print Drive则对所有PDF文档进行输出管理。
重要的问题在于,Apogee采用模块式的解决方案这一特点允许用户以自己的方式建立
一个完整的生产系统。例如,用户可以从Apogee PDF RIP模块开始接受PDF文件并进行下
一步处理。
按步就班的PDF工作流程
工作流程取决于用户可提供的服务类型以及所关心的应用领域,下面介绍的方法定义了实现以PDF为基础工作流程的所需要的主要步骤,适用于数字印前和印刷生产环境。
一、建立可*的PDF数字“底版”
草率地建立PDF文件将不能保证实现对该文件的正确处理。建立一个可*的数字“底版”以及可*的PDF工作流程应该开始于复制过程的设计阶段,需要使用权 威的应用程序,例如像QuarkXPress和PageMaker这样的软件,且必须满足特定的条件与标准。无论在何种生产过程中,用户应该以确定的方法 组建页面才能保证得到无间断的处理过程。类似 Extensis公司的Preflight Pro这样的解决方案允许用户以设置好的一套优先项参数为基础检查Quark文件,保证所有的页面成分出现在正确的位置上。如果输入文件通不过检查,则可 以对文件本身进行调整,使之满足生产流程的需要。
二、为高端生产环境设置Distiller参数
Distiller软件用于将PostScript文件或EPS文件转换为PDF文件,这对以PostScript格式提供的文件继续输出是重要的关键步 骤。 PostScript文件的创建者需要这一工具转换文件,使之可以在PDF工作流程中使用。但是, Distiller软件本身却不能保证转换得到的PDF文件在高端印前工作流程中的可*性。Distiller的设计目的是为Web建立PDF文件,而不 是为高端印刷。为了满足高端印刷的需要,用户应该为Distiller设置正确的作业参数,以保证输出结果的正确性,避免因调整PDF文件而浪费大量时 间。
此外,文件的使用者(即印刷商)也需要类似的功能,为此可切换到Apogee Pilot来为高端印刷生产创建PDF文件。Apogee软件的这一模块允许用户描述并定义作业目标,例如定义一个8页的大版代替4页大版。
三、接受作业并设置作业传票
对印刷生产操作而言,可以利用Enfocus公司的Check Up软件检查接收到的PDF文件或PostScript文件,确认这些文件准确、可*。当发现错误时,用户应该仔细检查由软件给出的需要特别注意的区域。 需要了解如何建立可*PDF文件的Enfocus公司产品或其他产品,可访问www.digitalroadmap.com网站。
文件通过检查确认后,Apogee软件的PDF Pilot模块就开始以Apogee为基础的工作流程:先接受进入流程的PDF文件或PostScript文件,然后对作业传票执行初始化操作;接下来是 用户开始设置补漏白、图像代换、拼大版、分色、颜色管理和输出参数等,最终结果体现在作业传票上,其中包含了描述页面组合在输出前要经历的不同工艺过程; 此后,该作业传票信息被转移到Apogee PDF RIP上,开始执行全部工艺过程。
四、以PostScript 3 RIP处理作业
Apogee软件采用PostScript 3 RIP处理PDF文件。考虑到与现今流行的工作流程匹配,该RIP也能处理PostScript文件。PostScript 3 RIP是Apogee集成系统的一个重要组成部分,采用该RIP的用户仍然能利用原RIP的输入优点,并具备Adobe Extreme技术的两步RIPing处理特点。Apogee PostScript Level 3 RIP的另一个特点是可以处理传统PostScript文件,保
证其易用性和性能不变。此外,为了保持最大程度的灵活性, Apogee的PDF Pilot模块可
以将PostScript Level 2文件输出到第三方生产的RIP上。
对PDF文件直接进行RIPing处理比起将PDF文件重新转换为PostScript文件来是一种
更简单的操作。PDF Pilot与Apogee PDF RIP共同建立两步RiPing处理,保证PDF的开放
性不变。
五、输出管理
Apogee软件还包括PrintDrive模块,它是PDF工作流程与用户设备间的接口,用户设
备可以是激光照排机、印版照排机、打样机或数字印刷机。PrintDrive的主要功能是管理印
刷文件、预视、打样、压缩懈压缩等,使生产过程能自动进行。该模块能从多今RIP接受
输入文件,也能接受某些专用系统格式的文件。使用多个RIP技术后,用户可建立“先RIP
再输出”的工作流程,即RIP好的文件不必立即输出,可以按作业的先后次序排列,待时
机合适时再输出。
上面介绍的五个通用步骤在Apogee PDF生产系统的基础上建立了可*的PDF工作流
程。但是,具体的工作流程将因用户的不同操作而异。为了更有效地实现Apogee PDF工作
流程,可以预先设计好流程图,将所处的特殊环境条件考虑进去,自定义一个最好的解决
方案。
PDF技术的主要市场和应用领域
短周期印刷和按需印刷正成为重要的印刷应用领域,为了保持数字印刷机的正常运
转,满足一定的利润指标,需要有连续而稳定的作业流。PDF文件格式具有自我包含、压
缩和易于管理的特点,对短周期印刷是一种理想的格式。这是因为在印刷的利润空间所存
无几的情况下,如果要使投资风险降低,则文件必须易于印刷。在目前情况下,只有PDF
技术才能以紧凑、完整和可视的方式精确地描述和输出页面,也是易于印刷的。应该看到,
PDF技术可以使广泛范围的应用领域受益,它可以覆盖整个印前和印刷市场。
一、设计者
采用PDF技术后,设计者能够将软打样结果传送给客户,以流水线的方式确认打样结
果,省略了彩色打样和快递费用,从而降低生产成本,减少周转时间。PDF是一种理想的
协作生产工具,因为PDF文件可以在任何计算机平台上观看,很容易经由电子邮件传递。
如果设计者的工作成果将要在多种媒体上使用,例如用于印刷和Web,则可以采用PDF格
式,它适用于这两种媒体,这是其他缺少灵活性的文件格式所不具备的优点。一次设计,
多次使用,工作效率自然也得到提高。PDF格式的这一特点提高了设计者和输出中心为客
户服务的级别,可以全方位地为客户服务。
二、报纸和杂志
PDF文件迅速成为广告代理商向报社提交广告稿的标准,这一问题在PDF技术出现前
是很难处理的。在美国,几乎每个月有100000多个广告在美联社的广告传送网络上流动,
它证明了PDF不是“小儿科”型的技术,而是可以用在大规模的信息处理上。与报纸广告
相比,杂志广告要更复杂一些,因为客户对杂志广告的质量要求更高, PDF技术对杂志广
告同样有用,因为PDF不是低质量的代名词,采用PDF格式仍然可保证输出结果的高质量。
三、广告代理商
广告代理商利用PDF技术的方式主要有软打样,以及建立他们与印刷公司的连续工作
流程。广告代理商可以从PDF文件的易用性获益,因为借助于PDF技术,他们将成为创造
性过程的一个集成成分。广告代理商还可以从PDF文件的多重用途获益,他们可以将一个
广告的多个拷贝传送到各种应用领域,无需重新设计,也不必传递分色胶片。对转移到因
特网的广告代理商, PDF同样是他们的理想选择,因为采用PDF格式可以快速传送,可跨
媒体使用。
四、输出中心
输出中心是典型的印前服务公司,正是他们最早采用了PDF技术。这是因为输出中心
必须不断地寻找更有竞争力的工具,保持企业的正常收益。应用PDF技术的核心问题是作
业输出的快速、高效和少出错误。由于PostScript只是一种页面描述语言,因而想通过
PostScript文件来提高为客户服务的附加值相当困难。PDF文件则与PostScdpt文件不同,
它提供给输出中心的机会比起PostScriPt文件来要多得多,比如易于调整、可重复使用,对
文件内容的管理也方便得多。 PDF文件从本质上来说更适合于输出中心,不仅可以为印刷
公司提供综合性的文件,也可以为其他输出目标提供文件。
五,商业印刷公司
某些商业印刷公司已经以多种方式应用PDF技术,包括软打样、控制作业流程、作业
存档和远程打样等。有不少印刷公司正在探索利用PDF技术来提高工作流程的效率,因为
长期以来工作流程一直是令印刷公司头疼的问题之一。商业印刷公司现在正演变为“边缘”
服务商,为此要求文件的跨媒体使用。因此, PDF不仅可帮助商业印刷公司改善工作流程,
节省文件处理时间,它同时也提高了公司的服务档次,有更多的时间和精力参与到与其他
媒体的竞争中。
采用PDF技术作为工作流程基础的行业和部门越来越多,可以举出的例子也有许多,
在使用规模上较为著名的有下述三家:
(1)美联社以PDF技术为基础建立了广告传送网络,这是一个用来在网络上分发广告
的系统。在美国,每月通过该网络传送的广告接近100000个,这些全部采用PDF格式,用
于不同的传播媒体。
(2)洛杉矶时报以及其他出版商以PDF格式生产报纸的在线版本,由于无需使用胶片,
也不需要发行费用,生产成本的降低是必然的。
(3)与视频生产商合作的企业也在使用PDF技术,例如生产专业音频信号处理设备的
Rane Corporation公司通过PDF文档发布它的产品信息,而它的客户或潜在客户们则从网
络上下载这些信息
PDF技术细节及其未来
在PDF技术的使用上确实有不少问题常常为用户们提起,考虑到采用和接纳PDF技术
有时间的先后,因此对某些看来是基本问题的技术细节作一些解释还是必要的。
PDF的技术细节
一、PDF与PostScript的区别
由于PDF是相对较新的技术,它的出现要晚于PostScript,而PostScript却已经在人们
的头脑中扎根,因此对PDF文档格式产生误解是不奇怪的。那么, PDF到底是什么?它与
PostScript又有什么关系呢?简单地说, PostScript是一种页面描述语言,而PDF是一种文
档格式,这种格式是自我包含的,可以在文档建立和文档输出的整个流程中使用,它适用
于数字印刷、因特网传播、直接制版、输出胶片和记录到CD-ROM等。
PDF不是像QuarkXPress文件那样的设计格式,也不是成像格式(经过栅格化转换用于
输出的文件格式)。 PDF格式的主要特点是允许用户在输出前检查、交换和修改文档,它
的使用范围处于文档建立与输出的中间过程。使用者可以将PDF文件看成为PostScript文件
的面向对象版本,用来加强PostScript标准、发现和修改独立的图文对象以及减小文件体积。
采用PDF格式后可以更有效地处理和操作页面、结果更容易预测。与传统PostScript文件相
比, PDF文件的结构更规则。
二、PDF文件能否在工作流程中与TIFF文件共存
由于TIFF文件已经在数字印前作业中广泛使用,提出这样的问题是理所当然的。可以
肯定的是,只要PDF工作流程软件的开发者采取一定的措施,用TIFF格式描述的图像文件
就可以在工作流程中与PDF文件共存。不仅如此,设计合理的PDF工作流程软件还允许其
他文件与PDF文件共存,例如从分色片扫描得到的文件格式。因此,在选择PDF工作流程
软件时需要问一下,软件对文件格式的兼容性究竟如何。
三、PDF的主要优点
以前,当页面经过处理后或从生成它的软件脱离出来后,要预览页面内容几乎是不可
能的。但PDF文件却允许用户在任何计算机平台上观看和编辑页面,且实现上述功能的工
具软件Acrobat Reader是免费供应的。 PDF的这一特点对任何层次的文档使用者普遍适
用,比如设计稿审查、文档的合法复制等。 PDF是一种开放式的文件格式,其结构紧凑,
描述效率高。 PDF文件不仅与硬件和软件平台无关,与输出文档的设备无关,也具有页面
无关特性。因此, PDF格式为用户带来更多的灵活性和可*性,可以跨平台和跨媒体使用,
且文档信息可重复使用。
四、从经济角度看PDF技术
有人统计过,采用以PostScript为基础的工作流程时,在进入印前环节的文件中,平均
有10%左右的页面存在较大问题,为此需花费大量时间作输出前的处理工作。虽然“问题”
作业在整个作业中所占的比例不大,但它们在进一步处理前占用的时间却可能达到80%的
输出准备时间。 PDF称得上是一个“超级集装箱”,它通过将图像、字体等对象嵌入到文
档中可减少出错的概率,因而输出结果是可预测的。
五、关于PDF工作流程的色彩管理
解决这一问题的思路是:将色彩管理模块集成到PDF工作流程软件中,要求PDF工作
流程软件支持从CMYK到CMYK的工作模式,工作流程软件必须与ICC的颜色管理流程
兼容,且色彩管理模块的关键部件应该常驻在PDF工作流程的RIP中,例如Agfa公司开发
的Apogee软件就很好地做到了上述诸点。
六、关于PDF工作流程的控制参数设置
以Agfa公司的Apogee为例,图像代换和拼大版功能驻留在前端的PDF Pilot模块中,
而分色和补漏白功能则常驻在后端的PDF RIP中,用户通过作业传票来控制上述功能。例
如,如果进入工作流程的文件已经由其他软件做了补漏白处理,则可以关闭RIP模块的补
漏白功能,对拼大版的处理方法原则上是一样的。
七、PDF的使用难度
有人认为,使用PDF技术或以PDF为基础的工作流程需要专家级的专门人才,其实这
是对PDF技术的误解。通常,如果用户对以PostScript为基础的工作流程已经熟悉,则转移
到以PDF为基础的工作流程不至于有太多的困难。有专家级的人才指导PDF工作流程的使
用固然最好,但经过一定的训练后,普通员工同样可以使用PDF工作流程,只是需要时间
熟悉PDF的技术特点。
八、关于PDF文件的生成
用来生成PDF文件的通用工具有PDFWriter和Distiller两种,但也可以采用其他软件
生成,例如Agfa公司Apogee软件内置的PDF Pilot模块。通常, PDFWriter只能用于生成
在屏幕上观看的PDF文件;对于打算在高端印前或印刷环境中使用的PDF文件应该利用
Distiller软件生成,特点是可*性高;如果采用Apogee的PDF Pilot模块来生成PDF文件,
则从功能上说要超过通用PDF文件生成软件,适合于需要执行附加输出准备的场合。
九、关于彩色文件的“黑箱”转换
在配置一个完整的PDF工作流程时,用户可以建立一个只有通过和失败两种形式的工
作流程,或建立对文件失效有相当程度宽容性的工作流程(但对流程的控制参数必须严格
选择)。通过这一途径,用户就能生成完全可*的PDF文件,一个可以用彩色电子出版系
统文件结构表示的CMYK页面就能用PDF可*地表示,在处理过程中无需额外的调整操
作。
十、关于如何确认进入工作流程的PDF文件是正确的
PDF文件在进入工作流程前同样需要检查,这种检查通常被称为预飞检查。用来检查
PDF文件正确性的工具有不少,有的是独立的预飞检查软件,有的则作为数字工作流程软
件的一个组成部分。例如Extensis公司的Preflight Pro是一个专用预飞检查软件,利用这一
软件可以对进入工作流程的文件进行检查,包括需要转换为PDF的那些文件。此外,检查
文件正确性的软件还能解决文件中存在的问题。
十一、PDF与设计软件
随着PDF技术的日益普及,我们有理由相信,印刷工业将很快能看到PDF设计软件,
这种软件将采用PDF作为其基础文件结构。在近期内,比较现实的期望是设计软件提供类
似于“Save As PDF”这样的命令,且可以在设计软件中打开和修改PDF文件。
十二、PDF的出错概率
在以PostScript为基础的工作流程中,出错概率相当高, PDF技术是否存在同样的问题
呢?用户必须记住,设计PDF格式的初衷就是为了建立更可*的文件结构,它是通过减少
产生错误的根源来降低出错概率的。在设计PDF格式时就考虑到了帮助用户如何准确地建
立完整的PDF文件。例如,采用Distiller软件将PostScript文件转换为PDF文件时,该软
件首先要对被转换文件检查,若文件通不过检查,转换过程自动终止。用过Distiller的用户
一定记得, Distiller在完成对PostScript文件的检查后会报告检查结果,指出存在的
PostScript错误以及问题出现的原因。
十三, PostScript RIP、 PDF RIP与专用RIP间的关系
PostScript是一种页面描述语言,必须通过解释并栅格化后,才能显示或输出为视觉可
见的页面。可见, PostScript RIP是用来执行文件解释和栅格化的工具。PDF文件在生成时
已经由Distiller解释过,即PDF是一种预先解释的文件,输出时的处理要求自然与PostScript
文件不一样。因此,PDF RIP是用于处理PDF文件的工具,但不解释PDF文件。专用RIP
是将数字文件栅格化处理到适用于某种中间介质,它用来处理专用文件格式并将文件内容 ·
记录到能接受专用格式的特殊设备上。可见,专用RIP适用于特定的文件格式和特定的输
出设备。
十四、作业传票与PDF技术
可以认为, PDF文件将所有内容描述在页面上,采用了可直接输出(印刷)的描述方
法。作业传票则包含了如何处理页面的全部设置和控制参数,它用来控制页面输出到目标
设备。作业传票可以包含作业历史、购买时的产品编号、合同信息和其他有关信息。简单
地说, PDF是描述页面内容的,作业传票则包含了与作业有关的控制信息和使用信息。因
此, PDF提供页面内容,而作业传票则用来实现PDF技术。

PDF 与 PS页面描述语言与PDF文件解析(转)相关推荐

  1. pdf导入ps颜色太浅_PDF 文件编辑转换难?或许你需要一个扫描全能王!

    手机上存了各种资料,想把所有 PDF 文件统一存储.管理? 手机打开 PDF 文件时,阅读难?批注难?分享难? 想编辑/调整 PDF 页面,装了一堆杂七杂八的 APP 效果仍然不理想? PDF,素来以 ...

  2. Python3将xml文件解析为Python对象

    一.说明 从最开始写javascript开始,我就很烦感使用getElementById()等函数来获取节点的方法,获取了一个节点要访问其子孙节点要么child半天要么就再来一个getElementB ...

  3. pdf导入ps颜色太浅_分享五个免费的pdf转换器,你更想选择哪一款?

    PDF转换器大家应该已经见过不少了,不知道大家是否知道不同转换器转换PDF文件的结果对比呢?首先我们找到了几款免费转PDF工具来看看各方的优点和缺点,这样大家选择起来就一目了然了,也可以避开一些录屏工 ...

  4. java设置pdf不可编辑_Java动态生成pdf文件(使用itext编辑pdf)

    一.创建pdf模板 使用PDFelement制作pdf模板(数据域的名称对应后面插入的key) 二.导入maven依赖 com.itextpdf itextpdf 5.5.13 com.itextpd ...

  5. java根据pdf模板生成指定格式的pdf文件

    java根据pdf模板生成指定格式的pdf文件 一.工具准备 事先得准备好Adobe Acrobat DC,这是一款专门编辑pdf的工具,小编已经给大家准备好了. 链接:https://pan.bai ...

  6. springboot整合pdf.js实现在线预览pdf文件

    今天在项目中实现pdf在线预览的功能的如图, 通过百度,查询合适的方法,最为简单的的是通过pdf.js的插件在前台展示.本以为是挺容易实现的,但都有莫名其妙的错误. 第一步:下载源码https://g ...

  7. PDF转word并去除水印以及处理的页数限制【pdf转word可编辑 百分百还原文件 亲测可用】

    提示:操作aspose-pdf-22.10-jdk16.jar 对其重编译修改校验权限 使用javassist 重编译(学习测试使用,aspose所有的包都可以用该教程.亲自测试过的) 文章目录 前言 ...

  8. pdf转图片 java_有将pdf文件转图片的格式方法吗?

    有时候我们为了方便传输,需要把图片转为PDF的格式,因为它所占的空间相对要小.但是因为pdf文件的安全性很好所以不能进行编辑,那我们又要进行编辑图片的时候,就又会把PDF文件格式转换成图片来进行编辑. ...

  9. mfc中怎么集成文件_怎么把几个pdf合并并打印在一份文件中?

    a为什么我们要把pdf文件合并呢?当然我们要知道什么是pdf文件才能进行更多的操作,Pdf是我们许多人都会用到的一种存储文件的格式,它的内容基本是以图像的形式表现,所以我们在播放和打印的时候可以不用担 ...

最新文章

  1. 在apache中使用 memcache 来作 session 存储
  2. 一些蛮好的题目,学习
  3. Asp.Net 之 抓取网页内容
  4. 安卓完全退出程序的六种方法(欢迎新手学习,大手指导)
  5. Java里optionsMenu.add_NoActionBar主题下如何添加OptionsMenu
  6. Android中关于cpu/cpuset/schedtune的应用
  7. python public_【速记速学】Python类的定义,属性,方法,访问性
  8. Java黑皮书课后题第3章:3.14(游戏:猜硬币的正反面)编写程序,让用户猜一猜是硬币的正面还是反面。随即产生一个整数0或1,分别表示
  9. android ViewPager动画的实现原理及效果
  10. SAP Fiori Elements里的SAP自定义注解annotation sap-text
  11. Web框架——Flask系列之abort函数与自定义异常处理(十三)
  12. 190123每日一句
  13. IEC 60335-1家用电器的安全标准及安规寿命检测设备
  14. C盘全面清理教程!彻底清理所有垃圾!
  15. java 评论功能_博客项目实现文章评论功能(重点是评论回复)
  16. c语言中常用英语词汇,C语言常见英语词汇
  17. 怎么记账,记录日常收支
  18. 我准备报名上海芭蕾舞学校了
  19. 对创建的screen会话进行恢复时出现:There is no screen to be resumed matching XXX 解决办法
  20. 实现图的邻接矩阵和邻接表存储

热门文章

  1. C# 计算两条线段交点的位置
  2. css动画效果 transform transition @keyframes animation 涉及jquery
  3. Android的BLE广播数据包介绍和解析---BLE--Android系列, 蓝牙技术BLE
  4. 【问题处理】Error response from daemon: Pool overlaps with other one on this address space
  5. C++ 共享指针四宗罪
  6. 十大高薪热门职业健康观察报告出炉!程序员求生欲最强
  7. Win10截图工具失效怎么办?这个方法帮你轻松修复
  8. 世界各大操作系统发展史
  9. 硬盘安装FB{ZT}
  10. Android Freetype的学习过程总结