一、3.0版本与之前版本区别

  • 将知识实体重新定位为对象类别,以便在 PREMIS 中进行附加描述并链接到相关 PREMIS 实体。
  • 重新定位环境(即使用数字对象所需的硬件和软件),以便可以重复使用对象实体来描述和保存它们。
  • 物理对象添加到 PREMIS 的范围内,以便它们可以被描述并与数字对象相关。
  • 向对象实体添加一个新的语义单元:preservationLevelType (O, NR),以指示预期应用于给定保存级别的对象的保存函数的类型。
  • 向Agent 实体添加一个新的语义单元来表达软件代理的版本:agentVersion (O, NR)。
  • 向事件实体添加一个新的语义单元:eventDetailInformation (O, R)。
  • 主要新增内容将在下面详细讨论(参见“PREMIS 数据模型”和“环境”部分)。其他补充内容在字典的相关部分中进行了解释。

二、模型介绍

1.PREMIS数据模型

![在这里插入图片描述](https://img-blog.csdnimg.cn/d99eba2f40a64bcf9c7f39f7cdd2099a.gif)

  在图中,实体用方框表示;实体之间的关系用箭头表示。当箭头是双向的时,每个实体类型都包含一个语义单元,允许它链接到另一个。例如,Rights实体包括记录与Agent的关系信息的语义单元,Agent实体也同样包括记录关联Rights信息的语义单元。比如图中只有Object指向自己,表示只有对象实体可以与其他对象实体有关,而事件实体则不能与其他事件实体相关联。

  PREMIS数据模型中实体的定义如下:

  • 对象(或数字对象):受数字保存的信息的离散单元。在3.0版本中将可以作为保存过程中所需的“环境”概念作为对象的一部分。
  • 环境:以某种方式(例如渲染或执行)支持数字对象的技术(软件或硬件)。环境可以被描述为知识实体,并作为表示、文件和/或比特流被捕获并保存在保存库中。
  • 事件:涉及或影响至少一个与保存库相关联或已知的对象或代理的动作。
  • 代理:与对象生命周期中的事件相关联的个人、组织或软件程序/系统,或与对象相关联的权利。它还可以与充当代理的环境对象相关。
  • 权利声明:主张与对象和/或代理有关的一项或多项权利或许可。
      在数据字典中,每一个语义单元都可以映射到数据模型中的一个实体上,因此,语义单元可以被看作实体的属性。关系是实体实例之间关联的陈述,比如“对象A是格式B”可以看作A和B的关系,在PREMIS字典中将“格式B”看作“对象A”的属性。

关于对象

  对象实体有四个子类别:知识实体、表示、文件和比特流。
  知识实体是在数字保存的背景下,与指定社区有关的独特的知识或艺术创作,如特定的书籍、照片等。一个知识实体可以包括多个知识实体,比如一个网页中可以包含其他网站、图片等。
  表示是可以完整再现知识实体所需的一组文件,包括结构元数据等。比如一篇期刊被完整的呈现在一个pdf文件中,这个pdf文件就是一个表示。另外一篇期刊可能包含一个SGML文件和两个图片,那么着三个文件就构成一个表示。
  文件是由计算机操作系统已知的命名且有序的字节序列,文件的字节不限,并且具有文件格式、访问权限和文件系统特征等。
  比特流是文件中连续或非连续的数据。比特流可以转换为文件,但可能需要添加文件结构或者重新格式化比特流,来符合某些特定的文件格式。

  在3.0版本之前,知识实体被认为超过了PREMIS元数据的范围,因为许多类型的数据不一定需要作为保存元数据。在3.0版本中,可以选择在PREMIS内部或者外部对知识实体进行建模。举个例子,在PREMIS之外指定了知识实体,TIFF图像具有标识符“galapagos.6754.1”,使用结构“表示”关系链接到外部指定的知识实体,该关系的值是一个外部可操作的HTTP URI 标识符。存储库记录如下:
   premis:objectIdentifier
    premis:objectIdentifierType=“hdl”
    premis:objectIdentifierValue=“galapagos.6754.1”
   premis:objectCategory= representation
   premis:relationship
    premis:relationshipType=“structural”
    premis:relationshipSubType=“represents”
   premis:relatedObjectIdentifier
    premis:relatedObjectIdentifierType=“URI”
    premis:relatedObjectIdentifierValue="
    http://natureweb/col1.galapagos6754/default.html"
  这个例子表明,对于外部指定的智能实体,我们需要在知识实体级别来记录描述性元数据及保存信息,例如重要的属性、关系、权利和相关事件信息。
  第二个例子我们将知识实体在PREMIS中指定,TIFF图像表示具有标识符“galapagos.6754.1”,但这一次他的描述性元数据在一个知识实体实例中,知识实体的标识符是“col1.galapagos6754”,此外,知识实体有一个可操作的标识符 (HTTP URI),它链接到它的目录记录,还记录了将知识实体添加到数字馆藏时的事件 (E004)。存储库为表示、知识实体和相关事件创建单独的记录:
   premis:objectIdentifier
    premis:objectIdentifierType=“hdl”
    premis:objectIdentifierValue=“galapagos.6754.1”
   premis:objectCategory= representation
   premis:relationship (使用结构“表示”关系链接)
    premis:relationshipType=“structural”
    premis:relationshipSubTyp =“represents”
    premis:relatedObjectIdentifier (链接的知识实体对象标识符)
     premis:relatedObjectIdentifierType=“hdl”
     premis:relatedObjectIdentifierValue=“col1.galapagos6754”
   premis:objectIdentifier (另一个知识实体对象标识符)
    premis:objectIdentifierType=“hdl”
    premis:objectIdentifierValue=“col1.galapagos6754”
   premis:objectCategory= intellectual entity
   premis:objectIdentifier
    premis:objectIdentifierType=“URI”
    premis:objectIdentifierValue=
    “http://natureweb/col1.galapagos6754/default.html”
   premis:objectCategory= intellectual entity
   premis:linkingEventIdentifier (相关事件)
    premis:linkingEventIdentifierType=“Local Repository”
premis:linkingEventIdentifierValue=“E004”

  用一个较为完整的例子来说明,Animal Antics 一书于 1902 年出版,图书馆将 Animal Antics 数字化,为 189 页中的每一页创建一个 TIFF 文件。作为结构元数据,它创建了一个 XML 文件,展示了如何将图像组合成一本书。然后,该库对 TIFF 图像执行 OCR,最终创建一个在 SGML 中手动标记的大型文本文件。该图书馆向保存库提交了 189 个 TIFF 文件、一个 XML 文件和一个 SGML 文件。
  对于知识库来说,Animal Antics这本书就是一个知识实体,它是一个可以描述为一个整体的合理单元,具有作者、标题和出版日期等属性。 这本书有两种表示形式,一种由 189 个 TIFF 文件和一个 XML 文件组成,另一种由一个 SGML 文件组成。存储库将记录关于一个知识实体、两个表示对象和 191 个文件对象的元数据。

关于环境

  为了保存数字对象,存储库需要有关软件、硬件和其他依赖项的技术堆栈元素的信息,以正确解释表示、文件和比特流。这种技术堆栈的每个元素都是一个环境。
  从PREMIS3.0版开始,对象实体开始捕获与存储库内容相关的环境。与内容对象一样,环境可以在所有对象类别级别(知识实体、表示、文件、比特流)进行描述。知识实体用于记录环境的描述性信息,环境知识实体可以定义其功能与名称。

关于事件

  事件实体聚合有关操作的元数据。存储库会由于多种原因记录事件,如修改对象文档的操作对维护数据的来源十分重要,存储库就会记录该修改事件。将哪些事件进行存储取决于存储库,有一些琐碎操作可能不会被记录,或者被记录在其他存储系统中。
  在数据模型中,对象有两种方式与事件相关联,如果一个对象通过(由于)一个事件与第二个对象相关,则该事件标识符作为语义组件relatedEventIdentifier记录在关系容器中。如果对象仅具有与第二个对象无关的关联事件,则事件标识符被记录在容器链接事件标识符中。
  举个例子,假设保存存储库获取 XML 文件(对象 A)并通过运行程序(事件 1)创建它的规范化版本(对象 B)。在对象 B 的元数据中,可以按如下关系记录:
   relationshipType = “derivation”
   relationshipSubType = “has source”
   relatedObjectIdentifier
    relatedObjectIdentifierType = “local”
    relatedObjectIdentifierValue = “A”
   relatedEventIdentifier
    relatedEventIdentifierType = “local”
    relatedEventIdentifierValue = “1”
  假设在创建对象 B 之后,通过运行另一个程序(事件 2)对其进行验证。 在这种情况下,事件 2 仅与对象 B 相关,与 B 和 A 之间的关系无关。到事件 2 的链接将被记录为 linkingEventIdentifier:
   linkingEventIdentifierType = “local”
   linkingEventIdentifierValue = “2”
  给定对象可以通过这两种方式与任意数量的事件相关联。
  如果一个事件创建了存储在存储库中的对象,那么这些对象应该被描述为具有一套完整的适用元数据并通过链接与事件相关联的实体。除了结果或输出之外,可能会记录事件的一些其他方面,例如迁移事件期间使用的特定参数、操作的性质(自动、手动或半自动)等。此类信息可以记录在 eventDetail 中。

关于代理

  PREMIS中的代理相关部分定义了识别代理的方法和代理类型(个人、组织或软件)的分类。在3.0版本中,agentVersion 语义单元被添加到了数据字典里。数据模型图显示了代理与其他实体的关系。代理人可以与代理人有兴趣的权利声明相关。代理还可以与代理在其中采取行动的事件实体相关。每个事件可以有一个或多个相关代理。因为单个代理可以在不同的事件中扮演不同的角色,所以代理的角色是事件实体的属性,而不是代理实体的属性。
  代理以两种方式与对象相关:代理影响事件中涉及的对象;代理是通过环境对象描述的软件代理。在第一种情况下,代理仅通过事件间接影响对象,而不直接链接到对象。在第二种情况下,环境对象可以进一步描述和捕获软件代理。

关于权利

  在 PREMIS 数据字典第一版出版后,美国国会图书馆以 PREMIS 维护机构的身份委托 Karen Coyle 撰写了一篇题为“PREMIS 数据模型中的权利”的论文。该文章讨论了版权、许可和法规作为建立知识产权的三个基础,并建议扩展数据字典中的权利信息以包含这些基础的信息。
  因此,原始数据字典中的 permissionStatement 在 2.0 版本中替换为rightsStatement。在那次修订中,编辑委员会在很大程度上依赖于 Coyle 的论文、背景材料,例如 Peter Hirtle 的“数字保存和版权”和加州数字图书馆的版权 MD 模式草案。2.2 版在 rightsStatement 中添加了语义单元,以指定版权、许可或法规以外的权利基础(例如机构政策);能够通过文档标识符链接到有关权利的更多信息;将适用日期与权利声明相关联;除了现有的授予期限外,还允许限制期限。
  3.0版本不包含与权利声明相关的新增内容或更改。

三、数据字典的结构和使用的一般主题

  PREMIS 数据字典中定义的语义单元由一些有助于组织数据字典并支持其实现的结构约定绑定在一起。这些约定包括标识符的使用、数据字典中处理关系的方式、以及将元数据与对象相关的“1:1 原则”。

身份标识

  对象、事件、代理和权利声明的实例由在“标识符”容器下的一组语义单元唯一标识。无论实体类型如何,这些语义单元都遵循相同的语法和结构:
   [entity type]Identifier
   [entity type]IdentifierType: domain in which the identifier is unique
   [entity type]IdentifierValue: identifier string
  以下示例说明了如何使用此语法来识别驻留在哈佛数字存储库服务 (DRS) 中的对象,以及在 NRS(名称解析服务)的支持下发生的事件:
  Example 1: Identifying an Object
   ObjectIdentifier
    ObjectIdentifierType: NRS
    ObjectIdentifierValue: http://nrs.harvard.edu/urn-3:FHCL.Loeb:sa1
  Example 2: Identifying an Event
   EventIdentifier
    EventIdentifierType: NRS
    EventIdentifierValue: 716593
  在这两个示例中,标识符类型都是“NRS”,这表示标识符在为存储库服务分配标识符的名称解析服务的域内是唯一的。标识符类型应尽可能具体地定义,并提供足够的信息来指示相关的命名机构,以及如何构建标识符值。例如,在第一个示例中,允许对 objectIdentifierType 使用“URL”,因为标识符值在该域中是唯一的,但“NRS”传达了有关创建和使用标识符的域的更多信息。
  标识符对于对象和代理是可重复的;它们对于权利和事件是不可重复的。对象和代理通常在全局环境中具有多个身份,并且跨系统,因此很可能具有多个标识符。权利和事件被认为具有仅限于特定保存库的上下文,因此不需要多个标识符。

对象之间的关系

  存储库中的对象可以与存储库中的一个或多个其他对象相关。 PREMIS 数据字典提供语义单元来支持对象之间关系的文档。范围广泛的元数据事实都表示为关系——例如,“迁移自”、“键控文本”、“缩略图”。 在某些情况下,这些关系陈述结合了不止一个事实(例如,“is keyed text of”结合了“is a keyed text”和“is derived from”),许多现有的元数据框架也指定了关系类型。内容对象之间的大多数关系是两种基本类型的变体:结构关系和派生关系。 依赖关系主要用于帮助表达环境对象之间的关系。
结构关系显示对象各部分之间的关系。构成知识实体表示的文件之间的结构关系显然是必不可少的保存元数据。对于一个简单的数字对象(例如,一张照片),结构信息是最少的:因为单个文件构成了表示。其他数字对象,例如电子书和网站,可能具有相当复杂的结构关系。
  派生关系源于对象的复制或转换。结果对象的知识内容是相同的,但对象的实例化,可能还有它的格式是不同的。 当迁移格式为 X 的文件 A 以创建格式为 Y 的文件 B 时,A 和 B 之间存在派生关系。许多数字对象很复杂,结构和派生信息都可能因保存活动而随时间变化。 例如,由 400 个 TIFF 页图像表示的数字化书籍在迁移后可能会变成四个 PDF 文件,每个文件包含 100 页。
  在对象被存储库摄取之前,可以通过派生行为建立对象之间的结构关系。 例如,可以使用文字处理文档创建 PDF 和 XML 格式的衍生文件。 如果仅将 PDF 和 XML 文件提交到保存库,则这些对象是与源文字处理文件具有父子关系的同一知识实体的不同表示。 它们彼此之间没有派生关系,但确实具有兄弟姐妹(共同父母的孩子)的结构关系。
  没有一种方法可以对所有可能的结构或派生信息进行建模。必须捕获的基本信息在语义单元关系的语义组件中进行描述。

不同类型实体之间的关系

数据模型图使用箭头来显示不同类型实体之间的关系,如对象与事件相关,代理与事件相关等。

PREMIS元数据字典3.0阅读笔记(一)相关推荐

  1. [iOS开发]——系统框架(effectiveOC2.0阅读笔记)

    系统框架 第47条:熟悉系统框架 要点 第48条:多用块枚举,少用for循环 for循环 使用 Objective-C 1.0的 NSEnumerator 来遍历 快速遍历 基于块的遍历方式 要点 第 ...

  2. Solr入门之官方文档6.0阅读笔记系列(八) 相关过滤器

    第三部分 :   Understanding Analyzers, Tokenizers, and Filters Filter Descriptions You configure each fil ...

  3. JSF 2.0阅读笔记:视图状态 (四)

    五. 实例验证 下面使用GlassFish v3来测试JSF2.0 RI的ViewState情况. JSF2.0规范中提供了三个上下文参数来指定应用的ViewState策略,可在web.xml文件中使 ...

  4. 【Flink】Flink 源码阅读笔记(16)- Flink SQL 的元数据管理

    1.概述 转载:Flink 源码阅读笔记(16)- Flink SQL 的元数据管理 Flink 源码阅读笔记(17)- Flink SQL 中的时间属

  5. 【《RISC-V “V“ Vector Extension Version 1.0》阅读笔记】

    <RISC-V "V" Vector Extension Version 1.0>阅读笔记 RISC-V "V" Vector Extension ...

  6. Xilinx AXI USB2.0 Device IP 手册阅读笔记

    目录 1. 前言 2. 概要 2.1 USB2.0协议特点: 2.2 The AXI USB 2.0 Device介绍 2.2.1 Endpoint0: 2.2.2 Endpoint1~7: 3. 详 ...

  7. 《通信统一架构OPC UA实践》 - 阅读笔记 1 工业4.0基础与OPC UA的实践

    系列目录 - 阅读笔记 2 OPC UA信息模型及建模 目录 系列目录 第一章 OPC UA--工业4.0基础 1.1.通信协议 1.2.导入OPA UA的步骤 1.3. 趋势和展望 第二章 OPC ...

  8. JS高级程序设计——阅读笔记四

    JS高级程序设计--阅读笔记四 第六章 集合引用类型 6.1 Object 6.2 Array 6.2.1 创建数组 from()函数 6.2.2 数组空位 6.2.3 数组索引 6.2.4 检测数组 ...

  9. [python Cookbook]阅读笔记

    @toc] 前记:为了补充一下python语法知识,感谢网友的推荐阅读了pythonCookbook,这本书确实不错,以问题为导向,引导解决思路. 这个博文是从阅读笔记typora中直接复制过来的没有 ...

最新文章

  1. 报名 | 瓜子二手车周洲:如何玩转AI赋能下的新零售?
  2. import是引进外部函数吗_你必须要知道的Python中的main函数
  3. 创新实训团队记录:为BR-MTC问题设计一个近似算法
  4. ARM/THUMB汇编(补丁开发类)基础教程
  5. nm命令中符号类型详解
  6. 关于visual studio类视图和资源视图不显示类和资源的问题
  7. Sys.WebForms.PageRequestManagerTimeoutException:服务器请求超时
  8. Java Code Geeks Andygene Web原型
  9. 入门 | 机器学习中常用的损失函数你知多少?
  10. 设计模式的学习(9)外观模式
  11. 下载 / 安装 Visual Studio - C语言零基础入门教程
  12. 编程开发软件工具下载
  13. [华为19实习面试]语言能力优秀的我,是怎么拿下勇敢星实习offer的?华为硬件类面试经历经验分享(大三已拿offer)
  14. HTML静态网页作业——海贼王主题网页设计制作6个页面(HTML+CSS)
  15. Clang编译Objective-C
  16. flash播放器android,Flash播放器
  17. 【C/C++】简单的程序小游戏-推箱子代码
  18. java俄罗斯方块旋转_java俄罗斯方块旋转算法,求解
  19. npm cb() never called!和 Error: getaddrinfo ENOTFOUND registry.npmjs.com registry.npmjs.com:443
  20. win7更新_微软最新累积更新导致Win7及以上版本VB6/VBA/VBS运行异常

热门文章

  1. 内部稽核与内部控制管理体系关系的探讨
  2. 分享133个ASP源码,总有一款适合您
  3. 怎样让公司全员贡献结构化内容?
  4. Python科学计算库(Numpy)基础篇(IDE为Pycharm)- 数组数值计算
  5. 2023首届西安浐灞·保利戏剧节——以“觅”为主题 即将开启
  6. 佟年计算机大赛,佟年的人设是什么?
  7. 微信小程序软件测试junit,微信小程序兼容性能测试方法
  8. 110配线架打法图解_110配线架的打线方法图例
  9. Does setting the following sysctl settings require a system reboot?
  10. 工作日志(部门管理)