第九章 文件和内容管理

一、引言

文件和内容管理是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理。它的重点在于保持文件和其他非结构化或半结构化信息的完整性,并使这些信息能够被访问。

1.1 业务驱动因素

文件和内容管理的主要业务驱动因素包括法律遵行性要求、诉讼响应能力和电子取证请求能力以及业务连续性要求。

  • 法律法规要求组织保留某些活动的档案
  • 电子取证是查找可能作为法律诉讼证据的电子档案的过程
  • 组织应对电子取证请求的能力取决于其主动管理电子邮件、聊天、网站、电子文件等档案以及原始应用程序数据和元数据的水平。

1.2 目标和原则

目标:

  • 确保能够高速有效地采集和使用非结构化的数据和信息
  • 确保结构化和非结构化数据之间的整合能力
  • 遵守法律义务并达到客户预期

指导原则:

  • 组织中的每个人都应该在保护组织的未来方面发挥作用
  • 档案和内容处理方面的专家应允许参与制度和规划的制定

ARMA国际档案保存指导原则:

  • 问责原则:组织应指派适当的高级管理人员,采用制度和流程来指导员工,并确保计划的可审计性
  • 完整原则:建立信息治理规划,使组织创建或管理的档案盒信息具有合理性以及适当的真实性和可靠性保证。
  • 保护原则:建立信息治理规划,确保对个人信息或其他需要保护的信息提供合理的保护。
  • 遵从原则:建立信息治理规划,尊熊适用的法律法规和其他有约束力的机构及组织的制度要求。
  • 可用原则:组织应确保以及时、高效和准确检索其信息的原则来维护其信息
  • 保留原则:组织的信息应保留适当的时间,并考虑所有运营、法律、监督和财政以及其他所有相关约束的要求
  • 处置原则:组织应根据其制度、适用的法律法规以及其他有约束力的机构要求,提供安全和适当的信息处置
  • 透明原则:组织应以工作人员和利益相关方可以理解的方式记录其制度、流程和活动,包括其信息治理规划。

1.3 基本概念

1.3.1 内容

内容是指文件、档案或网站内的数据和信息。内容通常基于文件所代表的的概念以及文件的类型或状态来管理。

(1)内容管理

内容管理包括用于组织、分类和构造信息资源的流程、方法和技术,以便以多种方式存储、发布和重复使用这些资源。内容的生命周期可以是动态的,通过受控的创建和修改流程进行日志更改;它们也可以是静态的,只发生很少或偶尔的更改。

(2)内容元数据

非结构化数据内容的元数据基于:

  • 格式:通常数据格式决定了访问数据的方法
  • 可搜索性:是否已经具备用于搜索相关非结构化数据的工具
  • 自我描述性:元数据是否有自我描述能力
  • 既有模式:是否可以采用或适配现有方法和模式
  • 内容主题:人们可能在寻找的东西
  • 需求:需要进行彻底和详细的检索能力

(3)内容建模

内容建模是将逻辑概念转换为具有关系的内容类型、属性和数据类型的过程。内容建模有两个层次。第一个是信息产品级别,它会产生一个像网站一样的实际可交付成果;第二个是组件级别,它进一步详细说明了构成信息产品模型的元素。

(4)内容分发方法

内容分发系统可分为如下三种:

  • 推式:在推式系统中,用户按照预先确定的时间表选择传送给他们的内容类型。发布方创建内容并在多个地方将其发布。
  • 拉式:在拉式系统中,用于通过互联网获取内容
  • 交互式:需要在企业应用之间交换大量的实时数据。

1.3.2 受控词表

受控词表是被明确允许用于通过浏览和搜索对内容进行索引、分类、标引、排序和检索术语的定义列表。在理想情况下,受控词表应与企业概念数据模型中的实体名称和定义保持一致。自下而上的方法是收集术语和概念并把它们汇编到一个大众分类中。

(1)词汇表管理

词汇表管理是针对任何给定的儿词汇进行定义、寻源、导入和维护的过程。实现词汇表管理的关键问题集中在用途、消费者、标准和维护4个方面。

(2)词汇表视图和微控制词汇表

  • 词汇表视图:是受控词表的子集,涵盖了受控词表领域内有限范围的主题。词汇表视图通过只展示适合用户的内容来增加信息的可用性。手动构建所需术语的词汇表视图,或通过作用于所需词汇表术语的数据或元数据的业务规则来构建词汇表视图
  • 微控制词汇表:是包含一般词汇表中不包含的而高度专业化术语的额词汇表。目标是采用标准的词汇表,通过微控制词汇表作为必要额补充,其缺少的内容需要专业的信息使用者进行田间/扩展。

(3)术语和选择列表

术语列表仅仅就是一个列表,它们不会描述术语之间的关系。选择列表通常隐藏在应用程序中。

(4)术语管理

术语管理包括在受控词汇表中建立术语之间的关系,关系分为以下三种:

  • 等价术语关系:这种关系同事使用多个术语而不是进行交叉引用术语
  • 层次化关系:它描述广义到狭义的真题-部分的关系
  • 关联关系:与受控词表中的另一个术语相关联,但这种关联不是层次化的

(5)同义词环和规范表

  • 同义词环是指一组含义大致相同的术语。同义词环允许搜索其中一个术语用户去访问与该词环其他术语相关的内容。
  • 规范表是描述性术语的受控词汇表,旨在促进特定领域或范围内的信息检索。

(6)分类法

分类法是指任何分类或数控词表的总称。在内容管理中,分类法是一种命名结构,包含用于概述主题、启用导航和搜索系统的受控词表。分类法可有多种不同结构:

  • 扁平分类法:在受控类别集之间没有关系,所有类别都是平等的。类似于列表。
  • 层次分类法:它是一种树结构,其中节点通过规划则相互关联。层析结构至少具有两个级别并且是双向的。向上移动层级会扩展类别;向下移动会细化类别。
  • 多重层级结构:它是具有多个节点关系规则的树状结构。子节点可能有多个父节点,父节点也可共用一个祖父节点。
  • 面分类法:它指的是每个节点与中心节点相关联,其形状看起来像星形图。每个面是中心对象的一个属性。
  • 网站分类法:既可用于层级结构,也可用于刻面结构。网状分类中的任何两个节点都基于它们的关联来建立连接。

(7)分类方法和打标签

分类方案是代表受控词表的代码。这些方案通常是分层的,可能有与之相关的词汇。大众分类法是通过社交标签对在线内容术语和名称分类的方案。个人用户和团体使用它们来注释和分类数字内容。它们通常没有层次结构或优选术语。大众分类法通常被认为不具有权威性,通常也不用于文件索引。

(8)主题词表

主题词表是一种用于内容检索的受控词表。它结合了同义词列表和分类方案的特征。主题词表提供相关的每个术语及其与其他术语的关系信息。关系要么是层次关系,要么是关联关系或等价关系。主题词表可用于梳理非结构化的内容,揭示来自不同介质的内容之间的关系,改进网站导航并优化搜索。

(9)本体

本体是一种分类法,它代表一套概念和它们在某个领域内概念之间的关联。本体描述类、个体、属性、关系和事件。

1.3.3 文档和档案

文件是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等电子或纸质对象。文件可用于交流并分享信息和知识。档案可用于证明所做的决策和所采取的的行动是符合程序的;可作为组织业务活动和法规遵从的证据。档案通常是由人来创建的,但仪器和监控设备也可以提供数据来自动生成档案。

(1)文件管理

文件管理包括在文件和档案的整个生命周期中控制和组织它们的流程、方法和技术。它包括电子和纸质文件的存储、编目和控制。管理文件和档案的生命周期包括:

  • 编目:识别已有的和新建的文件/档案
  • 制度:文件/档案制度的创建、批准和实施,包括文件/档案的保管制度
  • 分类:文件/档案的分类
  • 存储:纸质和电子文件/档案的短期和长期存储
  • 检索和流转:检索和流转,在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通
  • 保存和处置:在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁。

(2)档案管理

档案管理是文件管理的一部分,管理档案有一些特殊的要求。档案管理包括整个档案的生命周期:从档案的创建和接收到处理、分发、组织和检索,再到处置。档案可以是物理的、电子的,也可以是网站上的内容及各种介质和硬件上的文件,还可以是各种数据库中采集的数据,甚至是混合档案,如光圈卡是把各种格式组合在一起。精心管理的档案具有以下特点:

  • 内容:内容必须准确、完整和真实
  • 背景:关于档案的创建者、创建日期或与其他档案关系的描述性信息应该在创建档案时收集、组织并维护
  • 及时性:档案应该在事件、行为或决定发生后立即创建
  • 永久性:一旦成为档案,则在档案的法定保存期内不能改变其内容
  • 结构:档案内容的外观和排版需要清洗,他们应被记录在正确的表格或模板上。

(3)数字资产管理

它专注于存储、跟踪和使用视频、微标、照片等富媒体文件。

1.3.4 数据地图

数据地图是素有ESI数据源、应用程序和IT环境的清单,其中包括应用程序所有者、保管人、相关地理位置和数据类型等信息。

1.3.5 电子取证

EDRM是电子取证标准和指南的组织。该框架提供了一种电子取证方法,对于涉及确定相关内部数据的存储方式和位置、适用什么保留策略、哪些数据不可访问以及哪些工具可用于协助识别流程的人员来说,这种方法非常方便。

  • 辨认阶段:有两个子阶段。早期案例评估(主要评估法律案件本身的相关信息,称之为描述性信息或元数据)和早期数据评估(域案件相关的数据类型和位置会被评估)。
  • 保全和收集阶段:保全可确保那些已经被认为是可能相关的数据被置于合法保留状态,以避免被销毁;收集包括以合法的方式从公司获取和转移已辨认的数据并提供给法律顾问。
  • 处理、审查、分析阶段:处理阶段,经过去重、搜索和分析数据,来确定哪些数据项将会进入到审查阶段;在审查阶段,确定提交文件以响应请求,还确定了将被扣留的特权文件;内容分析目的是了解诉讼或调查中的情况、事实和潜在证据,以制定应对法律清醒的策略。
  • 生产阶段:根据商定的规范将数据和信息交给对方律师
  • 演示阶段:在证词、听证会和审批中展示ESI是演示阶段的一部分,ESI展品可用纸质、近纸质、近本地和本地的格式展示,以支持或反驳案例中的要素。

1.3.6 信息架构

信息架构是为信息体或内容创建的结构,它包括以下组件:

  • 受控词表
  • 分类法和本体
  • 元数据映射
  • 搜索功能规格
  • 用例
  • 用户流

1.3.7 搜索引擎

搜索引擎是一种根据术语搜索信息并检索内容中包含这些术语网站的软件。搜索功能需要几个组件:适当的搜索引擎软件、漫游网络的爬虫、将找到内容的统一资源定位符保留起来的存储、索引遇到的关键字和文本以及排名规则等。

1.3.8 语义模型

语义建模是一种知识建模,描述一系列概念网络以及它们之间的关系。语义模型允许用户能够以非技术的方式提出信息问题。语义模型包含语义对象和语义约束。语义对象是模型中标示的事物,他们可以具有基数和域的属性以及标识符。语义约束标示UML中的关联或关联类模型,这些模型有助于识别模式和趋势,并发现可能看起来不相干的信息之间的关系。

1.3.9 语义搜索

予以搜索侧重于语义和语境而非预先定义的关键字。语义搜索引擎可使用人工智能基于单词及其语境来识别查询匹配。语义搜索要求包括弄清楚用户想要什么,也就是需要像用户一样思考。语义优化的网络内容包含自然关键词,而不是依赖于严格的关键字插入。

1.3.10 非结构化数据

非结构化数据有多重电子格式:文字处理文件、电子邮件、社交媒体、聊天室、平面文件、电子表格、XML文件、事务性消息、报告、图形、数字图像、缩微胶片、视频和音频。纸质文件中也含有大量非结构化数据。数据管理的基本原则既适用于结构化数据也适用于非结构化数据。存储、完整性、安全性、内容质量、访问和有效使用对非结构化数据的管理都具有指导作用。非结构化数据需要数据治理、体系架构、安全元数据和数据质量。

1.3.11 工作流

工作流组件可包括创建、处理、路由、规则、管理、安全性、电子签名、截止日期、升级、报告和交付等过程。工作流程需要具有可重复执行的能力,在理想情况下包含对各种内容通用的流程步骤。

二、活动

2.1 规划生命周期的管理

文件管理实践涉及文件生命周期的规划-从文件的创建或接收文件后的分发、存储、检索、归档和潜在的销毁。规划包括开发分类/索引系统和分类法,以实现文件的存储和检索。

2.1.1 规划档案管理

在管理电子档案时需要决定现行的常用档案存储以及如何存储老旧的档案。档案管理的方法应将纸质档案、非结构化数据以及结构化电子档案全部考虑在内。

2.1.2 制定内容策略

内如管理计划应直接支持组织以有效和全面的方式提供相关和有用的内容。计划中应考虑内容的驱动因素、内容创建和交付等。对内容策略应对当前状态的审视和差距评估开始,该策略定义了如何对内容进行优先级排序、组织和访问。

2.2 创建内容处理制度

大多数文件管理制度都包括以下相关的内容:

  • 审计的范围和合规性
  • 重要档案的鉴定和保护
  • 保留档案的目的和保管期限表
  • 如何响应信息保留命令,即针对已过保留期的诉讼信息要求
  • 本地和异地存储档案的要求
  • 硬盘驱动器和共享网络驱动器的使用和维护
  • 对电子邮件管理,从内容管理的角度进行处理
  • 合理的档案销毁方法,如预先批准的供应商和销毁证明的收据

2.2.1 社交媒体制度

除了这些常规的话题外,许多组织正在制定应对新媒体的制度。

2.2.2 设备访问制度

因为用户驱动IT的场景,如BYOD、BYOA和WYOD是大势所趋,内容和档案管理功能需要兼容这些情景,以确保合规性、安全性和隐私要求。制度应区分非正式内容和正式内容,以便对正式内容进行控制,为非正式内容提供指导。

2.2.3 处理敏感数据

数据安全或数据治理通常会建立保密方案,并确定哪些资产是机密的或受限制的。必须根据制度和法律要求将文件,网页和其他内容组件标记为是否敏感。一旦被标记为敏感,机密数据集要么被屏蔽,要么在适当情况下被删除。

2.2.4 应对诉讼

应该创建和管理它们的数据源清单以及每个数据源相关的风险。通过识别可能具有相关信息的数据源,可以及时响应诉讼保留通知并防止数据丢失。应采用适当的技术来使电子取证流程自动化。

2.3 定义内容信息架构

用户必须以系统检索机制能够理解的形式提交他们的需求,以便从这些系统中获取信息。同样,需要一种检索机制,以支持快速匹配的数据和信息格式描述/索引文件、结构化和非结构化数据的目录。

2.4 实施的生命周期管理

2.4.1 获取档案盒内容

获取内容是管理内容的第一步。电子内容通常已经以某种格式存储在电子存储库中。为了降低丢失或损坏档案的风险,需要扫描纸质内容,然后上传到系统中,编入索引并存储在存储库中,尽可能使用电子签名。

采集内容后,应使用适当的元数据对其进行标记索引,元数据对于索引信息以及理解内容的背景是必需的。自动化的工作流程和识别技术有助于采集和摄取的过程以及提供审计跟踪。

2.4.2 管理版本的控制

ANSI 859标准基于数据的重要性以及数据损坏或不可用时可能造成的损害,将数据控制分为3个等级:

  • 正式控制:需要正式的变更启动、对影响的全面评估、变更管理机构的决策以及给利益相关方一份全面执行和验证的状态报告。
  • 修订控制:没那么正式,在需要变更时通知利益相关方并升级版本
  • 托管控制:最不正式,进需要阿全存储和一套检索方法

ANSI859标准建议在决定数据资产的控制级别时,应将下面的标准考虑在内:

  • 提供和更新资产的成本
  • 项目影响
  • 企业或项目变更的其他后果
  • 需要重新使用资产或资产的早期版本
  • 维护变更历史

2.4.3 备份和恢复

文件/档案管理系统需要包含在组织的整体企业备份和恢复活动中,包括业务连续性和灾难恢复计划。必须确定哪些是重要档案,并制定和维护其保护和恢复计划。灾难可能包括停电、人为错误、网络和硬件故障、软件故障、恶意攻击以及自然灾害。业务连续性计划包含书面制度、程序和信息,旨在缓解对组织数据威胁的影响。在发生灾难时,尽快回复这些数据,同时尽量减少中断。

2.4.4 管理保管和处置

保管和处置制度规定用于运营、法律、财政或历史价值的文件时间范围,规定何时可以将不常用的文件转移到二级存储设施,如异地存储。浙西而制度明确了合规性流程以及处理文件的方法和期限表。

文件保管要体现软件方面的注意事项。访问电子档案可能需要特定版本的软件和操作系统。像安装新软件这样简单的技术变更,它可能会导致文件无法被阅读或无法被访问。无附件值得信息应该从组织的资产中移除并处理掉,以避免浪费实体和电子空间以及其维护相关的成本。超过法定时限保留档案也是存在风险的额,在诉讼时仍能发现这些信息。

2.4.5 审计文件/档案

要求定期审计文件和档案管理,以确保正确的信息在正确的时间送达正确的人员,以便做出决定或进行操作活动。审计通常包括以下步骤:

  • 定义组织驱动因素,并确定“为什么”要进行文件/记录管理的利益相关方
  • 一旦确定了检查/测量的内容和要使用的工具,就开始收集相关数据
  • 报告结果
  • 制定下一步的行动计划和时间表。

2.5 发布和分发内容

2.5.1 开放访问、搜索和检索

一旦通过元数据/关键字标记会内容进行描述,并在适当的信息内容体系结构中进行了分类,就可以对其进行检索和使用。

2.5.2 通过可接受的渠道分发

许多组织扔在使用MS Word软件创建内容并将其迁移到HTML中,或者分发到规定的平台、特定的屏幕分辨率和既定大小的屏幕上。如果用户希望有另一种分发渠道,则必须为这个渠道量身定做该内容。

三、工具

3.1 企业内容管理系统

企业内容管理系统由一套包含核心组件的平台或一组应用程序组成,这些应用可全部整合在一起,也可分开使用。通过多种工具分发报表,包括打印机、电子邮件、网站、门户网站和短信以及文件管理系统的接口。根据不同的工具,用户可以按需搜索、查看、下载、签入签出及打印报表。添加、更改或删除文件夹中报表的功能有助于报表管理。对报表的保管可以设置为自动清除或归档到其他介质中,如磁盘、CD-ROM、COLD等。报表也可被保管在云存储中。

3.1.1 文件管理

文件管理系统是用于跟踪和存储电子文件和纸质文件的电子影像的应用程序。文件库系统、电子邮件系统和影像管理系统是专门的文件管理系统。文件管理系统通常具有存储、版本控制、安全性、元数据管理、内容所以不和检索功能。通常每个文件都会保持一些元数据,如创建者的名称以及文件创建、修改、存储的日期。可以使用唯一文件标识符或指定涉及文件标识符和预期元数据的部分索引条件,来对文件进行分类,以实现对文件的检索。

文件存储库具有管理文件的功能,包括签入签出、版本控制、协作、比较、归档、状态,从一个存储介质迁移到另一个存储介质以及处置等特性。文件管理系统由权限管理模块,管理员可以根据文件类型和用户凭据来管理访问权限。

(1)数据资产管理

许多文件管理系统会包含数据资产管理功能,如对音频、视频、音乐和数码照片之类数据资产的管理。其任务包括数据资产的编目、存储和检索等。

(2)图像处理系统

图像处理系统用于采集、转换和管理纸质件的影响和电子文件。采集使用的技术包括扫描、光识别和只能字符识别或表单处理。识别技术包含光学字符识别,它是将扫描的打印/手写文本以机械或电子转换的方式,将它们转换成可被计算机软件识别的形式。表单处理是通过扫描或识别技术采集打印出来的表单。除了文件影响之外,其他数字化影响,如数码照片、信息图、空间或非空间数据图像也可存储在存储库中。一些ECM系统能将各种类型的数字化文件和影响导入到集成的存储库中。矢量图像使用数学公式而不是单独的彩色块,非常适用来创建哪些经常需要调整大小的图形。

(3)档案管理系统

为遵从法规要求,档案管理系统可能要有自动保管和处置、电子取证支持和长期归档的能力。它应该支持重要的档案程序,以保留关键业务档案。

3.1.2 内容管理系统

内容管理系统用于收集、组织、索引和检索内容,将内容存储为组件或整个文件,同时保持组件之间的链接。CMS负责管理内容的整个生命周期,它可能包含界面友好的内容创建、工作流和变更管理以及用于处理内联网、互联网和外联网应用程序的部署功能。分发功能可能包含响应式涉及和自适应能力,以支持一系列的客户端设备。

3.1.3 内容和文件工作流

工作流工具支持业务流程、路由内容和文件、指派工作任务、跟踪状态以及创建审计跟踪。在内容发布之前,工作流应支持对内容的审核和批准。

3.2 协作工具

协作工具可用于收集、存储、工作流程和管理与团队活动相关的文件。

3.3 受控制词表和元数据工具

帮助开发或管理受控词汇表和元数据的工具,包括办公软件、元数据库和BI工具以及文件和内容管理系统。eg:

  • 在组织中被用作数据指南的数据模型
  • 文件管理系统和办公软件
  • 元数据库、术语表或目录
  • 分类法和分类法之间的交叉参考模式
  • 集合索引、文件系统、民意调查、档案、位置或异地控股
  • 搜索引擎
  • 非结构化数据的BI工具
  • 企业和部门同义词表
  • 已发布的报告库、内容和参考数据及其目录

3.4 标准标记和交换格式

计算机应用程序无法直接处理非结构化数据和内容。标准的标记和交换格式有助于在信息系统和互联网之间共享数据。

3.4.1 可扩展标示语言(XML)

XML提供了一种表示结构化和非结构化数据和信息的语言,使用XML内容管理原因:

  • XML提供了将结构化数据整合到具有非结构化数据的关系型数据库中的功能。非结构化数据可存储在关系型数据库管理系统的BLOB或XML文件中。
  • XML可将结构化数据与文件、报表、电子邮件、图像、图形、音频和视频文件中的非结构化数据集成在一起
  • XML哈可以用于建立企业或公司门户网站,为用户提供了一份可连接到各个内容的接入点
  • XML可识别和标记非结构化数据/内容,以便计算机应用程序可理解并处理它们。

3.4.2 基于JavaScript语言的轻量级的数据交换格式(JSON)

JSON是一种开放的、轻量级的数据交换标准格式。JSON有两个结构:一是无序“名称/值”对的集合,也被成为对象;二是值得有序集合,也被成为数组。JSON正成为互联网、NoSQL数据库的首选格式。JSON用于在服务器和网络应用程序之间的传送数据。JSON是一种与XML相似但更紧凑的数据表示、传送和解释方法。

3.4.3 资源描述框架(RDF)和相关的万维网联盟(W3C)规范

RDF是用于描述各种网络资源信息的通用框架,是用于在Web上进行数据交换的标准模型。RDF资源保存在三元组中,该三元组是用SPOROL来存储和检索语义查询的数据库。RDF使用XML作为其编码语法,它将元数据视为数据。网络本体语言是RDF的词汇表扩展。用于在网络上发布和共享OWL文本,适用于那些需要由应用程序而不是由人类来处理文件中的情形。RDF具有促进数据合并的功能,即使底层模式不同,它也特别地支持模式随时间变化而演进,同时不需要更改所有的数据使用者。

3.4.4 Schema.org

使用语义标记来给内容打标签使语义搜索引擎更容易索引内容,并使用网络爬虫更容易将内容与搜索查询匹配。Schema.org提供了一组用于页面标记的共享词汇表或模式,以便主流的搜索引擎可以理解它们。它侧重于网页上的文字含义以及术语和关键词。Schema.org词汇表集合还可用于结构化数据的互操作。

3.5 电子取证技术

电子取证通常涉及审查大量文件。电子取证技术活提供了许多功能和技术,如早期案件评估、收集、辨认、保全、处理、光学字符识别、剔除、相似性分析和电子邮件线程分析。

四、方法

4.1 诉讼应诉手册

指引应明确电子取证的目标环境,并评估当前环境和目标环境之间是否存在差距;应记载电子取证活动生命周期的业务流程,明确电子取证团队的角色和职责;还可以使组织识别风险并主动预防可能导致诉讼的情况。指引手册汇编内容主要包括:

  • 给每个部门建立制度和过程清单
  • 为各主题起草制度,如诉讼保留、文件保管、归档和备份
  • 评估IT工具的能力,如电子取证索引、搜索和收集、数据隔离和保护工具以及非结构化ESI源/系统
  • 识别和分析相关的法律问题
  • 制定沟通和培训计划,根据预期对员工进行培训
  • 确定可以提前准备的材料,以便根据法律案例进行裁减
  • 在需要外部服务的情况下分析供应商服务
  • 制定如何处理通知的流程并保持指引手册的最新状态。

4.2  诉讼应诉数据映射

数据映射是一个信息系统的目录,描述了系统以及系统的用途、包含的信息、保留策略和其他特征。从目录中通常会识别档案系统、原应用系统、存档、灾难恢复副本或备份以及用于每个系统的介质。

五、实施指南

5.1 就绪评估/风险评估

ECM就绪评估的目的是确定内容管理需要改进的方面,以及组织对改变其流程以满足这些需求的适应程度。ECM关键评估因素包括对现有内容的审核和分类、合适的信息体系结构、内容生命周期的支持、适当元数据标签的定义以及在ECM解决方案中自定义功能的能力。

5.1.1 档案管理成熟度

5个等级分别是:

  • 1级,低于标准的:信息治理和档案保管问题没有得到解决或知识最低限度的解决。
  • 2级,发展中的:认识到信息治理和档案保管可能对组织产生的影响
  • 3级,基本的:必须满足法律法规的最低要求
  • 4级,积极的:已经建立了一个持续改进为重点的主动式信息治理计划
  • 5级,完成变革的:信息治理已经融入企业的基础架构和业务流程中。

5.1.2 电子取证评估

评估准备中检查并确定诉讼应诉计划的改进机会。成熟的规划将明确规定角色和职责、保存协议、数据收集方法和披露流程。规划和产生的流程硬背记录在案,要合乎情理并具备可审计性。规划中需要了解组织的信息生命周期,并未数据源开发ESI数据映射。

5.2 组织和文化变革

隐私、数据保护、机密性、知识产权、加密、道德使用和身份,这应是文件和内容管理专业人员与其他员工以及管理层和监督机构合作一起处理的重要问题。一个集中化的组织,通常会处理改善信息访问的流程,控制占用办公空间的物料增长,降低运营成本,保护重要信息,使诉讼风险最小化,并支持更好的决策。

六、文件和内容治理

6.1 信息治理架构

驱动因素包括:

  • 法律和法规遵从
  • 档案的合理处置
  • 对电子取证的前瞻性准备
  • 敏感信息的安全
  • 电子邮件和大数据等风险领域的管理

成功信息治理程序的原则包括:

  • 为问责制提供高层支持
  • 教育员工了解信息治理职责
  • 根据正确的档案代码或分类类目对信息进行分类
  • 确保信息的真实性和完整性
  • 确保官方档案时电子档案,除非另有规定
  • 制定制度,使药物系统和第三方与信息治理标准保持一致
  • 存储、管理、访问、监控和审核已批准的企业存储库以及档案盒内容系统
  • 保护机密和个人身份信息
  • 控制不必要的信息增长
  • 在信息的生命周期结束时对其进行处置
  • 遵守信息的请求
  • 持续改进

6.2 信息的激增

非结构化数据的增长速度远远快于结构化数据,非结构化数据不一定非要被归属到某个业务功能或部门,它的所有权很难确定、分类困难。

6.3 管理高质量的内容

文件和内容治理侧重于保留、电子签名、报告格式和报告分发相关的策略,定义高质量的内容需要了解它生产和使用的背景,如:

  • 生产者:谁创建内容?为什么要创建?
  • 消费者:谁使用信息?出于什么目的?
  • 时间:何时需要信息?需要多久更新或访问一次?
  • 格式:消费者是否需要特定格式的内容才能实现目标?是否有不可接受的格式?
  • 分发:信息将如何分发?消费者将如何获取信息?如何实施安全措施以防止对电子内容的不恰当访问?

6.4 度量指标

6.4.1 档案管理

衡量档案管理系统实施成功的标准如下:

  • 每个用户有百分之几的文件和电子邮件被认定为是公司的档案
  • 被认定为公司档案中的百分之几得到了控制
  • 在所有存储的档案中有百分之几的档案应用了适当的保管规则

然后将以上百分比进行比较,以确定出最佳实践的百分比值。

6.4.2 电子取证

电子取证常见的一个KPI指标是成本降低,另一个KPI指标是对比被动收集信息的方式,提前收集信息时提高的效率。

6.4.3 企业内容管理

应制定KPI来衡量企业内容管理的有形和无形效益。有形效益包括提高生产力、降低成本、提高信息质量和改善合规性;无形效益包括增进协作、简化工作程序和工作流。随着ECM的建立,KPI将侧重于规则和运营的指标。规划指标包括ECM项目数、采用率和用户满意度;运营指标包括一些典型的系统类型KPI,如停机时间、用户数量等。特定的ECM指标诸如存储利用率和检索性能也可以用作KPI。制定一些与业务解决方案的价值相关的KPI,eg:

  • 财务KPI可包含ECM系统的成本、与物理存储相关的成本降低以及运营成本下降的百分比;
  • 客户KPI可包含首次与客户联系时解决了他的问题比例和客户投诉的数量
  • 代表更有效和更高效的内部业务流程的KPI可以包含在使用工作流程和过程自动化后,文书工作减少的百分比以及错误减少的百分比
  • 培训KPI可包括管理和非管理培训课程的数量
  • 风险缓解KPI可以包括取证成本的降低以及追踪电子取证请求的审计跟踪数量。

DAMA数据管理知识体系指南-读书笔记9相关推荐

  1. DAMA数据管理知识体系指南-读书笔记3

    第三章 数据治理 一.引言 职能:指导所有其他数据管理领域的活动: 目的:确保数据管理制度和最佳实践正确地管理数据. 1.1 业务驱动因素 数据治理的驱动因素大多聚焦于减少风险或改进流程. (1)减少 ...

  2. DAMA数据管理知识体系指南-读书笔记15

    第15章 数据管理成熟度评估 一.引言 成熟度模型通过描述各阶段能力特点来定义成熟度的级别.当一个组织满足某阶段能力特征时,就可以评估其成熟度等级,并制定一个提高能力的计划.它还可以帮助组织在等级评估 ...

  3. DAMA数据管理知识体系指南-读书笔记6

    第六章 数据存储和操作 一.引言 定义:数据存储与操作包括对存储数据的设计.实施和支持,最大化实现数据资源的价值,贯穿于数据创建/获取到处置的整个生命周期. 2个活动: 数据库操作支持:主要关注与数据 ...

  4. DAMA数据管理知识体系指南-读书笔记13

    第13章 数据质量 一.引言 数据质量管理包括在整个生命周期制定标准,在数据创建.转换和存储过程中完善质量,以及根据标准度量数据来管理数据.数据质量管理不是一个项目,而是一项持续性工作.它包括项目和维 ...

  5. DAMA数据管理知识体系指南-读书笔记16

    第16章 数据管理组织与角色期望 一.了解现有的组织和文化规范 数据管理组织应与公司的组织层级结构和资源保持一致.找到合适的人员,需要了解数据管理在组织内部的功能和政治作用.目标应该是跨职能的不同业务 ...

  6. 《DAMA数据管理知识体系指南》读书笔记-第十二章(元数据管理)

    目录 一.前言 二.内容结构 三.主要内容 1.引言 2.活动 3.工具 4.方法 5.实施指南 6.元数据治理 四.思考与总结 一.前言 本文是<DAMA数据管理知识体系指南>第12章的 ...

  7. 【数仓】DAMA数据管理知识体系指南

    [数仓]DAMA数据管理知识体系指南 金融类公司非常爱问数据治理.数据质量.元数据管理等问题. 中金公司笔试也考了 DAMA 数据治理的内容. 金融公司的开发工作较少,更多的是管理类工作 今天分享一本 ...

  8. dama数据管理知识体系指南第二版pdf_DMBOK数据管理 - CDMP认证培训

    专业数据从业者的体系课程和权威认证 1. DAMA和CDMP介绍 DAMA International成立于1988年,是一个由技术和业务专业人员组成的全球领域的非营利的独立于厂商的数据管理专业协 会 ...

  9. DAMA数据管理知识体系指南之数据管理和数据治理

    全网最全大数据面试提升手册! 简介:DAMA:国际数据管理协会,是一个全球性数据管理和业务专业志愿人士组成的非营利协会,是当前国际上在数据治理领域最权威的机构.DMBOK2则是DAMA组织众多数据管理 ...

  10. dama数据管理知识体系指南_DAMA知识体系解读(6)数据操作管理

    数据操作管理是提供从数据获取到数据清理的全过程支持,关联图: 一.概念 数据操作管理是结构化数据的开发.维护和支持活动.包括两个职能:数据库支持和数据技术管理.数据管理员(DBA)在该活动中起着重要的 ...

最新文章

  1. (5.1.5)引擎管理——多服务器管理之中央管理服务器(CMS)
  2. 弱类型语言的优势:C#的委托概念在Javascript中的实现
  3. struts2 的国际化
  4. DM6467之视频采集(Linux)下MMAP
  5. oracle长连接超时设置
  6. 五位专家跟你讲讲为啥Python更适合做AI/机器学习
  7. 黑马程序员---java基础------------------基础中的基础学习
  8. android 手机型号 命名规则,自己整理:各大品牌安卓手机的型号命名规律
  9. 中孚计算机保密 卸载,智华计算机终端保密检查系统怎样卸载
  10. Material Components(MDC)简单使用介绍
  11. 竹子的精神高山流水,赞美竹子的句子,竹子散文
  12. 二手房房源信息数据分析项目完整流程
  13. 宝刀——《荒原的呼唤》选载之一
  14. CentOS7和CentOS8 FreeSWITCH 1.10.7 简单图形化界面18--内网的讯时FXO网关SIP对接到内网的FreeSWITCH
  15. jquery easyui下拉框多选 和原生多选下拉多选
  16. php删除二维数组元素_php怎样删除二维数组中的元素
  17. fluent———patch
  18. 中央民族大学 软件工程专业研究生停止招生!计算机改科目!
  19. Ajax基础知识 · 上
  20. matlab套利,期现套利-现货组合构建(1)-市值权重法

热门文章

  1. HBase学习总结(1):HBase的下载与安装
  2. Python实现股票数据接口
  3. python爬虫学习教程,短短25行代码批量下载豆瓣妹子图片
  4. Unity 日志管理系统
  5. 如何下载:卫星地图高清2018,谷歌地图高清卫星地图,最新Google卫星地图
  6. 面试经验---广州品高软件(java软件开发)
  7. Java面试:应聘Java开发工程师的基本要求是什么?
  8. 三对角矩阵行优先压缩存储---加法、减法、乘法、转置、秩、行列式值、伴随矩阵、逆
  9. 广州科二化龙考场_广州市机动车驾驶人化龙考场交通路线攻略
  10. mac os 录屏快捷键_录屏软件怎么录制电脑游戏?录制游戏视频须知