前言

数据生命周期 网上有许多版本,各行各业的、各类应用场景的;下面是个人认为比较好的两篇介绍,望匆喷,若有推荐请留言,不胜感激。

1.数据全生命周期管理模型

请参考原创:https://www.zhihu.com/question/393978073

特点是包含10多种数据生命周期模型,涉及多个行业或研究主题方向,以下给出其中一版 — 一般科学模型。

一般科学模型

通用科学模型由科学机构提供,用于管理科学数字数据。此模型可用于管理用于存档或处理数据的数据收集方法。

通用科学数据模型将计划、收集、集成和转换、发布、发现和通知以及存档或丢弃作为生命周期的六个阶段。这个模型,如图7所示,可以用数据管理计划使用的特定技术来预测下一组数据采集。

研究结论:此模型不是整个数据生命周期的综合模型,因为它是专门为数据存档和处理而设计的。该模型不关心数据分析、数据安全和数据质量。

2.数据全周期管理

请参考原创:https://mp.weixin.qq.com/s/ovSa7Uhv5IyKzyb-l3PHaA

数据的生命周期从数据规划开始,中间是一个包括设计、创建、处理、部署、应用、监控、存档、销毁这几个阶段并不断循环的过程。企业的数据质量管理应贯穿数据生命周期的全过程,覆盖数据标准的规划设计、数据的建模、数据质量的监控、数据问题诊断、数据清洗、优化完善等方面。

(1)数据规划。从企业战略的角度不断完善企业数据模型的规划,把数据质量管理融入到企业战略中,建立数据治理体系,并融入企业文化中。

(2)数据设计。推动数据标准化制定和贯彻执行,根据数据标准化要求统一建模管理,统一数据分类、数据编码、数据存储结构,为数据的集成、交换、共享、应用奠定基础。

(3)数据创建。利用数据模型保证数据结构完整、一致,执行数据标准、规范数据维护过程,加入数据质量检查,从源头系统保证数据的正确性、完整性、唯一性。

(4)数据使用。利用元数据监控数据使用;利用数据标准保证数据正确;利用数据质量检查加工正确。元数据提供各系统统一的数据模型进行使用,监控数据的来源去向,提供全息的数据地图支持;企业从技术、管理、业务三个方面进行规范,严格执行数据标准,保证数据输入端的正确性;数据质量提供了事前预防、事中预警、事后补救的三个方面措施,形成完整的数据治理体系。

3.个人版

由以上两篇文章可见,数据生命周期包含的内容点繁多,以下 数据生命周期内容 是个人根据自身行业及经历作出的总结,由于个人能力及所处行业的局限性,内容会有所偏差,也会持续优化。

(1)数据规划设计(前期):数据源范围(基于业务考虑)、数据质量标准(技术+业务)、数据存储架构设计(工具平台、存储划分、表及字表设计...)、应用场景考虑等

(2)数据存储(中期):数据收集、数据清洗、数据入库等ETL过程,还包括数据质量监控、数据库的性能监控、日志管理、用户管理、权限配置等

(3)数据应用(后期):即时查询、常规报表、OLAP、数据分析、数据挖掘、BI等

(4)数据归档(退役):个人认为数据没有消亡一说,更像退役,但个人更喜欢称为数据归档。归档释义:把文件、材料分类放进档案保存起来。

数据分析 - 基础原理 之 第三章:数据质量管理 - 第二节:数据生命周期相关推荐

  1. 数据分析 - 基础原理 之 第三章:数据质量管理 - 第一节:数据质量评估

    请参考原创:https://mp.weixin.qq.com/s/ovSa7Uhv5IyKzyb-l3PHaA 前言 数据资产的重要性 数据资产是企业或组织拥有或控制,能带来未来经济利益的数据资源.越 ...

  2. 数据分析 - 基础原理 之 第三章:数据质量管理 - 第五节:数据质量监控

    前言 数据质量监控 是容易被忽略的一个重要环节,我刚开始搞数据库时压根也没想到会有这档事,直到频繁出现几次数据"翻车"事故后,才感受到它的重要性与必要性:如果连数据源的状况都不能掌 ...

  3. (王道408考研操作系统)第三章内存管理-第二节3:页面置换算法2

    上接: (王道408考研操作系统)第三章内存管理-第二节2:页面置换算法1 文章目录 一:时钟置换算法(CLOCK) (1)简单时钟置换算法 (2)改进型时钟置换算法 二:页面置换算法总结 一:时钟置 ...

  4. (王道408考研操作系统)第三章内存管理-第二节1:虚拟内存管理基本概念

    文章目录 一:传统存储管理方式的弊端 二:局部性原理与高速缓冲技术Cache (1)Cache基本原理 (2)局部性原理 三:虚拟内存的定义和特征 (1)定义 (2)特征 四:虚拟内存实现 内存管理需 ...

  5. (王道408考研操作系统)第三章内存管理-第二节3:页面置换算法1

    注意:本节和计组中的Cache替换算法很相似 (计算机组成原理)第三章存储系统-第六节3:Cache替换算法(FIFO,近期最少使用算法-LRU,LFU) 篇幅限制,下一篇请见 点击跳转 文章目录 一 ...

  6. Android Wear开发 - 数据通讯 - 第二节 : 数据的发送与接收

    本节由介绍3种数据的发送接收: 1.Data Items : 比特类型数据,限制100KB以内 2.Assets : 资源类型数据,大小无上限 3.Message : 发送消息,触发指令 http:/ ...

  7. (王道408考研操作系统)第三章内存管理-第二节2:请求分页管理方式

    文章目录 一:页表机制 二:缺页中断机构 三:地址变换机构 虚拟内存的实现需要建立在离散分配的内存管理方式的基础上.主要有以下三种 请求分页存储管理 请求分段存储管理 请求段页式存储管理 与传统的非连 ...

  8. Web前端开发笔记——第三章 CSS语言 第二节 CSS选择器

    目录 前言 一.CSS选择器 (一)标签选择器 (二)id选择器 (三)类别选择器 二.针对标签的选择器嵌套 三.集体声明和全局声明 (一)集体声明 (二)全局声明 结语 前言 CSS代码由选择器和一 ...

  9. (王道408考研操作系统)第三章内存管理-第二节4:页面分配策略

    文章目录 一:页面分配策略 (1)驻留集 (2)页面分配策略 (3)调入页面的时机 (4)从哪里调入页面 二:其他概念 (1)抖动(颠簸)现象 (2)工作集 一:页面分配策略 (1)驻留集 驻留集:对 ...

最新文章

  1. 计算机 程序 原理,计算机储存程序和程序原理是谁提出来的
  2. HTML5----简易贪吃蛇小游戏
  3. linux下添加用户并赋予root权限
  4. JS正则表达式使用详解
  5. 51单片机驱动ds12887c语言,51单片机+DS12887+12864大数字时钟程序+电路
  6. python怎么获取lol皮肤名称_LOL手游免费皮肤获得方法 LOL手游皮肤怎么获得
  7. 比较 Excel 中两列的差异,并用箭头标识和指向匹配结果
  8. java让弹窗在最上层_layer弹出层显示在top顶层的方法
  9. 基于ConvLSTM的伦敦空气质量预测(2) 算法实施
  10. 联网玩具CloudPets 泰迪熊泄漏数百万语音信息
  11. 基于51单片机数字电压表仿真设计_数码管显示
  12. 高程数据的下载以及运用高程数据进行坡度和坡向的计算
  13. 软考信息系统项目管理师论文范文:论项目的质量管理论项目的质量管理
  14. java sts安装步骤_如何安装STS
  15. toastr弹出提示窗口的使用
  16. 计量广义差分操作过程_一分钟看完计量经济学
  17. 2021年全球及中国AMOLED行业发展现状、竞争格局及未来发展趋势分析,柔性AMOLED面板将占领市场「图」
  18. es的bucket和metric
  19. Dell R730服务器inter 500系列网卡与光模块不兼容**
  20. qq邮箱smtp服务器imap,如何配置电子邮件客户端使用IMAP(QQ邮箱账户) 你需要学习了...

热门文章

  1. 表单、表格常用属性大全
  2. 【信息安全】MD(消息摘要)、MAC(消息认证码)、数字签名的区别
  3. 我认为应该如何做职业规划
  4. 饿了么端智能本地生活领域探索与实践
  5. “数学界的诺贝尔”公布2019年得主,首位女数学家获奖
  6. 编程黑科技:能玩几个小时的《魂斗罗》居然只有128KB
  7. 使用openlayers加载离线地图
  8. [知识竞赛现场管理系统-PPT双屏版]隆重推出,PowerPoint技术深度应用,国内唯一。只要会制作普通的PPT,就可打造一场专业的知识竞赛。
  9. keil5中找不到或没有对应的芯片怎么办?超详细!!
  10. 利用C语言编写放烟花的程序(同时也可以播放音乐)