计算机信息化系统中的数据分为结构化数据、非结构化数据和半结构化数据

1、结构化数据(Structured Data)

定义:结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。

结构化数据,简单来说就是数据库。结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等。基本包括高速存储应用需求、数据备份需求、数据共享需求以及数据容灾需求。

2、非结构化数据(Unstructure Data)

定义:非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML, HTML、各类报表、图像和音频/视频信息等等。

非结构化数据其格式非常多样,标准也是多样性的,而且在技术上非结构化信息比结构化信息更难标准化和理解。支持非结构化数据的数据库广泛应用于全文检索和各种多媒体信息处理领域。

3、半结构化数据(Semi-structured Data)

       定义:所谓半结构化数据,就是介于结构化数据(如关系型数据库、面向对象数据库 中的数据)和非结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。

4、三者之间的区别其实从它们的定义中就很明显看出来了,再详细说一下。

结构化数据这种类别的数据最好处理,只要简单的建立一个对应的表就可以了。

非结构化数据像图片、声音、视频等等。这类信息我们通常无法直接知道他的内容,数据库也只能将它保存在一个BLOB字段中,对以后检索非常麻烦。一般的做法是,建立一个包含三个字段的表(编号 number、内容描述 varchar(1024)、内容 blob)。引用通过编号,检索通过内容描述。还有很多非结构化数据的处理工具,市面上常见的内容管理器就是其中的一种。

半结构化数据这样的数据和上面两种类别都不一样,它是结构化的数据,但是结构变化很大。因为我们要了解数据的细节所以不能将数据简单的组织成一个文件按照非结构化数据处理,由于结构变化很大也不能够简单的建立一个表和他对应。本文主要讨论针对半结构化数据存储常用的两种方式。举一个半结构化的数据的例子,比如存储员工的简历。不像员工基本信息那样一致每个员工的简历大不相同。有的员工的简历很简单,比如只包括教育情况;有的员工的简历却很复杂,比如包括工作情况、婚姻情况、出入境情况、户口迁移情况、党籍情况、技术技能等等。还有可能有一些我们没有预料的信息。通常我们要完整的保存这些信息并不是很容易的,因为我们不会希望系统中的表的结构在系统的运行期间进行变更。

本文参考网上资料整理所得,希望也能帮到大家哦

如何理解结构化、非结构化和半结构化数据?相关推荐

  1. 银行半结构化和无领导群面注意事项

    银行可以同时报考多家,因此部分同学也积累了不少宝贵的面试"失败"经验.今天小编就来给大家说说半结构化和无领导群面的注意事项,从如信银行考试中心了解到的整理如下: 一.半结构化面试注 ...

  2. 图像的OTSU阈值化、双阈值化、半阈值化的原理及OpenCV代码实现

    本文的基础是OpenCV的函数threshold(),关于函数threshold()的详细介绍,大家可以参考下面这篇博文: https://www.hhai.cc/thread-162-1-1.htm ...

  3. 关于结构化、半结构化、非结构化数据的理解

    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据.心中一直有一个 ...

  4. 关于结构化,半结构化,非结构化数据的理解

    记得在课上,老师说,结构化数据就是我们关系数据库里的表,剩下的都是半结构化和非结构化数据,好比XML文档就是半结构化数据,WORD文档就是非结构化数据,大数据就是半结构化和非结构化数据.心中一直有一个 ...

  5. html属于非结构化数据吗,什么是结构化数据非结构化数据和半结构化数据

    什么是结构化数据非结构化数据和半结构化数据以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 结构化数据也称为行数据,是由二 ...

  6. 结构化数据,半结构化数据,非结构化数据(区别)

    结构化数据 结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据.一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的.举一个例子: id name age ...

  7. 结构化数据和半结构化数据和非结构化数据

    计算机信息化系统中的数据分为结构化数据和非结构化数据和半结构化数据. 结构化数据 结构化数据,是指由二维表结构来表达逻辑和实现的数据,严格的遵循数据格式与长度规范,主要通过关系型数据库进行管理和存储. ...

  8. 什么是结构化数据?非结构化数据?半结构化数据?

    结构化数据 结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据. 一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的. 如mysql数据库中的数据.cs ...

  9. 作业3 | 结构化数据、非结构化数据、半结构化数据

    一.结构化数据 结构化数据是指具有一定结构性.可以划分为固定的基本组成要素.能通过一个或多个二维表来表示的数据. 一般存储在关系数据库中,具有一定逻辑结构,可用关系数据库的表或视图表示,一般使用关系型 ...

最新文章

  1. java下实现调用oracle的存储过程和函数
  2. 红色小方块单击爆炸式展开的菜单代码
  3. php curl 测试,php使用curl检测网页是否被百度收录的示例
  4. Asp.Net上传组件
  5. 一起谈.NET技术,从.NET中委托写法的演变谈开去(中):Lambda表达式及其优势...
  6. npoi 删除多行 操作excel_NPOI操作excel 2007/2010版本
  7. python图片二值化处理百度图api_Python+百度AI实现图像处理-附源码
  8. The Google File System
  9. 【C语言】指针进阶实践(指针数组和创建单链表)
  10. 支付宝最不想看到的:当“集五福”变成赚钱生意 有人日入千元!
  11. 判断浏览器是否支持websocket的方法
  12. ​特征工程系列:特征预处理(上)
  13. English Learning from research paper
  14. JAVA防止任意文件上传,Tomcat任意文件上传漏洞以及环境配置
  15. 多媒体计算机网络机房方案,学校多媒体教室及计算机机房方案1.doc
  16. nginx配置ssl证书实现微信小程序后端接口访问
  17. 数字档案馆子系统划分与功能
  18. allure趋势图无数据
  19. 关于MyEclipse的servers和WTPservers
  20. Win10踩坑-开机0xc0000225

热门文章

  1. 基于WEB快速开发平台的轻量ERP
  2. prometheus服务配置Altermanager监控告警
  3. The server time zone value ‘ й ׼ʱ ‘ is unrecognized or represents more than one time zone. You mu
  4. 浅谈音视频开发入门基础及进阶资源分享
  5. AndroidStudio安装配置教程(参考)
  6. 《Python神经网络编程(Make Your Own Neural Network)》读书笔记
  7. Java SSLSocket客户端认证配置
  8. CRM系统概念与项目开发流程
  9. 上交计算机考研分数线2018,2018上交考研经验贴
  10. Vue设置浏览器小图标(ICON)