计算机信息化系统中的数据分为结构化数据和非结构化数据和半结构化数据。

结构化数据

结构化数据,是指由二维表结构来表达逻辑和实现的数据,严格的遵循数据格式与长度规范,主要通过关系型数据库进行管理和存储。

也称作行数据,一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。
例:

id name gender address
1 张三 female 北京市
2 李四 male 上海市
3 王五 female 广州省

所以,结构化的数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助。显然,它的扩展性不好

非结构化数据:

非结构化数据,是数据结构不规则或者不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、HTML、各类报表、图像和音视频信息等

半结构化数据:

半结构化数据,是结构化数据的一种形式,虽不符合关系型数据库或其他数据表的形式关联起来的数据型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,也被称为自瞄述的结构。

所谓半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,XML、HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。

常见的半结构数据有XML和JSON,对于对于两个XML文件,第一个可能有,例:

 <person><name>A</name><age>13</age><gender>female</gender></person>

第二种可能为:

 <person><name>B</name><age>male</age></person>

从上面的例子中,属性的顺序是不重要的,不同的半结构化数据的属性的个数是不一定一样的。有些人说半结构化数据是以树或者图的数据结构存储的数据,怎么理解呢?上面的例子中,标签是树的根节点,和标签是子节点。通过这样的数据格式,可以自由地表达很多有用的信息,包括自我描述信息(元数据)。所以,半结构化数据的扩展性是很好的。

结构化数据和半结构化数据和非结构化数据相关推荐

  1. Linux-非结构化数据同步-Linux下Rsync+Rsync实现非结构化增量差异数据的同步2

    说明: 操作系统:CentOS 5.X 源服务器:192.168.21.129 目标服务器:192.168.21.127,192.168.21.128 目的:把源服务器上/home/www.osyun ...

  2. 组态王能直接读取仪表数据吗_关于组态王读取非标准协议设备数据的应用

    在我们使用组态软件进行数据采集时,一般都会使用软件自带的对应驱动来采集,但是在设备是非标准协议下,需要我们对非标准通讯协议组件进行接入.在斜沟锅炉房系统中需采集一台皮带秤的数据,而皮带秤积算仪的通讯协 ...

  3. 如何理解结构化、非结构化和半结构化数据?

    计算机信息化系统中的数据分为结构化数据.非结构化数据和半结构化数据 1.结构化数据(Structured Data) 定义:结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据 ...

  4. 结构化数据(structured),半结构化数据(semi-structured),非结构化数据(unstructured)的定义和区别

    相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档.文本.图片.XML.HTML.各 ...

  5. 我被“非结构化数据包围了”,请求支援!

    阿里妹导读:非结构化数据的内容占据了当前数据海洋的80%.换句话来说,就是我们都被"非结构化数据"包围了.由于非结构化数据的信息量和信息的重要程度很难被界定,因此对非结构化数据的使 ...

  6. 非结构化数据的定义及处理方法

    一.非结构化数据的定义 结构化数据指有完整规则的数据模型定义,高度组织格式化,可用统一的结构逻辑表达的数据.如:日期.电话号码等. 非结构化数据指数据定义不完整或不规则,没有预定义的数据模型,无法用数 ...

  7. 结构化数据和非结构化数据的分析

    结构化数据和非结构化数据的分析 一. 什么是数据 二. 数据的分类 1. 按性质分为 2. 按表现形式分为 3. 按表现形式分为 三. 结构化数据和非结构化数据 1. 什么是结构化数据 2. 什么是非 ...

  8. 详解非结构化数据(文档)安全管理解决方案

    随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位.日常的业务过程中,需要处理的大量电子文档.图片.音频.视频等,都属于内容数据范畴. 例如,某银行的无人营业网点的远程业务办理中, ...

  9. 非结构化数据怎么治理?

    编 辑:彭文华 来 源:大数据架构师 彭友们好,我是老彭.最近遇到几个项目,都跟非结构化数据脱不开关系. 老彭刚毕业的时候,做的是数据库的活儿,那都是结构化数据.后来有了hadoop技术,可以用来处理 ...

  10. 结构化数据与非结构化数据的区别(转载)

    在信息社会,信息可以划分为两大类.一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字.符号:而另一类信息无法用数字或统一的结构表示,如文本.图像.声音.网页等,我们称之为非结构化数据 ...

最新文章

  1. 不聋不哑,不做当家之解
  2. 【Java】7.3 基本类 7.4 Java 8 的日期、时间类
  3. 显式调用构造函数产生的悲剧
  4. 500w 的引用类型和值类型到底有多大差异?
  5. [html] 如何给input的右上角加个清除的按钮?
  6. BZOJ 2653 middle
  7. web端项目展开测试步骤
  8. lenovo 笔记本ideapad 320c-15改装win7问题
  9. 实用性室内地图导航软件
  10. 孙悟空的师父是谁? (ZT)
  11. cairo和pixman库给bmp图片加文字水印
  12. java连不上sqlserver_java和SQL连接不上——解决步骤
  13. 【日常】如何处理“火星文”乱码
  14. 2.2数据选择与分析及折线图柱状图Selecting_data_and_analysis_part1
  15. 登录提示 ORA-28000 The account is locked.
  16. 信息时代的必修课:冗余度(善用信息冗余成为沟通的高手)
  17. WaveProgressBar -- 波浪进度条
  18. halo 开源项目源码学习
  19. python机器视觉车牌识别_2车牌识别与深度学习
  20. 游戏编程入门(11):播放MIDI 音乐

热门文章

  1. 2019XUPT_ACM 寒假训练第二期
  2. 服务器4块固态硬盘做raid5,RAID 5与RAID 10、硬盘和固态硬盘
  3. BAT 字符串大小写转换
  4. umi build打包之后部署报错
  5. vue 视频长传与预览
  6. nyoj 1239-引水工程 //并查集
  7. 【赛码网 牛客网】输入输出总结(python版)
  8. k8s二进制部署 1.17.3
  9. 梦想起航商务工作PPT模板
  10. LNMP介绍及一键部署LNMP架构