研究一下分布式架构的实现方式

结构化数据(structured),半结构化数据(semi-structured),非结构化数据(unstructured)

概念
结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。
半结构化数据:介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML文档就属于半结构化数据。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
非结构化数据:不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。
数据模型
结构化数据:二维表(关系型)
非结构化数据:树、图
非结构化数据:无
其他
结构化数据:先有结构、再有数据
半结构化数据:先有数据,再有结构

阅读(41)| 评论(2)
|      

研究一下分布式架构的实现方式
VMWare虚拟化实践

 
2013-03-06 15:14

 雪融成冰

所以数据库的分类可以分为传统的关系型数据库,和NoSQL数据库,后者可以应付非结构化数据,当然应该也可以处理结构化数据。
回复

2013-03-06 15:09

 雪融成冰

一般来讲,结构化数据只占10%以内的比例,但是就是这10%以内的数据浓缩了过去很久以来的企业各个方面的数据需求,发展也已经成熟。但是随着大数据需求处理的大态势,对于结构化以外数据的处理越来越有市场,所以处理非结构化、半结构化的数据库,会慢慢成为数据处理的主流。
回复

结构化数据(structured),半结构化数据(semi-structured),非结构化数据(unstructured)相关推荐

  1. 结构化数据(structured),半结构化数据(semi-structured),非结构化数据(unstructured)...

    概念 结构化数据:即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据. 半结构化数据:介于完全结构化数据(如关系型数据库.面向对象数据库中的数据)和完全无结构的数据(如声音.图像文件等)之 ...

  2. 如何理解结构化、非结构化和半结构化数据?

    计算机信息化系统中的数据分为结构化数据.非结构化数据和半结构化数据 1.结构化数据(Structured Data) 定义:结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据 ...

  3. 结构化数据、半结构数据和非结构数据的总结

    (一) (1)结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据) (2)非结构化数据,包括所有格式的办公文档.文本.图片.XML.HTML.各类报表.图像和音频/视频信息等等 ...

  4. 我被“非结构化数据包围了”,请求支援!

    阿里妹导读:非结构化数据的内容占据了当前数据海洋的80%.换句话来说,就是我们都被"非结构化数据"包围了.由于非结构化数据的信息量和信息的重要程度很难被界定,因此对非结构化数据的使 ...

  5. 非结构化数据的相关知识

    一.出现原因 信息社会化时代,各行各业在处理相关业务的过程中,都累计了海量的数据信息,随着IT应用的普及和发展,传统的纸质资料存储方式在不断缩减,更多的采用电子信息的存储方式存放在计算机中.这些信息数 ...

  6. 非结构化数据的定义及处理方法

    一.非结构化数据的定义 结构化数据指有完整规则的数据模型定义,高度组织格式化,可用统一的结构逻辑表达的数据.如:日期.电话号码等. 非结构化数据指数据定义不完整或不规则,没有预定义的数据模型,无法用数 ...

  7. 结构化数据和非结构化数据的分析

    结构化数据和非结构化数据的分析 一. 什么是数据 二. 数据的分类 1. 按性质分为 2. 按表现形式分为 3. 按表现形式分为 三. 结构化数据和非结构化数据 1. 什么是结构化数据 2. 什么是非 ...

  8. 技术20期:结构化数据与非结构化数据:有什么区别?

    查看结构化和非结构化数据.它们的主要区别以及哪种形式最能满足您的业务需求. 并非所有数据都是平等的.有些数据是结构化的,但大部分是非结构化的.结构化和非结构化数据以不同的方式获取.收集和扩展,并且每一 ...

  9. 详解非结构化数据(文档)安全管理解决方案

    随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位.日常的业务过程中,需要处理的大量电子文档.图片.音频.视频等,都属于内容数据范畴. 例如,某银行的无人营业网点的远程业务办理中, ...

最新文章

  1. linux如何安装neo4j,Ubuntu16.04 如何安装neo4j数据库
  2. jenkins使用Git为源码管理(windows master linux slave)
  3. 揭秘特斯拉自动驾驶雄心:最大优势非算法或技术而是海量数据
  4. jsonp请求url长度过长的替代(ajaxcdr的使用)
  5. oracle存储过程的简单学习2
  6. .NET Core扩展IServiceCollection自动注册服务
  7. spring 中构造Constructor、@Autowired、@PostConstruct、静态方法的执行顺序 (@PostConstruct 说明)
  8. 图解JVM的Class文件格式(详细版)
  9. 本田与索尼宣布将成立合资企业 计划2025年开始销售电动汽车
  10. plsql数据库异常---plsql 登录后,提示数据库字符集(AL32UTF8)和客户端字符集(ZHS16GBK)不一致
  11. 模式识别中常见概率符号公式的学习笔记 By Youki~
  12. guice依赖注入原理_Google Guice依赖注入示例教程
  13. Jenkins任务配置详解,支持ssh远程部署,maven聚合项目,springboot
  14. java docx4j 合并word_使用docx4j进行docx文档合并。
  15. python爬网易新闻_爬虫入门:如何用python爬取网易新闻?
  16. 学科网软件测试,对比学科网和菁优网:选择二一组卷平台的N个理由
  17. 李宏毅自然语言处理——指代消歧
  18. 笔记本连接RK61键机械键盘非损坏的win和alt对调,数字键失灵以及特殊字母键失灵恢复
  19. 完美解决python manage.py makemigrations 报错
  20. 实现正六边形、圆形及带倒角正六边形的头像显示

热门文章

  1. 科研必备各专业全套模型:水文水资源、大气科学、农林生态、地信遥感、统计分析、编程语言等...
  2. 项目背景怎么描述_如何写项目的设计说明?
  3. 【论文笔记】Learning Synergies between Pushing and Grasping with Self-supervised Deep Reinforcement Learn
  4. abbex 区块链学院如何交易之 第十六章 交易计划
  5. Docker ToolBox使用问题汇总
  6. NLP——Tokenizer
  7. java几种读写文件的方式
  8. js验证前台验证用户名只能是汉字
  9. SteamVR2.5.0讲解
  10. 小学生四则运算练习的编程 软件工程