目录

说在前面

一、数据的概念

二、数据类型

​三、数据组织形式


说在前面

大数据时代悄然来临,带来了整个信息技术发展的巨大变革,并深刻影响着社会生产和人们生活的方方面面。全球范围内,世界各国政府也非常重视整个大数据的研究和产业的发展,纷纷把大数据上升为国家战略来加以重点推进,企业和学术机构也纷纷加大技术资金和人员的投入力度,加强对整个大数据关键技术研发应用,从而期望在第三次信息化浪潮中占得先机,引领市场。

大数据可以说已经不是镜中花水中月,它的影响力正在迅速的促进我们社会的各个角度,所到之处,或是颠覆或是提升,都让人们感受到了大数据实实在在的威力。

一、数据的概念

数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合,是可识别的、抽象的符号。

数据和信息是两个不同的概念,信息是较为宏观的概念,它由数据的有序排列组合而成,传达给读者某个概念方法等,而数据则是构成信息的基本单位,离散的数据没有任何实用价值。

数据也被成为“未来的石油”。

二、数据类型

数据分为四种类型:文本、图片、音频、视频。

文本文件:是一种由若干字符构成的计算机文件,比如用记事本、写字板、word 等程序生成的文件。

图片:是指由图形图像构成的平面媒体,图片的格式非常多,大体可以分为点阵图和矢量图两类,我们常用的 BMP、JPG 属于点阵图,flash 动画软件生成的 swf 文件以及 photoshop 绘图软件所生成的 psd 等等格式的图形属于矢量图形。

音频:是指存储声音内容的文件,用一定的音频顺序的程序来播放就可以还原以前录下来的声音,音频文件的格式非常多,包括 CD、WAV、MP3 等。

视频:是指各种动态的影像的存储格式,包括 MPEG-4、AVI、DAT等格式都是视频常用的格式。

​三、数据组织形式

文件:计算机系统中的很多数据都是以文件形式存在的,比如一个 WORD 文件、一个文本文件、一个网页文件、一个图片文件等。

数据库:数据库已经成为计算机软件开发的基础和核心,数据库在人力资源管理、固定资产管理、制造业管理、电信管理、销售管理、股市管理、图书馆管理、政务管理等领域发挥着至关重要的作用。

人类社会已经经历了层次数据库、网状数据库、关系数据库、NoSQL 数据库,那么到目前为止,关系数据库仍然是目前的主流数据库,大多数商业应用系统都是构建在关系数据库基础之上的。

随着 Web 2.0 的兴起,非结构化数据迅速增加,目前人类社会产生的数字内容中有 90% 是非结构化数据,因此,能够更好支持非结构化数据管理的 NoSQL 数据库应运而生。

如果觉得还不错的话,点赞、收藏、分享哈!!!

《大数据导论》之数据的概念、类型和组织形式相关推荐

  1. 《大数据导论》一第1章 理解大数据

    本节书摘来自华章出版社<大数据导论>一书中的第1章,第1.1节,作者托马斯·埃尔(Thomas Erl),瓦吉德·哈塔克(Wajid Khattak),保罗·布勒(Paul Buhler) ...

  2. 《大数据导论》——1.5节案例学习

    本节书摘来自华章社区<大数据导论>一书中的第1章,第1.5节案例学习,作者瓦吉德·哈塔克(Wajid Khattak),保罗·布勒(Paul Buhler),更多章节内容可以访问云栖社区& ...

  3. 大数据实战之用户画像概念、项目概述及环境搭建

    下面跟着我一起来学习大数据获取用户画像: 项目Profile课程安排 : 用户画像概念 1.用户画像概述 1.1.产生背景 早期的用户画像起源于交互设计之父Alan Cooper提出的"Pe ...

  4. 大数据、快速数据和数据湖概念

    作者: 娜塔莉亚·米洛斯拉夫斯卡娅和亚历山大·托尔斯泰 国立核研究大学MEPhI(莫斯科工程物理研究所) 摘要 今天,我们见证了大数据的另外两个概念的出现:数据湖和快速数据.它们只是旧大数据IT的新营 ...

  5. 大数据、云计算、物联网、数据库、数据仓库、OLAP、OLTP等学习大数据你必须了解的概念,我的学习总结

    三个概念 Cloud computing-云计算: 定义: 百度百科解释: 云计算(cloud computing)是分布式计算的一种,指的是通过网络"云"将巨大的数据计算处理程序 ...

  6. 大数据Hadoop教程-学习笔记01【大数据导论与Linux基础】

    视频教程:哔哩哔哩网站:黑马大数据Hadoop入门视频教程,总时长:14:22:04 教程资源:https://pan.baidu.com/s/1WYgyI3KgbzKzFD639lA-_g,提取码: ...

  7. 大数据导论(三:大数据的采集及预处理)

    1.大数据采集 1.1 大数据采集概念 数据采集(DAQ)又称数据获取,通过RFID射频数据.传感器数据.社交网络数据.移动互联网数据等方式获得各种类型的结构化.半结构化及非结构化的海量数据. 1.2 ...

  8. 《大数据导论》——1.4节案例学习背景

    本节书摘来自华章社区<大数据导论>一书中的第1章,第1.4节案例学习背景,作者瓦吉德·哈塔克(Wajid Khattak),保罗·布勒(Paul Buhler),更多章节内容可以访问云栖社 ...

  9. 《大数据导论》——2.3节业务流程管理

    本节书摘来自华章社区<大数据导论>一书中的第2章,第2.3节业务流程管理,作者瓦吉德·哈塔克(Wajid Khattak),保罗·布勒(Paul Buhler),更多章节内容可以访问云栖社 ...

  10. 《大数据导论》一1.4 案例学习背景

    本节书摘来自华章出版社<大数据导论>一书中的第1章,第1.4节,作者托马斯·埃尔(Thomas Erl),瓦吉德·哈塔克(Wajid Khattak),保罗·布勒(Paul Buhler) ...

最新文章

  1. 每天定时备份mysql数据库任务
  2. Powershell 邮件发送
  3. 前端开始学java_[Java教程]开启前端学习之路
  4. HTTP的长连接和短连接通俗解释以及应用场景
  5. css displayhidden
  6. IDEA 常用设置 与 常用操作(一)
  7. 对C语言指针的学习与理解
  8. aliplayer播放rtmp视频流
  9. spring nature
  10. 赵小楼《天道》《遥远的救世主》深度解析(64)丁元英帮芮小丹审讯王明阳的切入点是什么?
  11. 2010提升你幽默感的语句
  12. 人性化,中国制造新境界
  13. 三、大数据存储——HBase
  14. 华为天猫官方旗舰店粉丝突破一千万
  15. 老男孩每日一题(一)
  16. 自建免费的代理ip池
  17. 2020最全Python内置函数大全!赶快收藏起来!
  18. python 第七周
  19. python现在版本强势英雄_浅谈S15新赛季即将崛起的英雄,附新版本强势英雄推荐...
  20. 计算机及网络是把双刃剑,网络是把双刃剑

热门文章

  1. Python用turtle实现完美画出一张图片
  2. 记录小白杭电OJ刷题
  3. 嘴对嘴系列之es核心基础概念之文档和索引
  4. 通过LabVIEW设计简单的登录界面
  5. 永洪Bi架构部署与集群部署
  6. Python图形界面GUI程序设计
  7. 正则表达式——自动填写收货地址
  8. Java学习笔记项目三:开发团队调度软件(尚硅谷)
  9. ElasticSearch7.1 自动提示(suggest)的两种实战做法
  10. 基于IDEA 工程项目的git实操