文章目录

  • 1 大数据时代
    • 1.1 第三次信息化浪潮
    • 1.2 信息科技为大数据时代提供技术支撑
      • 1.2.1 存储设备容量不断增加
      • 1.2.2 CPU处理能力大幅提升
      • 1.2.3 网络带宽不断增加
    • 1.3 数据产生方式的变革促成大数据时代的来临
    • 1.4 大数据的发展历程
  • 2 大数据概念
    • 2.1 数据量大
    • 2.2 数据类型繁多
    • 2.3 处理速度快
    • 2.4 价值密度低
  • 3 大数据的影响
  • 4 大数据的应用
  • 5 大数据关键技术
  • 6 大数据计算模式
  • 7 大数据产业
  • 8 大数据与云计算、物联网
    • 8.1 云计算
      • 8.1.1 云计算概念
      • 8.1.2 云计算关键技术
      • 8.1.3 云计算数据中心
      • 8.1.4 云计算应用
      • 8.1.5 云计算产业
    • 8.2 物联网
      • 8.2.1 物联网概念
      • 8.2.2 物联网关键技术
      • 8.2.3 物联网应用
      • 8.2.4 物联网产业
    • 8.3 大数据与云计算、物联网的关系
  • 9 小结

1 大数据时代

1.1 第三次信息化浪潮

根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革。

1.2 信息科技为大数据时代提供技术支撑

1.2.1 存储设备容量不断增加

1.2.2 CPU处理能力大幅提升

1.2.3 网络带宽不断增加

1.3 数据产生方式的变革促成大数据时代的来临

1.4 大数据的发展历程

2 大数据概念

2.1 数据量大

  • 根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)
  • 人类在最近两年产生的数据量相当于之前产生的全部数据量
  • 预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍

2.2 数据类型繁多

大数据是由结构化和非结构化数据组成的:10%的结构化数据,存储在数据库中;90%的非结构化数据,它们与人类信息密切相关。

  • 科学研究

    • 基因组
    • LHC 加速器
    • 地球与空间探测
  • 企业应用
    • Email、文档、文件
    • 应用日志
    • 交易记录
  • Web 1.0数据
    • 文本
    • 图像
    • 视频
  • Web 2.0数据
    • 查询日志/点击流
    • Twitter/ Blog / SNS
    • Wiki

2.3 处理速度快

  • 从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少
  • 1秒定律:这一点也是和传统的数据挖掘技术有着本质的不同

2.4 价值密度低

以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒,但是具有很高的商业价值。

3 大数据的影响

图灵奖获得者、著名数据库专家Jim Gray 博士观察并总结人类自古以来,在科学研究上,先后历经了实验、理论、计算和数据四种范式。

  • 在思维方式方面,大数据完全颠覆了传统的思维方式:

    • 全样而非抽样
    • 效率而非精确
    • 相关而非因果
  • 在社会发展方面,大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现
  • 在就业市场方面,大数据的兴起使得数据科学家成为热门职业
  • 在人才培养方面,大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制

4 大数据的应用

大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都已经融入了大数据的印迹。

5 大数据关键技术


两大核心技术:

  • 分布式存储

    • GFS\HDFS
    • BigTable\HBase
    • NoSQL(键值、列族、图形、文档数据库)
    • NewSQL(如:SQL Azure)
  • 分布式处理
    • MapReduce

6 大数据计算模式

7 大数据产业

大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。

8 大数据与云计算、物联网

云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者相辅相成,既有联系又有区别。

8.1 云计算

8.1.1 云计算概念

云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。


8.1.2 云计算关键技术

云计算关键技术包括:虚拟化、分布式存储、分布式计算、多租户等。

8.1.3 云计算数据中心

  • 云计算数据中心是一整套复杂的设施,包括刀片服务器、宽带网络连接、环境控制设备、监控设备以及各种安全装置等
  • 数据中心是云计算的重要载体,为云计算提供计算、存储、带宽等各种硬件资源,为各种平台和应用提供运行支撑环境
  • 全国各地推进数据中心建设

8.1.4 云计算应用

  • 政务云上可以部署公共安全管理、容灾备份、城市管理、应急管理、智能交通、社会保障等应用,通过集约化建设、管理和运行,可以实现信息资源整合和政务资源共享,推动政务管理创新,加快向服务型政府转型
  • 教育云可以有效整合幼儿教育、中小学教育、高等教育以及继续教育等优质教育资源,逐步实现教育信息共享、教育资源共享及教育资源深度挖掘等目标
  • 中小企业云能够让企业以低廉的成本建立财务、供应链、客户关系等管理应用系统,大大降低企业信息化门槛,迅速提升企业信息化水平,增强企业市场竞争力
  • 医疗云可以推动医院与医院、医院与社区、医院与急救中心、医院与家庭之间的服务共享,并形成一套全新的医疗健康服务系统,从而有效地提高医疗保健的质量

8.1.5 云计算产业

云计算产业作为战略性新兴产业,近些年得到了迅速发展,形成了成熟的产业链结构,产业涵盖硬件与设备制造、基础设施运营、软件与解决方案供应商、基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、终端设备、云安全、云计算交付/咨询/认证等环节。

8.2 物联网

8.2.1 物联网概念

物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化和远程管理控制。

8.2.2 物联网关键技术

  • 识别和感知技术(二维码、RFID、传感器等)
  • 网络与通信技术
  • 数据挖掘与融合技术

8.2.3 物联网应用

物联网已经广泛应用于智能交通、智慧医疗、智能家居、环保监测、智能安防、智能物流、智能电网、智慧农业、智能工业等领域,对国民经济与社会发展起到了重要的推动作用。

8.2.4 物联网产业

完整的物联网产业链主要包括核心感应器件提供商、感知层末端设备提供商、网络提供商、软件与行业解决方案提供商、系统集成商、运营及服务提供商等六大环节。

8.3 大数据与云计算、物联网的关系

9 小结

  • 本文介绍了大数据技术的发展历程,并指出信息科技的不断进步为大数据时代提供了技术支撑,数据产生方式的变革促成了大数据时代的来临
  • 大数据具有数据量大、数据类型繁多、处理速度快、价值密度低等特点,统称“4V”。大数据对科学研究、思维方式、社会发展、就业市场和人才培养等方面,都产生了重要的影响,深刻理解大数据的这些影响,有助于我们更好把握学习和应用大数据的方向
  • 大数据在金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都得到了日益广泛的应用,深刻地改变着我们的社会生产和日常生活
  • 大数据并非单一的数据或技术,而是数据和大数据技术的综合体。大数据技术主要包括数据采集、数据存储和管理、数据处理与分析、数据安全和隐私保护等几个层面的内容
  • 大数据产业包括IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层和数据应用层,在不同层面,都已经形成了一批引领市场的技术和企业
  • 最后介绍了云计算和物联网的概念和关键技术,并阐述了大数据、云计算和物联网三者之间的区别与联系

学习自厦门大学林子雨老师的《大数据技术原理与应用》:http://www.icourse163.org/course/XMU-1002335004

大数据技术原理与应用-大数据概述相关推荐

  1. 大数据技术原理与应用——大数据存储与管理

    大数据技术原理与应用--大数据存储与管理 1.分布式文件系统 (1)计算机集群结构 集群的概念 集群是指将多台服务器整合在一起,每台服务器都实现相同的业务,做相同的事情. 每台服务器并不是缺一不可,它 ...

  2. 大数据技术原理与应用----大数据处理架构Hadoop

    一.Hadoop简介及其应用现状 1.Hadoop简介 Hadoop(是大数据技术的集合体,一整套解决方案的统称)是由Java开发的,支持多种编程语言. 2.Hadoop的理论基础 (1)Hadoop ...

  3. [渝粤教育] 厦门大学 大数据技术原理与应用 参考 资料

    教育 -大数据技术原理与应用-章节资料考试资料-厦门大学[] 第1章 大数据概述 单元测验 1.[单选题]第三次信息化浪潮的标志是: A.个人电脑的普及 B.互联网的普及 C.云计算.大数据.物联网技 ...

  4. 大数据技术原理与应用课后题(林子雨)

    大数据技术原理与应用(林子雨) 第1章 大数据概述 1单选(2分) 第三次信息化浪潮的标志是: A.个人电脑的普及 B.云计算.大数据.物联网技术的普及 C.虚拟现实技术的普及 D.互联网的普及 正确 ...

  5. 关于大数据技术原理与应用的学习(6)

    学习目标: 大数据技术原理与应用 学习内容: 6云数据库 6.1概述 6.2产品 6.3UMP系统 6.4Amazon云数据库 6.5微软云数据库SQL Azure 学习时间: 2022/03/31 ...

  6. 大数据技术原理与应用 第一篇 大数据基础

    目录 第一章 大数据概述 一. 大数据时代 1.1 三次信息化浪潮 1.2 信息科技发展 1.3 数据产生方式的变革 1.4 大数据的影响 二. 大数据的概念 2.1 大数据的特征 2.2 大数据关键 ...

  7. 大数据技术原理与应用—课后题答案(第一章)

    大数据技术原理与应用_林子雨版_课后题答案(第一章) 1.试述信息技术发展史上的3次信息化浪潮及具体内容. 信息化浪潮 发生时间 标志  解决问题                           ...

  8. 《大数据技术原理与应用》(第八章Hadoop 课后答案)

    第八章 Hadoop再探讨 参考资料 1.林子雨_大数据技术原理与应用课后习题_NPU_阿夏的博客-CSDN博客 2.林子雨编著<大数据技术原理与应用(第3版)>教材官网_厦门大学数据库实 ...

  9. 林子雨试卷《大数据技术原理与应用》试题与答案

    <大数据技术原理与应用>试题与答案 问答题(100分): (问答题,共13道题目,第1题4分,第2题6分,第3题10分,第4题10分,第5题16分,第6题6分,第7题12分,第8题6分,第 ...

最新文章

  1. javascript间接实现前端非获取匹配,保留带某前缀的子串不执行替换
  2. 使用wordpress创建自己的博客
  3. MSSQL同时操作数据加锁问题
  4. python绘制分组条形图_python中分组值的条形图
  5. 【Qt】QBoxLayout类详解
  6. 深入解析ext2文件系统之mke2fs
  7. f5 会话保持 负载均衡_F5负载均衡配置-运维管理
  8. InnoDB原理篇:如何用好索引
  9. CV Code | 本周新出计算机视觉开源代码汇总(含实例分割、行人检测、姿态估计、神经架构搜索、超分辨率等)...
  10. java rsa padding_rsa加密--选择padding模式需要注意的问题。。。
  11. Bailian2815 城堡问题【DFS】
  12. python 字符串处理_python 数据清洗之字符串处理
  13. 第十三届蓝桥杯2022各组完整真题(可评测)
  14. QNX系统MfgTool烧写工具脚本说明
  15. win10系统禁用笔记本自带键盘的方法
  16. JavaScript 编程精解 中文第三版 十六、项目:平台游戏
  17. mysql排列组合实现_排列组合的实现
  18. “1+7+N”改革工作体系介绍
  19. 携程Java后台开发面经
  20. python:实现abbreviation缩写算法(附完整源码)

热门文章

  1. 什么是感受野 Receptive Field 感受野是什么意思
  2. [附源码]计算机毕业设计JAVA创意众筹网站
  3. 微信3.1.0.72逆向-微信3.1.0.72HOOK接口说明(WeChatHelper.dll)-发送文本 文件 图片 GIF表情消息
  4. 139家企业入选前程无忧2021年度中国雇主榜;帝亚吉欧投资5亿于中国兴建碳中和威士忌酒厂 | 美通社头条...
  5. 【Linux】Kdump部署实战,可适用(UOSA版、Centos、Redhat)
  6. 转行金融策略数据分析师:从萌新到职场老手的蜕变之旅
  7. QQ你可要小心了---微软发布MSN的升级版IM i‘m.....
  8. 使用feign发送http请求解析报错
  9. UNION ALL的使用
  10. Unity3D手游开发日记(5) - 适合移动平台的植被随风摆动