文章目录

  • 1.1 大数据时代
  • 1.2 大数据概念
  • 1.3 大数据的影响
  • 1.4 大数据的应用
  • 1.5 大数据关键技术
  • 1.6 大数据计算模式
  • 1.7 大数据产业
  • 1.8 大数据与云计算、物联网的关系

1.1 大数据时代

根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革



根据Gartner发布的《2019年全球首席信息官议程调查报告》,企业IT发展分成三个阶段:IT工匠时代、IT工业化时代、IT数字化时代,当前已进入数字化时代。

1.2 大数据概念


• 数据量大
根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)
人类在最近两年产生的数据量相当于之前产生的全部数据量
预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍

• 数据类型繁多
大数据是由结构化和非结构化数据组成的
– 10%的结构化数据,存储在数据库中
– 90%的非结构化数据,它们与人类信息密切相关
科学研究
–基因组
–LHC 加速器
–地球与空间探测
企业应用
–Email、文档、文件
–应用日志
–交易记录
Web 1.0数据
–文本
–图像
–视频
Web 2.0数据
–微信微博
–查询日志/点击流
–Twitter/ Blog / SNS
–Wiki

• 处理速度快
从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少
1秒定律:这一点也是和传统的数据挖掘技术有着本质的不同

• 价值密度低,商业价值高
以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒,但是具有很高的商业价值

1.3 大数据的影响

图灵奖获得者、著名数据库专家Jim Gray 博士观察并总结人类自古以来,在科学研究上,先后历经了实验、理论、计算和数据四种范式

• 在思维方式方面,大数据完全颠覆了传统的思维方式:
– 全样而非抽样
– 效率而非精确
– 相关而非因果
• 在社会发展方面,大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现
• 在就业市场方面,大数据的兴起使得数据科学家成为热门职业
• 在人才培养方面,大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制

1.4 大数据的应用

大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都已经融入了大数据的印迹

1.5 大数据关键技术

大数据技术的不同层面及其功能
两大核心技术

1.6 大数据计算模式

大数据计算模式及其代表产品

1.7 大数据产业

• 大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合

1.8 大数据与云计算、物联网的关系

• 云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者相辅相成,既有联系又有区别
• 云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源

• 云计算关键技术包括:虚拟化、分布式存储、分布式计算、多租户等

• 云计算数据中心是一整套复杂的设施,包括刀片服务器、宽带网络连接、环境控制设备、监控设备以及各种安全装置等
• 数据中心是云计算的重要载体,为云计算提供计算、存储、带宽等各种硬件资源,为各种平台和应用提供运行支撑环境
• 全国各地推进数据中心建设
• 云计算产业作为战略性新兴产业,近些年得到了迅速发展,形成了成熟的产业链结构,产业涵盖硬件与设备制造、基础设施运营、软件与解决方案供应商、基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、终端设备、云安全、云计算交付/咨询/认证等环节

• 物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化和远程管理控制

• 物联网中的关键技术包括识别和感知技术(二维码、RFID、传感器等)、网络与通信技术、数据挖掘与融合技术等
• 物联网已经广泛应用于智能交通、智慧医疗、智能家居、环保监测、智能安防、智能物流、智能电网、智慧农业、智能工业等领域,对国民经济与社会发展起到了重要的推动作用

• 完整的物联网产业链主要包括核心感应器件提供商、感知层末端设备提供商、网络提供商、软件与行业解决方案提供商、系统集成商、运营及服务提供商等六大环节

• 云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者既有区别又有联系

小结
• 本章介绍了大数据技术的发展历程,并指出信息科技的不断进步为大数据时代提供了技术支撑,数据产生方式的变革促成了大数据时代的来临
• 大数据具有数据量大、数据类型繁多、处理速度快、价值密度低等特点,统称“4V”。大数据对科学研究、思维方式、社会发展、就业市场和人才培养等方面,都产生了重要的影响,深刻理解大数据的这些影响,有助于我们更好把握学习和应用大数据的方向
• 大数据在金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都得到了日益广泛的应用,深刻地改变着我们的社会生产和日常生活
• 大数据并非单一的数据或技术,而是数据和大数据技术的综合体。大数据技术主要包括数据采集、数据存储和管理、数据处理与分析、数据安全和隐私保护等几个层面的内容
• 大数据产业包括IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层和数据应用层,在不同层面,都已经形成了一批引领市场的技术和企业
• 本章最后介绍了云计算和物联网的概念和关键技术,并阐述了大数据、云计算和物联网三者之间的区别与联系

大数据技术基础笔记1 大数据概述相关推荐

  1. 大数据技术基础_网易大数据体系之时序数据技术

    分享嘉宾:范欣欣 网易大数据技术专家 编辑整理:王吉东 内容来源:AI科学前沿大会 出品社区:DataFun 注:欢迎转载,转载请注明出处. 本次分享内容: 时序数据平台主要业务场景 时序数据平台体系 ...

  2. 大数据技术基础笔记3 分布式文件系统HDFS

    文章目录 3.1 分布式文件系统 3.2 HDFS简介 3.3 HDFS相关概念 3.4 HDFS体系结构 3.5 HDFS存储原理 3.6 HDFS数据读写过程 3.7 HDFS编程实践 3.1 分 ...

  3. 大数据技术基础实验十三:Kafka实验——订阅推送示例

    大数据技术基础实验十三:Kafka实验--订阅推送示例 文章目录 大数据技术基础实验十三:Kafka实验--订阅推送示例 一.前言 二.实验目的 三.实验要求 四.实验原理 1.Kafka简介 2.K ...

  4. 大数据技术基础实验三:HDFS实验——部署HDFS

    大数据技术基础实验三:HDFS实验--部署HDFS 文章目录 大数据技术基础实验三:HDFS实验--部署HDFS 一.前言 二.实验要求 三.实验原理 1.什么是HDFS? 2.HDFS的体系结构 3 ...

  5. 大数据技术基础综合项目——牛客网招聘岗位统计分析

    大数据技术基础综合项目--牛客网招聘岗位统计分析 文章目录 大数据技术基础综合项目--牛客网招聘岗位统计分析 零.实验环境说明 一.数据集来源及说明 二.数据预处理阶段 2.1 删除空行的数据 2.2 ...

  6. 从大数据技术参考模型角度梳理大数据标准

    大数据标准化背景 面对目前数量.速度和多样性日益增长的信息资产,大数据技术通过各种解决方案.体系.结构.工具和平台集合,能有效应对大数据场景. 因为数据是大数据的基础,对于大数据标准化,除了继承数据标 ...

  7. 大数据技术原理与应用——大数据存储与管理

    大数据技术原理与应用--大数据存储与管理 1.分布式文件系统 (1)计算机集群结构 集群的概念 集群是指将多台服务器整合在一起,每台服务器都实现相同的业务,做相同的事情. 每台服务器并不是缺一不可,它 ...

  8. 5000字 大数据时代读书笔记_大数据时代读书笔记

    大数据时代读书笔记 [篇一:大数据时代读书笔记] 大数据时代 -- 读书笔记 一.引论 1. 大数据时代的三个转变: 1. 可以分析更多的数据,处理和某个现象相关的所有数据,而不是 随机采样 2. 不 ...

  9. 大数据技术介绍:01大数据概述

    大数据技术介绍:01大数据概述 大数据技术框架: Hadoop生态系统(1) Hadoop生态系统(2) Hadoop构成:Flume(非结构化数据收集): Cloudera开源的日志收集系统 用于非 ...

最新文章

  1. 2019/1/14,15 Python今日收获
  2. C++的简单文本IO
  3. 面试造飞机系列:volatile面试的连环追击,你还好吗?
  4. C++ 成员函数做友元
  5. java lwjgl3_java-LWJGL 3鼠标移动
  6. php 数组 json字段去不全,json_encode – PHP给出了不完整的json字符串
  7. python基础系列教程——Python的安装与测试:python解释器、PyDev编辑器、pycharm编译器
  8. matplotlib中文乱码的两种解决方案
  9. 数据库查询之内连接,左连接,右连接
  10. android 仿QQ相册
  11. kettle启动 carte服务部署
  12. 交互设计书单--西南交大课程推荐
  13. 评价模型-TOPSIS法
  14. 上海矽昌通信技术有限公司自研路由芯片
  15. 2022前端笔试面试题
  16. Linux命令之diff命令
  17. matlab怎么看fit文件,FIT文件格式解析及MATLAB读取程序
  18. CAD软件中坐标Z轴归零问题的两种解决办法
  19. IoT黑板报:腾讯推出世界最强人脸识别 准确率99.8%
  20. 分享142个ASP源码,总有一款适合您

热门文章

  1. Linux安装Anaconda教程
  2. ReadLock和WriteLock(读写锁)
  3. # cajviewer的 linux折腾和吐槽
  4. SDU-PTA项目中JWT的使用
  5. 2021流行词“私域流量”
  6. SM4、AES,RSA,DES等加解密,以及一些其他常用工具方法整理
  7. 推荐三个国内图片素材网站!有这三个就够了!
  8. codeblocks下载安装及快捷键
  9. Ansys-结构动力学分析-圆柱斜齿轮模态分析学习心得
  10. Shadows name * from outer scope