大数据指数据与大数据技术这二者的综合,而大数据技术,是指伴随着大数据的采集、传输、处理和应用的相关技术,通过一系列非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的一系列数据处理和分析技术。

大数据关键技术的不同层面及其功能

数据采集

利用ETL工具将分布的、异构数据源中的数据抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础;也可以把实时采集的数据作为流计算系统的输入,进行实时处理分析。

数据存储和管理

利用分布式文件系统、数据仓库、关系数据库、NoSQL数据库、云数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理。

数据处理与分析

利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析;对分析结果进行可视化呈现,帮助人们更好地理解、分析数据。

数据安全和隐私保护

构建隐私保护体系和数据安全体系,保护个人隐私和数据安全。

大数据计算模式

批处理计算

针对大规模数据的批量处理。

MapReduce可以并行执行大规模数据处理任务,用于大规模数据集的并行运算(单输入、两阶段、粗粒度数据并行的分布式框架)。它将复杂的、运行于大规模集群上的并行计算过程高度抽象到了两个函数——Map和Reduce,并把一个大数据集切分成多个小数据集,分布到不同的机器上进行并行处理,极大地方便了分布式编程工作。在MapReduce中,数据流从一个稳定的来源,进行一系列加工处理后,流出到一个稳定的文件系统(如HDFS)。

Spark是一个针对超大数据集合的低延迟的集群分布式计算系统。它启用了内存分布数据集,可以提供交互式查询、优化迭代工作负载。在MapReduce中,数据流从一个稳定的来源,进行一系列加工处理后,流出到一个稳定的文件系统(如HDFS)。而Spark则用内存替代HDFS或本地磁盘来存储中间结果,因此要快很多。

流计算

流数据(或数据流)是指在时间分布和数量上无限的一系列动态数据集合体,数据的价值随着时间的流逝而降低,因此必须实时计算给出秒级响应。业内有许多流计算框架与平台:第一类,商业级流计算平台(IBM InfoSphere Streams、IBM StreamBase等);第二类,开源流计算框架(Twitter Storm、S4等);第三类,公司为支持自身业务开发的流计算框架。

图计算

如Pregel、Giraph、GraphX、PowerGraph等。

查询分析计算

针对超大规模数据的存储管理和查询分析,需要提供实时或准实时响应。如Dremel、Impala等。

大数据与云计算、物联网

大数据、物联网、云计算的关系

云计算

云计算的关键技术:虚拟化、分布式存储、分布式计算、多租户(数据隔离、客户化配置、架构扩展、性能定制)等。

物联网

物联网的技术架构:感知层、网络层、处理层、应用层。

物联网的关键技术:识别和感知技术、网络和通信技术、数据挖掘和融合技术。

三者之间的关系

1、区别。大数据侧重对海量数据的存储、处理、分析,发现价值,服务生活;云计算本质旨在整合和优化各种IT资源并通过网络以服务的方式,廉价地提供给用户;物联网的发展目标是实现物物相连,应用创新是物联网发展的核心。

2、联系。如上图所示,三者彼此渗透、相互融合。

大数据关键技术、及计算模式介绍,以及大数据与云计算、物联网的关系相关推荐

  1. 海洋大数据关键技术及在灾害天气下船舶行为预测上的应用

    海洋大数据关键技术及在灾害天气下船舶行为预测上的应用 王冬海,卢峰,方晓蓉,郭刚 中电科海洋信息技术研究院有限公司,北京 100041 摘要:随着海洋数据量的爆炸式增长,海洋大数据受到越来越多的关注. ...

  2. 营销大数据分析 关键技术_营销分析的3个最关键技能

    营销大数据分析 关键技术 Perhaps more than any other field, marketing, especially digital marketing, revolves al ...

  3. 大数据处理关键技术主要有五种,具体指的是什么?

    大数据技术 ,就是从各种类型的数据中快速获得有价值信息的技术. 大数据 领域已经涌现出了大量新的技术,它们成为大数据采集.存储.处理和呈现的有力武器.大数据处理关键技术一般包括:大数据采集.大数据预处 ...

  4. 【CSWS2014 Summer School】大数据下的游戏营销模式革新-邓大付

    大数据下的游戏营销模式革新 邓大付博士腾讯专家工程师 Bio:毕业于华中科技大学,现任腾讯IEG运营部数据中心技术副总监,负责腾讯游戏的数据挖掘相关工作,包括有用户画像,推荐系统,基础算法研究等.主要 ...

  5. url采集工具_大数据关键技术浅谈之大数据采集

    在前几篇文章中,企通查为大家介绍了大数据处理的基本流程.从大数据的一系列处理过程中(抽取.集成.分析.解释),我们可以发现这一整套流程中涵盖了数据存储.处理.应用等多方面的技术. 大数据价值的完美体现 ...

  6. 02云计算与大数据学习之大数据关键技术与应用

    文章目录 1.应知应会 2.大数据总体框架 架构设计原则 总体架构特点 3.大数据存储技术 4.大数据处理技术 大数据处理模式 大数据处理Storm平台 5.大数据分析技术 大数据分析特点 大数据分析 ...

  7. 大数据关键技术——MapReduce

    传统的数据采集来源单一,且存储.管理和分析数据量也相对较小,大多采用关系型数据库和并行数据仓库即可处理,并且数据处理方法是以处理器为中心,处理的大多是结构化数据. 随着互联网的发展,数据来源日渐丰富且 ...

  8. 02云计算与大数据学习之大数据关键技术与应用习题

    一.选择题 以下是大数据技术架构的特点的是(  ). A.集成性  B.架构先进性  C.实时性  D.以上都是 大数据分析的理论核心是(  ). A.数据挖掘算法  B.聚类算法  C.统计分析算法 ...

  9. 星星之火-52:6G十大领域关键技术

    目录 1 6G超宽带通信系统的网络架构 2 6G超宽带通信系统的软件架构 3 太赫兹通信技术 4 6G 信道仿真技术及射线跟踪 5 超大带宽与全频谱协作 6 轨道角动量调制技术 7 宽带太赫兹硬件元器 ...

最新文章

  1. MySQL中述职类型的长度问题
  2. android shape 自定义,Android自定义shape的使用
  3. 计算机图形学论文_论图计算
  4. C 语言结构体引用,引用 C 语言结构体学习
  5. go set up on ubuntu
  6. 有关UITableviewCell 重用内存 内部解析
  7. 计算机视觉论文-2021-07-27
  8. 软件测试思维总结(1)-----比较思维:利用好可参照的资源
  9. Python之计算机算法基础总结(借鉴、整理)、排序算法、查找算法
  10. python sys库
  11. 10个Excel最经典的小技巧,关键时能救急!
  12. 常微分方程求解器ODE solver
  13. IM即时通讯聊天软件1.0
  14. 简单的python程序实现99乘法口诀表
  15. Java面试题大全带答案 40道
  16. win10家庭版解决“管理员已阻止你运行此应用”
  17. Centos系统下搭建Smokeping 方法
  18. linux dd iso 进度,linux小记:查看dd进度
  19. 在Ubuntu 16.04中安装Google拼音
  20. Matlab图像分割---使用dice相似系数方法进行图像分割精度验证

热门文章

  1. 8口短信猫设备配送开发包短信猫软件
  2. Powerpoint文档大量文字排版技巧年终总结ppt模板
  3. 浏览器被2345主页劫持
  4. 【杂记】万用表测试三极管
  5. 同时查询圆通多个快递物流,并分析派件时效
  6. 10-207 在订单表中查询运费在40元到60元之间的订单的全部信息
  7. 基于扩散模型的文本引导图像生成算法
  8. 华为pppoe拨号配置
  9. java dsa 私钥_DSA算法——本质上和RSA是一样的 有公钥和私钥
  10. Axure RP实例教程:组合弹出菜单效果