原因

随着互联网规模的爆发式增长,不断增加的数据量要求应用程序能够延伸到更大的集群中去计算
与单台机器计算不同,集群计算引发了几个关键问题,如
集群计算资源的共享
单点宕机(单点死机的意思)
节点执行缓慢
程序的并行化。针对这几个集群环境的问题,许多大数据处理框架应运而生。
比如Google的MapReduce,它提出了简单、通用并具有自动容错功能的批处理计算模型。但是MapReduce对于某些类型的计算并不适合,比如
交互式(对话的方式一问一答,相互的那种)
流式计算(对数据流进行实时计算)

基于这种类型需求的不一致性,大量不同于MapReduce的专门数据处理模型诞生了,如GraphLab、Impala、Storm等。大量数据模型的产生,引发的后果是对于大数据处理而言,针对不同类型的计算,通常需要一系列不同的处理框架才能完成。这些不同的处理框架由于天生的差异又带来了一系列问题:
重复计算、
使用范围的局限性、
资源分配、
统一管理
又出现了这些问题,spark诞生了
要注意这些问题,不同的时间段出现不同的问题,有不同的解决方法

为什么选择spark相关推荐

  1. Spark精华问答 | 为什么选择Spark作为流计算引擎?

    总的来说,Spark采用更先进的架构,使得灵活性.易用性.性能等方面都比Hadoop更有优势,有取代Hadoop的趋势,但其稳定性有待进一步提高.我总结,具体表现在如下几个方面. 1 Q:为什么选择K ...

  2. 个推 Spark实践教你绕过开发那些“坑”

    Spark作为一个开源数据处理框架,它在数据计算过程中把中间数据直接缓存到内存里,能大大地提高处理速度,特别是复杂的迭代计算.Spark主要包括SparkSQL,SparkStreaming,Spar ...

  3. spark on k8s:apache YuniKorn(Incubating)的助力

    背景 为什么选择spark on k8s Apache Spark 作为一站式平台统一了批处理,实时处理,流分析,机器学习,以及交互式查询.虽然说spark 提供了多样的使用场景,但是也带来了额外的复 ...

  4. 中国Spark技术峰会(上):Spark与生态圈中组件结合实战

    5月13日-15日,由全球最大中文IT社区CSDN主办的"2016中国云计算技术大会"(Cloud Computing Technology Conference 2016,简称C ...

  5. Spark 调研报告

    1.总结部分 什么是Spark? Spark是个通用的集群计算框架 Spark用来做什么? 分发数据,分发计算 Spark的主要应用领域? 机器学习,最优化算法 为什么选择Spark? Spark对迭 ...

  6. Spark Streaming 实时计算在甜橙金融监控系统中的应用、性能优化、任务监控

    1 写在前面 目前公司对实时性计算的需要及应用越来越多,本文选取了其中之一的 Spark Streaming 来介绍如何实现高吞吐量并具备容错机制的实时流应用.在甜橙金融监控系统项目中,需要对每天亿万 ...

  7. SegmentFault D-Day 北京:大数据

    很开心在这么冷的天和大家相聚在熟悉的 3W 咖啡聊大数据,感谢北京小伙伴踩着冰渣子来参加本场大数据为主题的 D-Day 活动.此次沙龙由 SegmentFault 家 Adele 主持,这一次选择了一 ...

  8. 大数据分析-考试复习

    Exam-整理 1. 选择题 设计分布式数据仓库Hive的数据表时,为取样更高效,一般可以对表中的连续字段进行分桶操作. 客户端首次查询HBase数据库时,首先需要从-ROOT-表开始查找. HBas ...

  9. 我们为什么选择Kubernetes

    [编者的话]这篇文章介绍了作者在选择容器编排工具过程中的一些总结和经验,各个编排工具的特性比较,以及自己团队为什么选择Kubernetes. 几个月前,我开始调研Docker容器的编排工具,例如一些可 ...

最新文章

  1. android 导入开源项目代码常见问题
  2. TCP/IP详解--学习笔记(2)-数据链路层
  3. spring入门详细教程(五)
  4. inode与ln命令
  5. IBASE save
  6. scale和java比较_浅谈java中BigDecimal的equals与compareTo的区别
  7. 【Kafka】Mac 环境 Kafka诡异问题之kafka eagle 界面无法访问
  8. jps出现– process information unavailable解决方法
  9. 将MfgTool工具改造为自己的烧写工具
  10. event.target
  11. ios沙盒机制与文件操作
  12. python最新技术开锁工具_Python 自动化库介绍 PySimpleGUI
  13. python结果按行输出_Python实现读取字符串按列分配后按行输出示例
  14. java中文解码_java中文转码解码
  15. 数学建模笔记(一):数学建模一般步骤
  16. WPS简历模板的图标怎么修改_最新8000套设计师面试作品集:模板+插画+海报+图标+简历...
  17. 2018 阿里 声学模型 语言模型
  18. 黑苹果系统--键盘设置(保持windows输入习惯)
  19. 基音周期计算(pitch tracking)
  20. OSChina 周一乱弹 ——强行把她拖到家里洗了个澡

热门文章

  1. 201312-2-ISBN号码
  2. 独家 | 一文读懂Adaboost
  3. 《R语言数据分析》——导读
  4. 【转载】Java NIO学习
  5. 前台html基础标签7.6
  6. 了解了这些才能开始发挥jQuery的威力
  7. java实时检测_JAVA 实时检测二进制流字符集
  8. 微博同步ValidatorException
  9. LeetCode-179:数组自动排序工具Arrays.sort(),比较器Comparator的正确打开方式
  10. Java客户端开发是什么_客户端桌面应用一般是用什么技术开发的?