Spark体系架构

zhuangzai

Spark体系架构包括如下三个主要组件:

  • 数据存储
  • API
  • 管理框架

接下来让我们详细了解一下这些组件。

数据存储:

Spark用HDFS文件系统存储数据。它可用于存储任何兼容于Hadoop的数据源,包括HDFS,HBase,Cassandra等。

API

利用API,应用开发者可以用标准的API接口创建基于Spark的应用。Spark提供Scala,Java和Python三种程序设计语言的API。

下面是三种语言Spark API的网站链接。

  • Scala API
  • Java
  • Python

资源管理:

Spark既可以部署在一个单独的服务器也可以部署在像Mesos或YARN这样的分布式计算框架之上。

下图2展示了Spark体系架构模型中的各个组件。

图2 Spark体系架构

大数据 -- Spark相关推荐

  1. 2016年大数据Spark“蘑菇云”行动代码学习之AdClickedStreamingStats模块分析

    2016年大数据Spark"蘑菇云"行动代码学习之AdClickedStreamingStats模块分析     系统背景:用户使用终端设备(IPAD.手机.浏览器)等登录系统,系 ...

  2. 光环大数据spark文档_推荐大数据Spark必读书目

    我有一个非常要好的同事,无数次帮我解决了业务上的痛.技术能力很强,业务方面也精通.而且更耐得住加班,并且是自愿加班,毫无怨言.不像我,6点到准时走人了.但就是这么一位兢兢业业的技术人,却一直没有升职加 ...

  3. 大数据|Spark技术在京东智能供应链预测的应用案例深度剖析(一)

    大数据|Spark技术在京东智能供应链预测的应用案例深度剖析(一) 2017-03-27 11:58  浏览次数:148 1. 背景 前段时间京东公开了面向第二个十二年的战略规划,表示京东将全面走向技 ...

  4. 推荐大数据Spark必读书目

    点击蓝色"有关SQL"关注我哟 加个"星标",天天与10000人一起快乐成长 我有一个非常要好的同事,无数次帮我解决了业务上的痛.技术能力很强,业务方面也精通. ...

  5. 大数据Spark超经典视频链接全集

    论坛贴吧等信息发布参考模板 Scala.Spark史上最全面.最详细.最彻底的一整套视频全集(特别是机器学习.Spark Core解密.Spark性能优化.Spark面试宝典.Spark项目案例等). ...

  6. 大数据Spark入门案例5–统计广告点击数量排行Top3(scala版本)

    大数据Spark入门案例5–统计每广告点击数量排行Top3(scala版本) 1 数据准备 链接:https://pan.baidu.com/s/1afzmL-hNsAJl1_gx_dH2ag 提取码 ...

  7. 大数据Spark企业级实战与Hadoop实战PDF和PPT

    今天给大家分享的是<大数据Spark企业级实战>与<Hadoop实战><大数据处理系统·Hadoop源代码情景分析><50个大厂大数据算法教程>等销量排 ...

  8. 大数据Spark实战视频教程-张长志-专题视频课程

    大数据Spark实战视频教程-33364人已学习 课程介绍         大数据Spark实战视频培训教程:本课程内容涉及,Spark虚拟机安装.Spark表配置.平台搭建.快学Scala入门.Sp ...

  9. 大数据Spark企业级实战 PDF 下载 和目录

    大数据Spark企业级实战  PDF完整版 下载地址 http://download.csdn.net/detail/laoge/9504794 基本信息 书名:大数据Spark企业级实战 定价:12 ...

  10. 大数据Spark “蘑菇云”行动第103课:Hive源码大师之路第一步:Hive源码思考和解析初体验

    大数据Spark "蘑菇云"行动第103课:Hive源码大师之路第一步:Hive源码思考和解析初体验 老师上课使用的Hive源码下载地址:http://www-eu.apache. ...

最新文章

  1. SharePoint 2010/SharePoint 2013 Custom Action: 基于Site Collection 滚动文字的通知.
  2. php168为什么抛弃重新开发x1,在今天518这个特别的日子里,我们经过将近一年来,日以继夜努力研发出的X1正式对外公开发布!...
  3. 140303 命令行选项 ccf
  4. 马斯克宣布:半年后发布定制AI芯片,特斯拉车主免费升级Hardware 3
  5. 解决“远程会话已断开连接,因为访问被拒绝导致许可证存储的创建失败,请使用提升的权限运行远程桌面客户端”问题
  6. 【信息系统项目管理师】第2章-信息系统项目管理基础 知识点详细整理
  7. Servlet3.0之八:基于Servlet3.0的文件上传@MultipartConfig
  8. ModelSim 2019安装教程
  9. 英伟达显卡不同架构_求历代英伟达显卡架构名称
  10. 小程序开发——比较好看的登录界面设计
  11. 算法设计 分治法 快速排序 C语言实现
  12. 计算机与网络如何连接网络设置,电脑网络连接网络配置方法
  13. Amigo---Android hotfix terminator
  14. 三维实时云渲染平台解决方案
  15. Verilog中$finish、$stop的使用与区别
  16. 从猎豹到山狮-苹果操作系统热衷于猫科动物代号
  17. 2019中国区块链开发者大会 | Conflux 伍鸣:性能问题仍是区块链的应用阻碍
  18. 业聚医疗在港交所上市:市值约76亿港元,钱永勋、刘桂祯夫妇控股
  19. 识破面试官的套路:十个典型的面试问题剖析
  20. JAVA面向对象的思维导图

热门文章

  1. python图像加坐标_Python使用matplotlib模块绘制图像并设置标题与坐标轴等信息示例...
  2. java session使用_Java互联网架构-高负载集群架构如何解决session一致性问题
  3. 有没有词匹配算法_整站关键词SEO的匹配优化方法
  4. js模块化编程之彻底弄懂CommonJS和AMD/CMD
  5. MySQL数据库常用的操作命令(二)
  6. oracle左裁剪原理,深入原理:分区剪裁特性剖析
  7. 深入理解Java泛型
  8. java中来获取UUID
  9. iOS学习笔记11 多线程入门
  10. Mac Apache ZooKeeper 配置