Local模式
Local模式就是运行在一台计算机上的模式,通常就是用于在本机上练手和测试。它可以通过以下集中方式设置master。

local: 所有计算都运行在一个线程当中,没有任何并行计算,通常我们在本机执行一些测试代码,或者练手,就用这种模式。
local[K]: 指定使用几个线程来运行计算,比如local[4]就是运行4个worker线程。通常我们的cpu有几个core,就指定几个线程,最大化利用cpu的计算能力
local[*]: 这种模式直接帮你按照cpu最多cores来设置线程数了。
使用示例:

/bin/spark-submit
–cluster cluster_name
–master local[*]

总而言之这几种local模式都是运行在本地的单机版模式,通常用于练手和测试,而实际的大规模计算就需要下面要介绍的cluster模式。
cluster模式
cluster模式肯定就是运行很多机器上了,但是它又分为以下三种模式,区别在于谁去管理资源调度。(说白了,就好像后勤管家,哪里需要资源,后勤管家要负责调度这些资源)

standalone模式
这种模式下,Spark会自己负责资源的管理调度。它将cluster中的机器分为master机器和worker机器,master通常就一个,可以简单的理解为那个后勤管家,worker就是负责干计算任务活的苦劳力。具体怎么配置可以参考Spark Standalone Mode
使用standalone模式示例:

/bin/spark-submit
–cluster cluster_name
–master spark://host:port

–master就是指定master那台机器的地址和端口,我想这也正是–master参数名称的由来吧。

mesos模式
这里就很好理解了,如果使用mesos来管理资源调度,自然就应该用mesos模式了,示例如下:

/bin/spark-submit
–cluster cluster_name
–master mesos://host:port

yarn模式
同样,如果采用yarn来管理资源调度,就应该用yarn模式,由于很多时候我们需要和mapreduce使用同一个集群,所以都采用Yarn来管理资源调度,这也是生产环境大多采用yarn模式的原因。yarn模式又分为yarn cluster模式和yarn client模式:

yarn cluster: 这个就是生产环境常用的模式,所有的资源调度和计算都在集群环境上运行。
yarn client: 这个是说Spark Driver和ApplicationMaster进程均在本机运行,而计算任务在cluster上。
使用示例:

/bin/spark-submit
–cluster cluster_name
–master yarn-cluster

spark 部署方式相关推荐

  1. 【原创】大数据基础之Spark(9)spark部署方式yarn/mesos

    1 下载解压 https://spark.apache.org/downloads.html $ wget http://mirrors.shu.edu.cn/apache/spark/spark-2 ...

  2. Apache Spark探秘:三种分布式部署方式比较

    2019独角兽企业重金招聘Python工程师标准>>> 目前Apache Spark支持三种分布式部署方式,分别是standalone.spark on mesos和 spark o ...

  3. spark on yarn 完全分布式_Apache Spark探秘:三种分布式部署方式比较

    [本文详细介绍了Spark的三种部署方式及其比较,欢迎读者朋友们阅读.转发和收藏!] 目前Apache Spark支持三种分布式部署方式,分别是 standalone . spark on mesos ...

  4. 分布式部署_Apache Spark探秘:三种分布式部署方式比较

    [本文详细介绍了Spark的三种部署方式及其比较,欢迎读者朋友们阅读.转发和收藏!] 目前Apache Spark支持三种分布式部署方式,分别是 standalone . spark on mesos ...

  5. Spark源码分析:多种部署方式之间的区别与联系

    作者:过往记忆 从官方的文档我们可以知道, Spark 的部署方式有很多种:local.Standalone.Mesos.YARN-..不同部署方式的后台处理进程是不一样的,但是如果我们从代码的角度来 ...

  6. Spark支持三种分布式部署方式

    目前Apache Spark支持三种分布式部署方式,分别是standalone.spark on mesos和 spark on YARN,其中,第一种类似于MapReduce 1.0所采用的模式,内 ...

  7. Spark的三种分布式部署方式

    目前Apache Spark支持三种分布式部署方式,分别是standalone.spark on mesos和 spark on YARN,其中,第一种类似于MapReduce 1.0所采用的模式,内 ...

  8. Spark三种部署方式

    目前Apache Spark支持三种分布式部署方式,分别是standalone.spark on mesos和 spark on YARN,其中,第一种类似于MapReduce 1.0所采用的模式,内 ...

  9. Apache Spark学习:将Spark部署到Hadoop 2.2.0上

    本文介绍的是如何将Apache Spark部署到Hadoop 2.2.0上,如果你们的Hadoop是其他版本,比如CDH4,可直接参考官方说明操作. 需要注意两点:(1)使用的Hadoop必须是2.0 ...

  10. Spark 部署及示例代码讲解

    Spark 部署 考虑到读者可能使用"ssh secure shell"这样的工具登陆 Linux,所以解释一下如何设置工具支持中文. 如何设置 ssh secure shell ...

最新文章

  1. python爬取站长素材网页图片保存到ppt中
  2. Flask and Ajax Post HTTP/1.1 400
  3. 理解数据成员指针、函数成员指针
  4. js基础-字符串常用属性合集
  5. WordCount代码详解
  6. MySQL主从复制(Centos6.3MySQL5.6)
  7. java 代码scope注解_Spring学习(15)--- 基于Java类的配置Bean 之 @Bean @Scope 注解
  8. 38 SD配置-销售凭证设置-定义拒绝原因
  9. Symmetric Tree (101)
  10. 如何将origin pro的界面切换变成中文显示?
  11. linux软件版本管理命令update-alternatives使用详解
  12. 计算机网络共享无访问权限,Win7局域网访问WIN7共享文件夹提示无访问权限的多种解决方法...
  13. 仓储rfid文件_物联网RFID标签的四大主流应用场景
  14. 中国 2017 Google 开发者大会来了!
  15. 搜狗二季度财报解读:有扎实的现在,也有性感的未来
  16. 浅析STM32H7 FDCAN(二)
  17. 易贝按关键字搜索EBAY商品 API 返回值说明
  18. 关于window.scroll系列方法汇总 滚动到指定元素位置
  19. **没有规则可以创建“XXX”需要的目标“XXX”问题的解决方案
  20. 中国私有云企业大排名,OpenStack企业占70%

热门文章

  1. 操作系统复习笔记(三)
  2. POJ 2287 田忌赛马 贪心算法
  3. linux文件管理命令详解
  4. 在ios中制作3d文字球效果
  5. 最热web前端技术精粹
  6. Java AJAX开发系列 - 5,ZK参考资料
  7. 完全独立与IIS的后门
  8. [置顶] 【cocos2d-x入门实战】微信飞机大战之六:子弹层的处理
  9. Xcode中查看宏在预处理阶段的展开
  10. 课堂对Complex类运算符重载的小练习