一:介绍

1.Spark的模式

  Local:本地运行模式,主要用于开发、测试
  Standalone:使用Spark自带的资源管理框架运行Spark程序,30%左右
  Yarn: 将spark应用程序运行在yarn上,绝大多数使用情况,60%左右,因为已经有了一个hadoop框架,就不再再搭建standalone框架了
  Mesos:

二:Local模式安装

1.解压

  使用自己编译产生的tgz压缩包。

  

2.建立软连接

  

3.复制配置文件

  

4.修改env.sh文件

  

三:运行测试

1.启动HDFS

  

2.准备测试路径

  

3.开始测试  

  ./run-example SparkPi 10<----------------10代表迭代的次数

  

4.shell的测试

  

5.shell效果

  

四:问题(HDFS问啥要启动的问题)

1.HDFS启动的原因

  如果不启动HDFS,在./spark-shell的时候会出现错误。

  

2.不启动HDFS会出现的问题

  

3.下面的配置是真正的spark local,不再需要考虑hadoop

  

4.启动./spark-shell

  没有其他服务。

  

  可以成功启动。

  

五:页面

1.程序示例

  这个是后来的补充。

1 sc.textFile("/user/beifeng/mapreduce/wordcount/input/wc.input").
2 filter(_.length>0).
3 flatMap(_.split(" ").map((_,1))).
4 groupByKey().
5 map(tuple=>(tuple._1,tuple._2.toList.sum)).
6 collect()

2.4040端口可以访问

  

  点进去:

  

  

004 Spark中的local模式的配置以及测试相关推荐

  1. 9.cuBLAS开发指南中文版--cuBLAS中的原子模式的配置

    cuBLAS中的原子模式的配置 2.4.20. cublasSetAtomicsMode() cublasStatus_t cublasSetAtomicsMode(cublasHandlet han ...

  2. Spark 中 JVM 内存使用及配置详情、spark报错与调优、Spark内存溢出OOM异常

    一般在我们开发spark程序的时候,从代码开发到上线以及后期的维护中,在整个过程中都需要涉及到调优的问题,即一开始需要考虑如何把代码写的更简洁高效调优(即代码优化),待开发测试完成后,提交任务时综合考 ...

  3. Spark中的内存计算是什么?

    由于计算的融合只发生在 Stages 内部,而 Shuffle 是切割 Stages 的边界,因此一旦发生 Shuffle,内存计算的代码融合就会中断. 在 Spark 中,内存计算有两层含义: 第一 ...

  4. spark中local模式与cluster模式使用场景_Spark 知识点 ( 架构 RDD Task )

    1. Spark介绍 Apache Spark是一个围绕速度.易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一 ...

  5. spark中local模式与cluster模式使用场景_不可不知的Spark调优点

    不可不知的Spark调优点​mp.weixin.qq.com 在利用Spark处理数据时,如果数据量不大,那么Spark的默认配置基本就能满足实际的业务场景.但是当数据量大的时候,就需要做一定的参数配 ...

  6. Intellij IDEA开发环境搭建,scala配置及打包,jar包在spark中的运行

    1. Intellij IDEA 开发环境搭建 最近在学习scala,除需要编写scala程序外,同时还需要创建maven工程,打成Jar包,而Eclipse在这方面显得使用的不是那么方面,同时由于I ...

  7. Spark的Local模式及案例

    Spark的Local模式及案例 基本概念 Local模式搭建 1. 解压缩文件 2.修改文件名 启动 Local 环境 WordCount案例 1.添加文件 2.执行命令 3.结果截图 测试Spar ...

  8. 在local模式下的spark程序打包到集群上运行

    一.前期准备 前期的环境准备,在Linux系统下要有Hadoop系统,spark伪分布式或者分布式,具体的教程可以查阅我的这两篇博客: Hadoop2.0伪分布式平台环境搭建 Spark2.4.0伪分 ...

  9. Eclipse中使用Hadoop集群模式开发配置及简单程序示例(Windows下)

    Hadoop入门配置系列博客目录一览 1. Eclipse中使用Hadoop伪分布模式开发配置及简单程序示例(Linux下) 2. 使用Hadoop命令行执行jar包详解(生成jar.将文件上传到df ...

最新文章

  1. win7能用的matlab,win7环境下使用matlab7.0(R14)方法
  2. 操作系统学习2:操作系统的发展和概览
  3. nginx 认证多个客户端的问题
  4. 如何成为数据型产品经理
  5. Tree Cutting POJ - 2378(树形DP)
  6. 【POJ - 1273】Drainage Ditches(网络流,最大流,模板)
  7. 【Clickhouse】Too many partitions for single INSERT block (more than 100)
  8. 酷炫可视化+强于excel的结合体!超高效的表格工具,不用可惜
  9. 关于二叉树,你该了解这些!
  10. 斜杠“/”与反斜杠“\”的区别
  11. Keil——导出代码的PDF文件
  12. VB窗体控件设计登录注册页面
  13. 用计算机看手机照片大小,手机怎么知道照片多少k
  14. java4android网易云_仿照网易云音乐界面 android特效
  15. 多少秒算长镜头_什么是长镜头画面(电影里的长镜头有哪些分类)
  16. 打印菱形图案用java如何做_Java打印出菱形图案
  17. 13.第十四章.文档和配置管理
  18. 所谓框架到底是什么?
  19. 警惕“电子发票”邮件,多家企业中招
  20. Django_Django组成_基本响应与部署

热门文章

  1. CISCO路由器、交换机密码恢复
  2. struts 标签导入
  3. shell编程入门步步高(二、基础概念)
  4. oracle表中一个字段内容导出到磁盘上
  5. Atlassian 域名被曝一次点击账户接管漏洞 可导致供应链攻击
  6. 我发现Facebook Messenger漏洞可使安卓用户互相监听,获奖6万美元
  7. [2019.3.21]洛谷P3640 [APIO2013]出题人
  8. QuickBI助你成为分析师-仪表板钻取的实现
  9. 控制器(下) -运维笔记
  10. 代码重构之旅(一) 项目结构