总第130篇/张俊红

1.Spark介绍

Spark是一种通用的大数据计算框架,是基于RDD(弹性分布式数据集)的一种计算模型。那到底是什么,可能还不是太理解,通俗讲就是可以分布式处理大量极数据的,将大量集数据先拆分,分别进行计算,然后再将计算后的结果进行合并。

这一篇主要给大家分享如何在Windows上安装Spark。

2.Spark下载

我们要安装Spark,首先需要到Saprk官网去下载对应的安装包,Spark官网:http://spark.apache.org/downloads.html

第一步点击我红框框住的蓝色链接部分即可。

spark首页

操作了第一步以后会跳转到另一个页面,如下图所示,选择红框框住的部分进行下载,然后选择文件保存的路径进行保存即可。

spark下载页

我们需要把下图中的bin文件所在的路径设置到环境变量里面。

spark文件

3.Spark环境变量设置

第一步右键我的电脑,然后选择属性,就来到了下图这个界面。

step1

选择红框框住的高级系统系统设置,然后再点击环境变量。

step2

这里我们看到有两个path,一个是用户的环境变量,一个是系统的环境变量,这两个有啥区别呢?

系统的环境变量设置以后对所有登陆这个系统的所有用户都起作用,而用户环境变量只对这个用户起作用,我们一般设置系统环境变量,即系统用户变量里面的path。

先点击path部分把path行选中,然后再点击编辑。

step3

把bin (包含bin) 文件夹所在的路径添加到已有环境变量的后面,并用;隔开,然后点击确定,这样环境变量就配置成功。

step4

利用组合键Win+R调出cmd界面,输入spark-shell,得到如下界面:

error1

报错Missing Python executable Python是因为没有把Python添加到环境变量中,所以需要先把Python添加到环境变量中,添加方式和Spark添加方式是一样的,只需要找到你电脑中Python所在路径即可。

error2

把Python添加到环境变量以后,再次输入spark-shell,没有Python的报错了,但是还有Java not found的报错,所以我们需要在电脑上安装Java

4.Java下载安装

首先需要来到Java官网去下载对应的Java版本,Java官网:https://www.oracle.com/technetwork/java/javase/downloads/index.html

选择我红框框住的JDK DOWNLOAD,然后就会跳转到另一个页面。

java1

先点击小红框框住的Accept License Agreement,然后再点击下方对应的版本,这里我电脑是Windows 64bit,所以选择Windows x64即可。

java2

下载好以后是一个.exe文件,直接双击运行即可,等程序安装完成以后,同样需要把安装目录下的bin文件夹添加到环境变量,添加方式与spark添加方式一样。

jdk文件

这个时候再次输入sprak-shell就会得到下图中大大的一个spark图案,当你看到这个界面时,说明spark已经安装配置完成了。

success1

因为spark是由scala语言写的,所以spark原生就支持scala语言,所以你会看到scala>这个符号,scala语言中也有print方法,我们输入一个看看结果,得到我们想要的结果了,说明正式安装完成了。

get

5.PySpark安装

经过上面的步骤以后我们算是把spark已经成功安装到了我们的电脑中,但是spark默认是用的scala语言。如果我们想要用Python语言去写spark的话,而且只需要用Python语言的话,可以直接利用pyspark模块,不需要经过上面的spark下载和环境配置过程,但是同样需要java环境配置过程。pyspark模块安装的方法与其他模块一致,直接使用下述代码即可:

pip install pyspark

这里需要注意一点就是,如果你的python已经添加到环境变量了,那么就在系统自带的cmd界面运行pip。如果你是用的是Anaconda,且没有添加环境变量,那你就需要在Anaconda Promt中运行pip了。当pip安装成功以后,打开jupyter notebook输入:

import pyspark

如果没有报错,说明pyspark模块已经安装成功,可以开始使用啦。

教程-Spark安装与环境配置相关推荐

  1. 基于Linux的Spark安装与环境配置

    文章目录 基于Linux的Spark安装与环境配置 1.Hadoop测试 1.1 启动hadoop 1.2 再次启动hadoop 1.3 查看是否成功 2.Scala安装与配置 2.1 下载scala ...

  2. Laravel教程 一:安装及环境配置

    Laravel教程 一:安装及环境配置 此文章为原创文章,未经同意,禁止转载. Homestead 最近在SF上面看到越来越多的Laravel相关的问题,而作为一个Laravel的脑残粉,本来打算有机 ...

  3. python3.6安装教程-python3.6环境安装+pip环境配置教程图文详解

    1.python安装可以跨平台 2.有两个版本2.7和3.6,第三方库适用2.7版,两个版本不兼容 windows安装: 第一种方法官网安装: 在官网下载安装包如图: 图下点击是默认下载32位所以我们 ...

  4. python详细安装教程环境配置-python3.6环境安装+pip环境配置教程图文详解

    1.python安装可以跨平台 2.有两个版本2.7和3.6,第三方库适用2.7版,两个版本不兼容 windows安装: 第一种方法官网安装: 在官网下载安装包如图: 图下点击是默认下载32位所以我们 ...

  5. python3.6.0怎么安装pip_python3.6环境安装+pip环境配置教程图文详解

    1.python安装可以跨平台 2.有两个版本2.7和3.6,第三方库适用2.7版,两个版本不兼容 windows安装: 第一种方法官网安装: 在官网下载安装包如图: 图下点击是默认下载32位所以我们 ...

  6. centos配置occi环境变量_拓展学习-golang的下载、安装和环境配置教程

    由于国内众所周知的原因,我们是不能直接访问到golang官网的,因此下载go语言的安装包还需要另辟蹊径.下面我们以用国内的golang源来下载安装包为例,阐述golang的下载.安装和配置方法. go ...

  7. win8系统安装配置python_win8下python3.4安装和环境配置图文教程

    win8下python安装和环境配置,具体内容如下 python语法较C语言简单,容易上手. 具体步骤 1.本文采用的是win8.1 64位系统,安装python3.4. 2.先在python官网上下 ...

  8. Anaconda使用教程(一)——下载、安装及环境配置

    Windows系统Anaconda使用教程(一)--下载.安装及环境配置 文章目录 Windows系统Anaconda使用教程(一)--下载.安装及环境配置 1. 下载网址 方法1 方法2 2. 安装 ...

  9. JDK1.8.0_181安装以及环境配置教程(Win10系统)

    JDK1.8.0_181安装以及环境配置教程(Win10系统) 前言 如果大家是刚开始学习编程的话,建议使用jdk1.8版本,博主之前下载没有老师指导,上官网下载的最新版本,结果到公司实习,发现jdk ...

最新文章

  1. 咪咕盒子链接服务器失败_云服务器怎样备份数据库备份
  2. 霍山职业学校16届计算机学生,霍山职高(安徽霍山职业学校)
  3. php程序应用实例,PHP教程.应用实例1_php
  4. 【BZOJ】1823: [JSOI2010]满汉全席(2-sat)
  5. visual studio 2005,visual studio 2008调出即时窗口
  6. 企业的核心竞争力是什么
  7. Codeforces Round #733 (Div. 1 + Div. 2) E. Minimax 分情况讨论 + 思维
  8. 鼠标点击实现花瓣雨_每周实验 | 黄金雨
  9. python脚本加密_教你如何基于python实现脚本加密
  10. python运维开发_Python自动化运维开发----基础(一)
  11. List的三种遍历方式
  12. 曲线积分与曲面积分的计算机应用,曲线积分与曲面积分(解题方法归纳).doc
  13. VBA 收集 Word关键字批量处理-Excel版
  14. CSS实现简单的3D旋转魔方
  15. antd a-input-number 的基本使用
  16. 激光条纹中心提取——ZhangSuen法python
  17. UVA 10635 Prince and Princess
  18. 泛微E9 OA 二次开发创建流程
  19. 求解相邻比特数问题(DP)
  20. 轻轻松松背单词软件测试,MBA联考十佳背单词软件测评报告

热门文章

  1. 无状态mysql_既然HTTP是无状态协议,mysql_close还有必要么?
  2. 11- 深度学习之神经网络核心原理与算法-卷积核典型的CNN网络
  3. 过去一年25个amazing node.js 开源项目(2018版本)
  4. Cisco ASA防火墙基础
  5. .Net深入学习序列化和反序列化 (转)
  6. HttpClient的超时用法小记
  7. Python-----学了今天,忘了昨天.
  8. centos7 yum 安装lnmp
  9. 《3》CentOS7.0+OpenStack+kvm云平台部署—配置Glance
  10. linux和用户账户相关的系统文件