文章目录

  • 前言
  • 一、Spark的安装
  • 总结

前言

基于Hadoop的Spark超快安装


一、Spark的安装

待Hadoop安装好之后,我们再开始安装Spark。

我选择的是Spark 2.4.8 版本,选择package type为"Pre-built with user-provided Apache Hadoop",这个包类型,简单配置后可以应用到任意Hadoop版本。

复制链接到迅雷下载。

官网下载链接:https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.4.8/spark-2.4.8-bin-without-hadoop.tgz

把下载好的Spark拖进虚拟机。(安装了Vmware Tools可以直接从主机拖进虚拟机,上一篇博客有说明)

解压安装包至路径 /usr/local,执行如下命令:

sudo tar -zxf ~/Desktop/spark-2.4.8-bin-without-hadoop.tgz -C /usr/local/
cd /usr/local
sudo mv ./spark-2.4.8-bin-without-hadoop/ ./spark   #更改文件夹名
sudo chown -R hadoop ./spark               #此处的hadoop为系统用户名

注意:此处-R后面是自己的系统用户名,我的用户名是smallsa。

配置Spark的classpath。

cd /usr/local/spark
cp ./conf/spark-env.sh.template ./conf/spark-env.sh  #拷贝配置文件

编辑该配置文件,在文件最后面加上如下一行内容:

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

保存配置文件后,就可以启动、运行Spark了。

若需要使用HDFS中的文件,则在使用Spark前需要启动Hadoop。

执行如下命令配置路径:

sudo vi ~/.bashrc

在文件最上面加上下面的内容:

export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.7-src.zip:
$PYTHONPATH
export PYSPARK_PYTHON=python3

执行如下命令更新以下:

source ~/.bashrc

因为是基于Hadoop,所以我们先启动Hadoop,再启动Spark。可以看到Hadoop和Spark都启动成功了。

运行pyspark



总结

基于Hadoop的Spark超快安装相关推荐

  1. 基于Hadoop和Spark体系的大数据分析平台构建

    谢谢分享! 转载:http://www.sohu.com/a/249271561_481409 随着大数据.人工智能等技术的快速发展,企业对大数据平台的需求越来越强烈,通过大数据分析技术为企业提供经营 ...

  2. 《大数据基础——基于Hadoop与Spark》课后习题——第一章部分答案

    仅用于我个人的学习.书籍为人民邮电出版社的<大数据技术基础--基于Hadoop与Spark>.课后习题选择是我个人认为有用的.记录下来是为了督促我学习:) 共好 1.请指出以下术语的基本含 ...

  3. 基于hadoop搭建Spark环境

    基于hadoop搭建Spark环境 需要准备的东西 1. 准备一个配置好的hadoop,master虚拟机 2. 下载下面的三个文件 3. jdk-8u181-linux-x64.tar.gz 4. ...

  4. Python中WordCloud库超快安装方法

    大家好我是冈坂日川,今天和大家分享一下怎么快速安装wordcloud库,我也是为了它吃了不少苦呀,因此写成笔记,希望不要有人和我一样踩坑,希望今天的分享能给你带来帮助. 安装wordcloud的几种方 ...

  5. linux spark单节点环境搭建,Linux下基于Hadoop的Spark1.2单机安装

    一,安装环境 硬件:虚拟机 操作系统:Centos 6.4 64位 IP:10.51.121.10 主机名:datanode-4 安装用户:root Hadoop:Hadoop2.6,Hadoop2. ...

  6. 量化派基于Hadoop、Spark、Storm的大数据风控架构--转

    原文地址:http://www.csdn.net/article/2015-10-06/2825849 量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品"信用钱包 ...

  7. win10下基于wsl-Ubuntu 的LAMMPS超便捷安装

    前言 本文为学习过程中第一次进行总结和编撰,诸多问题详略不当还望谅解.如此拙见,若有幸相助,那必是荣幸之至. 简介 本次安装是基于Manual,使用win10下Ubuntu子系统中,apt应用商店的扩 ...

  8. 基于Hadoop安装spark集群

    基于Hadoop的spark环境搭建 已有环境情况 Hadoop HA Java 软件版本 Hadoop 2.7.2 Java 1.8.0_301 Scala 2.11.8 Spark 2.1.0 下 ...

  9. 产品迭代更新 | 阿列夫科技基于Linkis+DataSphere Studio的单机安装部署实战

    作者:萧寒 GitHub ID :hx23840 阿列夫科技原来的技术平台是基于 Hadoop,Spark 平台搭建的,为了充分的满足业务需求,做了大量接口封装.但是随着业务发展,现有技术平台日渐满足 ...

最新文章

  1. C#获得文件版本信息及只读文件的删除
  2. 「GNN,简直太烂了」,一位Reddit网友的深度分析火了
  3. Android操作系统2.0制作备份
  4. nodejs mysql 连接池初始化_nodejs之mysql连接池
  5. vscode 调试_如何使用VSCode调试JS?
  6. JavaScript 中 obj.hasOwnProperty(prop) 方法
  7. 黑马C++设计模式1
  8. [vue] 说说vue的优缺点
  9. Jeecg社区wiki在开放,终于可以在线看文档啦!!!
  10. (23)css3文字阴影text-shadow
  11. Mock生成随机数据常用的类型规则
  12. PMP试题 | 每日一练,快速提分 9.8
  13. 苹果台式机怎么设置我的电脑计算机,台式苹果电脑自己怎样做系统
  14. 推荐一款基于.Net Core开发简约漂亮的 WPF UI库
  15. ThinkPHP在前台模板格式化输出时间
  16. 计算机基础中的word2010,计算机基础word2010上机操作 - 图文
  17. 构建者模式和抽象工厂模式的结合使用
  18. antd输入框禁止回车
  19. bailian.openjudge 2712:细菌繁殖
  20. 商业模式新生代_免费商业模式——《商业模式新生代》读书笔记之五

热门文章

  1. QTP的那些事--终极项目脚本设计思路及其测试查询功能的一些实际项目体会
  2. Android中Service的启动方式及Activity与Service的通信方式
  3. cordova使用Gradle构建下载maven太慢,使用阿里云镜像
  4. flashback_transaction_query查询权限
  5. 牛人整理分享的面试知识:操作系统、计算机网络、设计模式、Linux编程,数据结构总结...
  6. ocp 043 第十三章:管理资源
  7. Excel 不能直接打开文件的解决方法
  8. 当session失效后,无论点击那个页面,都找到顶端页面,跳到登录页面。
  9. 做个高颜值的优秀按钮,用 CSS3 实现社交按钮动画
  10. 玩游戏也能学Python?!论Python的正确打开方式