基于Hadoop的Spark超快安装
文章目录
- 前言
- 一、Spark的安装
- 总结
前言
基于Hadoop的Spark超快安装
一、Spark的安装
待Hadoop安装好之后,我们再开始安装Spark。
我选择的是Spark 2.4.8 版本,选择package type为"Pre-built with user-provided Apache Hadoop",这个包类型,简单配置后可以应用到任意Hadoop版本。
复制链接到迅雷下载。
官网下载链接:https://mirrors.tuna.tsinghua.edu.cn/apache/spark/spark-2.4.8/spark-2.4.8-bin-without-hadoop.tgz
把下载好的Spark拖进虚拟机。(安装了Vmware Tools可以直接从主机拖进虚拟机,上一篇博客有说明)
解压安装包至路径 /usr/local,执行如下命令:
sudo tar -zxf ~/Desktop/spark-2.4.8-bin-without-hadoop.tgz -C /usr/local/
cd /usr/local
sudo mv ./spark-2.4.8-bin-without-hadoop/ ./spark #更改文件夹名
sudo chown -R hadoop ./spark #此处的hadoop为系统用户名
注意:此处-R后面是自己的系统用户名,我的用户名是smallsa。
配置Spark的classpath。
cd /usr/local/spark
cp ./conf/spark-env.sh.template ./conf/spark-env.sh #拷贝配置文件
编辑该配置文件,在文件最后面加上如下一行内容:
export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)
保存配置文件后,就可以启动、运行Spark了。
若需要使用HDFS中的文件,则在使用Spark前需要启动Hadoop。
执行如下命令配置路径:
sudo vi ~/.bashrc
在文件最上面加上下面的内容:
export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.7-src.zip:
$PYTHONPATH
export PYSPARK_PYTHON=python3
执行如下命令更新以下:
source ~/.bashrc
因为是基于Hadoop,所以我们先启动Hadoop,再启动Spark。可以看到Hadoop和Spark都启动成功了。
运行pyspark
总结
基于Hadoop的Spark超快安装相关推荐
- 基于Hadoop和Spark体系的大数据分析平台构建
谢谢分享! 转载:http://www.sohu.com/a/249271561_481409 随着大数据.人工智能等技术的快速发展,企业对大数据平台的需求越来越强烈,通过大数据分析技术为企业提供经营 ...
- 《大数据基础——基于Hadoop与Spark》课后习题——第一章部分答案
仅用于我个人的学习.书籍为人民邮电出版社的<大数据技术基础--基于Hadoop与Spark>.课后习题选择是我个人认为有用的.记录下来是为了督促我学习:) 共好 1.请指出以下术语的基本含 ...
- 基于hadoop搭建Spark环境
基于hadoop搭建Spark环境 需要准备的东西 1. 准备一个配置好的hadoop,master虚拟机 2. 下载下面的三个文件 3. jdk-8u181-linux-x64.tar.gz 4. ...
- Python中WordCloud库超快安装方法
大家好我是冈坂日川,今天和大家分享一下怎么快速安装wordcloud库,我也是为了它吃了不少苦呀,因此写成笔记,希望不要有人和我一样踩坑,希望今天的分享能给你带来帮助. 安装wordcloud的几种方 ...
- linux spark单节点环境搭建,Linux下基于Hadoop的Spark1.2单机安装
一,安装环境 硬件:虚拟机 操作系统:Centos 6.4 64位 IP:10.51.121.10 主机名:datanode-4 安装用户:root Hadoop:Hadoop2.6,Hadoop2. ...
- 量化派基于Hadoop、Spark、Storm的大数据风控架构--转
原文地址:http://www.csdn.net/article/2015-10-06/2825849 量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品"信用钱包 ...
- win10下基于wsl-Ubuntu 的LAMMPS超便捷安装
前言 本文为学习过程中第一次进行总结和编撰,诸多问题详略不当还望谅解.如此拙见,若有幸相助,那必是荣幸之至. 简介 本次安装是基于Manual,使用win10下Ubuntu子系统中,apt应用商店的扩 ...
- 基于Hadoop安装spark集群
基于Hadoop的spark环境搭建 已有环境情况 Hadoop HA Java 软件版本 Hadoop 2.7.2 Java 1.8.0_301 Scala 2.11.8 Spark 2.1.0 下 ...
- 产品迭代更新 | 阿列夫科技基于Linkis+DataSphere Studio的单机安装部署实战
作者:萧寒 GitHub ID :hx23840 阿列夫科技原来的技术平台是基于 Hadoop,Spark 平台搭建的,为了充分的满足业务需求,做了大量接口封装.但是随着业务发展,现有技术平台日渐满足 ...
最新文章
- C#获得文件版本信息及只读文件的删除
- 「GNN,简直太烂了」,一位Reddit网友的深度分析火了
- Android操作系统2.0制作备份
- nodejs mysql 连接池初始化_nodejs之mysql连接池
- vscode 调试_如何使用VSCode调试JS?
- JavaScript 中 obj.hasOwnProperty(prop) 方法
- 黑马C++设计模式1
- [vue] 说说vue的优缺点
- Jeecg社区wiki在开放,终于可以在线看文档啦!!!
- (23)css3文字阴影text-shadow
- Mock生成随机数据常用的类型规则
- PMP试题 | 每日一练,快速提分 9.8
- 苹果台式机怎么设置我的电脑计算机,台式苹果电脑自己怎样做系统
- 推荐一款基于.Net Core开发简约漂亮的 WPF UI库
- ThinkPHP在前台模板格式化输出时间
- 计算机基础中的word2010,计算机基础word2010上机操作 - 图文
- 构建者模式和抽象工厂模式的结合使用
- antd输入框禁止回车
- bailian.openjudge 2712:细菌繁殖
- 商业模式新生代_免费商业模式——《商业模式新生代》读书笔记之五
热门文章
- QTP的那些事--终极项目脚本设计思路及其测试查询功能的一些实际项目体会
- Android中Service的启动方式及Activity与Service的通信方式
- cordova使用Gradle构建下载maven太慢,使用阿里云镜像
- flashback_transaction_query查询权限
- 牛人整理分享的面试知识:操作系统、计算机网络、设计模式、Linux编程,数据结构总结...
- ocp 043 第十三章:管理资源
- Excel 不能直接打开文件的解决方法
- 当session失效后,无论点击那个页面,都找到顶端页面,跳到登录页面。
- 做个高颜值的优秀按钮,用 CSS3 实现社交按钮动画
- 玩游戏也能学Python?!论Python的正确打开方式