Hadoop安装教程 Mac版

一、JDK环境安装

1. 下载JDK1.8

Oracle官网下载JDK1.8版本
按照系统提示安装

2. 配置JDK环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_281.jdk/Contents/Home
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

二、Hadoop安装

1. 设置ssh免密码登录

因为Hadoop是分布式平台,需要多个机器之间协作,设置ssh免密码登录可以减少每次登陆主机输入密码的繁琐流程。

1) 在Mac的系统偏好设置–>共享中打开远程登录:
2) 在terminal中输入 ssh-keygen -t rsa ,生成rsa公钥,接下来一路按回车键或者输入y就行了:
3) 在terminal中输入 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys ,将公钥的内容写入到authorized_keys文件中。
4) 在terminal中输入 ssh localhost ,不需要密码也能登录,说明设置成功。

2. Hadoop下载与配置

1) 下载Hadoop

方法一:brew install hadoop
方法二:Hadoop官网下载
方法三:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)
Note:推荐使用方法三,并将Hadoop文件解压到 /Library/Hadoop 文件夹下,以达到和笔者配置相同的效果。

2) 配置Hadoop环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

HADOOP_HOME=/Library/Hadoop/hadoop-3.2.2
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

3) 修改Hadoop配置文件

打开 /Library/Hadoop/hadoop-3.2.2/etc/hadoop 文件夹:

a. 配置 core-site.xml 文件

<configuration><property><name>fs.defaultFS</name><value>hdfs://0.0.0.0:9000</value></property><!-- 指定hadoop运行时产生文件的存储路径 --><property><name>hadoop.tmp.dir</name><!-- 配置到hadoop目录下temp文件夹 --><value>/Library/Hadoop/hadoop-3.2.2/tmp</value></property>
</configuration>

b. 配置 hdfs-site.xml 文件

<configuration><property><!--指定hdfs保存数据副本的数量,包括自己,默认为3--><!--伪分布式模式,此值必须为1--><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><!-- name node 存放 name table 的目录 --><value>file:/Library/Hadoop/hadoop-3.2.2/tmp/hdfs/name</value></property><property><name>dfs.datanode.data.dir</name><!-- data node 存放数据 block 的目录 --><value>file:/Library/Hadoop/hadoop-3.2.2/tmp/hdfs/data</value></property><property><name>dfs.namenode.secondary.http-address</name><value>localhost:9001</value></property><property><name>dfs.webhdfs.enabled</name><value>true</value></property>
</configuration>

c. 配置 mapred-site.xml 文件

<configuration><property><!--指定mapreduce运行在yarn上--><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

d. 配置 yarn-site.xml 文件

<configuration><property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property><property><!--NodeManager获取数据的方式--><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.application.classpath</name><value>/Library/Hadoop/hadoop-3.2.2/etc/hadoop:/Library/Hadoop/hadoop-3.2.2/share/hadoop/common/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/common/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/hdfs:/Library/Hadoop/hadoop-3.2.2/share/hadoop/hdfs/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/hdfs/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/yarn:/Library/Hadoop/hadoop-3.2.2/share/hadoop/yarn/lib/*:/Library/Hadoop/hadoop-3.2.2/share/hadoop/yarn/*</value></property>
</configuration>

3. 启动Hadoop

1) 初始化

在terminal输入 hdfs namenode -format
(只初次启动需要)

2) 启动Hadoop集群

在terminal输入 start-all.sh (或者分别输入 start-dfs.shstart-yarn.sh
使用 jps (JavaVirtualMachineProcessStatus) 命令查看Hadoop是否已启动,运行的java进程中应包含以下几种:

4050 Jps
3956 NodeManager
3653 SecondaryNameNode
3414 NameNode
3852 ResourceManager
3518 DataNode

3) 查看NameNode和Yarn

访问 http://localhost:9870/dfshealth.html#tab-overview
访问 http://localhost:8088/cluster

4) 运行Hadoop自带的wordcount程序

a. 新建一个 word.txt 文件并输入几个单词
b. 在hdfs文件系统上创建input文件夹 hdfs dfs -mkdir /input
c. 将word.txt放入input文件夹 hdfs dfs -put words.txt /input
d. 查看是否已放入文件 hdfs dfs -ls /input
e. 运行wordcount程序 hadoop jar /Library/Hadoop/hadoop-3.2.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar wordcount /input /output
(Note:输出目录必须是一个不存在的目录,输出结果无法存放在已有目录中)
f. 查看程序输出 hdfs dfs -ls /output
g. 打开输出文件 hdfs dfs -cat /output/part-r-00000

5) 关闭Hadoop集群

在terminal输入 stop-all.sh

三、Spark安装

1. 安装Scala

1) 下载Scala

方法一:Scala官网下载
方法二:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)
将Scala文件解压,并移动到 /usr/local/scala 文件夹下

cd ~/Downloads/
tar -zxvf scala-2.12.13.tgz
mv scala-2.12.13 /usr/local/scala

2) 配置Scala环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

SCALA_HOME=/usr/local/scala
export PATH=$PATH:$SCALA_HOME/bin

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

2. 安装Spark

1) 下载Spark

方法一:brew install apache-spark
方法二:Spark官网下载
方法三:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)
Note:推荐使用方法三,并将Spark文件解压到 /Library/Hadoop 文件夹下,以达到和笔者配置相同的效果。

2) 配置Spark环境变量

在terminal中输入 vi ~/.bash_profile ,按 i 进入编辑模式:

SPARK_HOME=/Library/Hadoop/spark-3.1.1-bin-hadoop3.2
export PATH=$PATH:$SPARK_HOME/bin

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source ~/.bash_profile ,使配置的环境变量生效。

3) 修改Spark配置文件

3. 启动Spark

首先启动Hadoop集群 start-all.sh

1) 启动master

在terminal输入 cd $SPARK_HOME 进入Spark文件夹
./sbin/start-master.sh

访问 http://localhost:8080,获取master的URL信息。

2) 启动slave

复制上图红框圈出的URL,替换下面命令的URL部分(spark://—)
./sbin/start-worker.sh spark://—

3) 同时启动master和slave

使用以下命令可以同时启动master和slave
./sbin/start-all.sh
使用 jps 命令查看Spark是否已启动,运行的java进程中应包含以下几种:

3956 NodeManager
3653 SecondaryNameNode
3414 NameNode
7881 Jps
7819 Master
3852 ResourceManager
3518 DataNode
7871 Worker

4) 关闭Spark

./sbin/stop-all.sh

Hadoop安装教程 Mac版相关推荐

  1. 最新JAVA安装教程(Mac版)

    文章目录 一.下载JDK安装包 二.安装 注:只适用于非M1内核的苹果电脑 三.检查安装 四.友情链接 1.[最新JAVA安装教程(Win10版)](https://blog.csdn.net/wei ...

  2. mongodb安装教程-Mac版

    一.安装包下载(官网地址) https://www.mongodb.com/download-center 建议选择 4.x.xx以上的版本 二.环境变量配置 1.把解压后到安装包移动到/usr/lo ...

  3. Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    给力星 追逐内心的平和 首页 笔记 搜藏 代码 音乐 关于 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 2014-08-09 (updated: 2016 ...

  4. 最详细的Hadoop安装教程

    最详细的Hadoop安装教程 前言 Hadoop 在大数据技术体系中的地位至关重要,Hadoop 是大数据技术的基础,对Hadoop基础知识的掌握的扎实程度,会决定在大数据技术道路上走多远. 这是一篇 ...

  5. Python视频制作引擎Manim安装教程2021版(科学概念可视化)

    Python视频制作引擎Manim安装教程2021版 0 写在前面 1 效果展示 2 安装教程(Windows) 2.1 安装ffmpeg 2.2 安装Latex 2.3 安装dvisvgm 2.4 ...

  6. Hadoop安装教程_伪分布式配置-Ubuntu-CentOS6(究极详细、厦门大学数据库实验室)

    Hadoop安装教程_伪分布式配置_CentOS6.4/Hadoop2.6.0 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0(2.7.1)/Ubuntu14.04(16.04) 林 ...

  7. Visual Studio Code 安装教程2021版

    Visual Studio Code 安装教程2021版 下载Visual Studio Code 1:官网下载 2:网盘下载 开始安装 1:双击下载后的可执行文件,安装 2:勾选同意,然后点击下一步 ...

  8. DiscuzQ论坛的安装教程终极版

    DiscuzQ论坛的安装教程终极版 技术支持 QQ 7 3 5 6 6 0 2 4 8 准备: 1 . 一台轻量级服务器. 2 . 必须安装宝塔,还要选择 Nginx 环境. 3 . 一个域名. 4 ...

  9. mac系统如何安装oracle软件,Mac版怎么安装oracle Mac版安装oracle教程

    类型:Mac其他软件大小:86.3M语言:中文 评分:10.0 标签: 立即下载 Mac版怎么安装oracle?Mac版安装oracle教程.最近有使用Mac的用户询问小编Mac版怎么安装oracle ...

  10. hadoop安装详细步骤_推荐一个超详细的Hadoop安装教程,已有32万次阅读

    安装Hadoop软件系列,首选Linux系统,比如Ubuntu.如果你的系统是Windows,建议再安装一个Ubuntu,组成双系统,如此可以发挥各自系统的特点. 使用U盘制作一个系统,拿出一块分区用 ...

最新文章

  1. linux防火墙cc,Linux防火墙后面的Alljoyn服务(iptables)
  2. pyplot绘图标题错误处理
  3. 《物联网框架ServerSuperIO教程》- 23.动态数据接口增加缓存,提高数据输出到OPCServer和(实时)数据库的效率...
  4. [iphone-tabbar]如何自定义TabBarController
  5. Qt笔记-Linux程序打印带颜色的字符串
  6. PyG图神经网络框架学习--示例介绍
  7. 三套致富战略-教你成为百万富翁
  8. FILE类型指针的头文件
  9. Vue安装与IDE HBuilder安装(一分钟读懂)
  10. Rust 升级成微软第一梯队语言;“熊孩子”乱敲键盘攻破 Linux 桌面;500 个值得学习的 AI 开源项目| 开发者周刊...
  11. 数据结构(二)之二叉树
  12. 圈复杂度(Cyclomatic Complexity)-转
  13. LVM报错:resize2fs: Bad magic number in super-block
  14. 徐小凤将现身东方卫视跨年晚会 为63岁庆生
  15. vue中如何用npm下载less
  16. Python编程 | 颜色分类
  17. DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection翻译
  18. java svg png_java batik svg转png报错,球大神!!!在线等
  19. Ubuntu 下 LaTeX 图形环境的配置——使用Kile
  20. 关于ios XCode hangs at Attaching to (app name)

热门文章

  1. 小米路由器mini实现锐捷认证.
  2. 上海交大计算机基础高万萍老师怎么样,上海交通大学网络教育学院.ppt
  3. 群晖6.1安装php3.6_黑群晖 DSM6.1安装简明教程(附下载)
  4. 7.5日chinapub生日聚会
  5. 030_《Delphi COM深入编程》
  6. 计算机将图像数字化的原理,图像数字化
  7. 游戏编程之二 windows编程基础
  8. asp.net门诊收费管理系统案例
  9. Windows内核原理与实现之Windows研究内核(WRK)
  10. eXeScope之类的程序资源修改器的使用,很牛!