Hadoop 的配置有些麻烦,目前没有一键配置的功能,虽然当时我在安装过程中也参考了有关教程,但还是遇到了很多坑,一些老版本的安装过程已不适用于 hadoop2.x,下面就介绍一下具体步骤。


安装 Java

因为之后使用 Hadoop 需要运行 jar 包,所以 Java 环境是必须的,这里不作赘述,相信大多数学习 Hadoop 的小伙伴计算机上都早已经搭好 Java 环境。


下载 Hadoop 源码

点击 这里 ,有所有的历史版本。本教程以 hadoop-2.8.2 为例,下载 hadoop-2.8.2.tar.gz即可。下载完成后,解压到本地合适的目录下。


添加 Hadoop 环境变量

在 .bash_profile 文件中配置 Hadoop 的环境变量,使用 vim 打开该文件,在终端运行如下命令打开文件:

vim ~/.bash_profile

进入编辑模式后添加以下两行代码(修改成自己机子上的路径):

export HADOOP_HOME=/Users/Cyan/coding/hadoop/hadoop-2.8.2
export PATH=$PATH:$HADOOP_HOME/bin

退出编辑模式,使用 :wq 保存修改,然后运行 source 命令使文件中的修改立即生效:

#source ~/.bash_profile

在终端执行命令:

hadoop version

结果如下,说明 hadoop 路径配置好了:

添加好了环境变量,下面就是修改一些相关配置文件。


修改 Hadoop 的配置文件

需要修改的 Hadoop 配置文件都在目录 etc/hadoop 下,包括:

  • hadoop-env.sh
  • core-site.xml
  • hdfs-site.xml
  • mapred-site.xml
  • yarn-site.xml

下面我们逐步进行配置:

1. 修改 hadoop-env.sh 文件

直接设置 JAVA_HOME 的路径,不要用$JAVA_HOME 代替,因为 Hadoop 对系统变量的支持不是很好。修改下面两个路径(用你机子上的 JAVA 路径和 Hadoop 目录的路径代替):

export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_151.jdk/Contents/Home
export HADOOP_CONF_DIR=/Users/Cyan/coding/hadoop/hadoop-2.8.2/etc/hadoop

2. 修改 core-site.xml 文件

设置 Hadoop 的临时目录和文件系统,localhost:9000 表示本地主机。如果使用远程主机,要用相应的 IP 地址来代替,填写远程主机的域名,则需要到 /etc/hosts 文件中做 DNS 映射。在 core-site.xml 文件里作如下配置:

<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property><!--用来指定hadoop运行时产生文件的存放目录  自己创建--><property><name>hadoop.tmp.dir</name><value>/Users/Cyan/coding/hadoop/hadoop-2.8.2/tmp</value></property>
</configuration>

3. 修改 hdfs-site.xml 文件

hdfs-site.xml 的配置修改如下,注意 name 和 data 的路径都要替换成本地的路径:

<configuration><property><name>dfs.replication</name><value>1</value></property><!--不是root用户也可以写文件到hdfs--><property><name>dfs.permissions</name><value>false</value>    <!--关闭防火墙--></property><!--把路径换成本地的name坐在位置--><property><name>dfs.namenode.name.dir</name><value>/home/hadoop/cdh4/hadoop/dfs/name</value></property><!--在本地新建一个存放hadoop数据的文件夹,然后将路径在这里配置一下--><property><name>dfs.datanode.data.dir</name><value>/data1/hadoop</value></property>
</configuration>

4. 修改 mapred-site.xml 文件

由于根目录下 etc/hadoop 中没有 mapred-site.xml 文件,所以需要创建该文件。但是目录中提供了 mapred-site.xml.template 模版文件。我们将其重命名为 mapred-site.xml,然后将 yarn 设置成数据处理框架:

<configuration><property><!--指定mapreduce运行在yarn上--><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration

5. 修改 yarn-site.xml 文件

配置数据的处理框架 yarn:

<configuration><!-- Site specific YARN configuration properties --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.resourcemanager.address</name><value>localhost:9000</value></property>
</configuration>

至此需要修改和配置的文件都已经没有问题了。


启动 Hadoop

1. 启动 NameNode

在终端运行命令:

hadoop namenode -format

结果如下就是成功了:

2. 启动 HDFS

在终端首先进入 /sbin 目录:

cd /Users/Cyan/coding/hadoop/hadoop-2.8.2/sbin

然后启动 HDFS:

./start-dfs.sh

如果成功了,过程中需要输三次密码。

如果报错 “connection refused”,则需要在计算机系统设置中打开远程登录许可。

点击 Sharing(共享):

勾选 Remote Login(远程登录),然后添加当前用户:

这样就会解决 connection 的问题,如果还有其他错误,请检查路径添加的版本和本机的版本是否匹配。

3. 启动 yarn

在终端首先进入 /sbin 目录:

cd /Users/Cyan/coding/hadoop/hadoop-2.8.2/sbin

然后启动 yarn:

./ start-yarn.sh

在终端执行:

jps

结果如下,证明 Hadoop 可以成功启动:

我们也可以在浏览器中打开 http://localhost:50070/ 来查看 Hadoop 的启动情况:


Hadoop 的安装启动就完成啦!接下来就可以通过一些 shell 命令来操作 Hadoop 下的文件了,例如:

hadoop fs -ls /        查看根目录下的文件及文件夹
hadoop fs -mkdir /test      在根目录下创建一个文件夹 testdata
hadoop fs -rm /.../...      移除某个文件
hadoop fs -rmr /...         移除某个空的文件夹

欢迎关注我的知乎专栏【数据池塘】,专注于分享机器学习、数据挖掘干货:https://zhuanlan.zhihu.com/datapool

⬇️ 扫描下方二维码关注公众号【数据池塘】 ⬇️

回复【算法】,获取最全面的机器学习算法网络图:

Mac OS X 上搭建 Hadoop 开发环境指南相关推荐

  1. hadoop启动_Mac OS X 上搭建 Hadoop 开发环境指南

    Hadoop 的配置有些麻烦,目前没有一键配置的功能,虽然当时我在安装过程中也参考了有关教程,但还是遇到了很多坑,一些老版本的安装过程已不适用于 hadoop2.x,下面就介绍一下具体步骤. 安装 J ...

  2. nodejs mac java home_Mac上搭建nodejs开发环境

    ###Mac上搭建nodejs开发环境 ####安装homebrew 1 2 3ruby -e "$(curl -fsSL https://raw.githubusercontent.com ...

  3. 如何在Mac os X上搭建本地服务器环境

    之前苦于mac上搭建本地服务器之艰辛,找寻好久都没找到一款类似windows上集成的本地服务器环境,诸如phpstudy,xampp,appserv,虽说xampp也有mac版,但不知为何不是Apac ...

  4. java 工程新建ivy文件_Hadoop学习之路(八)在eclispe上搭建Hadoop开发环境

    一.添加插件 将hadoop-eclipse-plugin-2.7.5.jar放入eclipse的plugins文件夹中 二.在Windows上安装Hadoop2.7.5 版本最好与Linux集群中的 ...

  5. Raspberry Pi 4B(4GB版)上搭建Donkeycar开发环境

    在树莓派上搭建Donkeycar开发环境 在树莓派上搭建Donkeycar开发环境 1 系统安装与SSH配置 2 更新系统 3 配置树莓派 4 安装依赖包 5 安装Python的虚拟环境 6 安装 D ...

  6. 在CentOS 6.2上搭建vim开发环境

    在CentOS 6.2上搭建vim开发环境 最后更新日期:2013-07-05 1.首先使用Ubuntu(所在ip为192.168.16.230)翻墙登陆http://www.vim.org/,下载其 ...

  7. ubuntu16.04上搭建stm32f4开发环境

    ubuntu16.04上搭建stm32f4开发环境 工程源码的地址 https://github.com/txson/ubuntu-stm32 欢迎大家参与修改 搭建交叉编译环境 stm32 属于ar ...

  8. 我的Go+语言初体验——iPad上搭建Go+开发环境(ish版)

    目录 欢迎来到用iPad来学习Go+之旅 一.在 iPad 安装 Go+ 前的准备 1. iSH Shell 的作用 2. 安装 iSH Shell 3. 在 iSH 里安装一些常用软件 apk 命令 ...

  9. 在Windows上搭建Rust开发环境——Clion篇

    文章目录 在Windows上搭建Rust开发环境--Clion篇 安装mingw64 安装Rust hello world 安装Clion 使用Clion创建并调试项目 在Windows上搭建Rust ...

最新文章

  1. java unsafe cas_Java Unsafe CAS 小试
  2. 阿里云云原生应用平台总经理丁宇:“连接、合作、赋能”,携手加速器伙伴助力企业云上创新
  3. 官网,一套代码如何运行多端?
  4. 给NavigationCtrl 增强动画.
  5. 【SpringBoot】Spring项目中value注解,@Value不能够读取到配置文件的值,无法成功注入值的问题汇总及解决
  6. android shape 圆角百分比,Android shape显示圆角问题
  7. DOM 元素以及内容的增删改
  8. 黑洞效果的粒子背景效果
  9. struts2 中 constant标签
  10. jenkins 编译java_Jenkins 通过 maven 构建编译 JAVA 项目环境
  11. java 获取本机ip地址吗_java 获取本机ip地址
  12. CSR8670项目实战:BlueSiri轻智能蓝牙音箱
  13. 国外服务器有什么作用,网站放在国外服务器好吗?有什么优势?
  14. .netcore入门2:深入理解.NET Core的基元: deps.json, runtimeconfig.json, dll文件
  15. 基于Matlab的数字水印设计
  16. 桌面运维常见问题解决办法②
  17. 设计模式之 策略模式
  18. 如何自己开发一个Android APP(3)——XML和Android
  19. SES2000 Standard 水深处理过程记录
  20. discuz db_mysql.calss.php_刚发现得好东西!discuz 7.0 db_mysql.php 详解

热门文章

  1. 利用lz78编码实现对某字符序列的二元压缩_多媒体笔记(1):文件压缩的原理...
  2. python 画线置顶_绘制分支[置顶] python学习~递归函数
  3. 三维振镜原理_展商专访 | 先临三维与易加三维联合携多款精品及新品亮相2020年TCT亚洲展...
  4. delphi 关闭时缩小到托盘_如何正确地缩小毛孔?
  5. 怎么查看页面跳转过程_fastcapture注册码怎么获取?FastStone注册码分享
  6. junetxtdb.class.php,PHP-site
  7. java 做猜数字小游戏_Java Properties类:利用Properties类制作猜数字小游戏
  8. LeetCode Convert Sorted List to Binary Search Tree 解题报告
  9. 不要再使用JS框架了
  10. ssh scp不用输入密码