本教程在windows10环境下安装配置hadoop+hbase+spark。

一、下载压缩包:

1、JavaJDK,1.8以上。

2、Hadoop2.8.3,下载地址:http://archive.apache.org/dist/hadoop/core/

Hadoop2.8.3windows环境下的第三方包:winutils,

https://github.com/steveloughran/winutils,如果报nativeio异常,可以将此包解压至hadoop的bin目录下。

3、Spark2.2.0,下载地址:http://archive.apache.org/dist/spark/spark-2.2.0/

4、选择spark-2.2.0-bin-hadoop2.7点击下载。

二、安装配置

1、安装jdk并配置环境变量。

2、解压缩hadoop,配置环境变量。

右键单击我的电脑 –>属性 –>高级环境变量配置 –>高级选项卡 –>环境变量 –> 单击新建HADOOP_HOME,如下图

3、修改hadoop配置文件

1)修改core-site.xml配置文件,位置在hadoop目录下etc/hadoop/core-site.xml,添加如下配置:

fs.defaultFS

hdfs://localhost:9000

2)修改hdfs-site.xml配置文件,位置在hadoop目录下etc/hadoop/hdfs-site.xml,添加如下配置:

dfs.replication

1

dfs.namenode.name.dir

/E:/geotrellis/hadoop-2.8.3/data/dfs/namenode

dfs.datanode.data.dir

/E:/geotrellis/hadoop-2.8.3/data/dfs/datanode

注意value里的目录,我这里使用全路径配置。

根据上面的配置,在hadoop目录下创建namenode、datanode节点存储目录。如下:

3)重命名mapred-site.xml.template为mapred-site.xml,位置同上添加配置:

mapreduce.framework.name

yarn

4)配置yarn-site.xml,位置同上

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.aux-services.mapreduce.shuffle.class

org.apache.hadoop.mapred.ShuffleHandler

至此,hadoop配置完成,hdfs负责分布式存储,mapreduce负责分布式计算,yarn负责资源调度,基本的(伪)分布式环境初步建立。

三、测试使用

1、格式化namenode的hdfs目录

cmd命令下输入执行:hdfs namenode –format

2、启动hadoop,定位到sbin目录,如下输入

3、启动所有hadoop服务,输入start-all

这时候会弹出4个窗口,输入jps查看进程情况,如下:

输入:http://localhost:8088/ 查看hadoop的启动情况

4、测试和使用

1)创建hdfs的目录,如下:

Hadoop fs –mkdir /user

Hadoop fs –mkdir /user/input

2)上传文件

Hadoop fs –put e:/test.txt /user/input

Txt文本内容如下,输入:

Hadoop fs –cat /user/input/test.txt

3)词频计算

hadoop jar E:/geotrellis/hadoop-2.8.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.3.jar wordcount/user/input/ /user/output

4)查看运行结果,如下:

windows下hadoop的部署和使用相关推荐

  1. windows下hadoop安装时出现error Couldn‘t find a package.json file in “D:\\hadoop\hadoop-2.7.7\\sbin“问题

    windows下hadoop安装时启动yarn时出现error Couldn't find a package.json file问题 yarn run v1.22.0 error Couldn't ...

  2. windows下hadoop对lzo的支持

    windows下hadoop对lzo的支持 背景 下半年学习大数据,首当其冲,先学习了hadoop 学习hadoop的过程可谓是艰难重重 其中最麻烦的就是本地调式,写代码总会有bug,在网上也找到一些 ...

  3. Windows下安装自动化部署工具Fabric

    Windows下安装自动化部署工具Fabric 部署应用程序用FTP还是SCP还是rsync复制文件?如果你需要手动复制,用一次两次还行,一天如果部署50次不但慢.效率低,而且容易出错. 正确的部署方 ...

  4. Windows下Hadoop eclipse开发平台搭建

    搞了一个下午,在Linux和Windows下都成功了,步骤相差不大.一些小问题,google一下就能解决.但还是推荐在linux下搭建,很容易切稳定. 1.必要条件 Cygwin :我的版本是目前最新 ...

  5. IDEA :windows下Hadoop报错null\bin\winutils.exe

    1.美图 2.背景 在windows环境下hadoop或flink时,可能会出现如下异常: 2018-09-30 17:45:59,517 ERROR org.apache.hadoop.util.S ...

  6. windows下hadoop的单机伪分布式部署(3)

    下面介绍myeclipse与hadoop的集成. 我用的myeclipse版本是8.5. 1.安装hadoop开发插件 在hadoop1.2.1版本的安装包contrib/目录下,已经不再提供hado ...

  7. Windows下Hadoop的环境安装[转]

    1.下载并安装Cygwin,记得cygwin安装中要把SSH选择上,因为后面Hadoop会用到,不详述cygwin的安装过程.我是安装在D:\cygwin下 2.配置系统环境变量 在windows命令 ...

  8. Windows下的Nginx部署React项目及解决反向代理跨域问题等-20.8.1更新

    文章目录 1. 概述 2. 优点 3. 为什么选择Nginx 4. 下载 5. 安装 6. 配置参数详细说明 7. 命令行参数 7.1 启动nginx 7.2 重启nginx--重新加载配置 7.3 ...

  9. 基于Windows下使用Docker 部署Redis

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化. 1 去官网下载指定的版本 https:/ ...

最新文章

  1. 【CV】Pytorch一小时入门教程-代码详解
  2. 美国客户商城系统的校验JS脚本
  3. [shell]C语言调用shell脚本接口
  4. 深入浅出Fetch API
  5. OllyDbg笔记-暴力破解简单判断程序(TraceMe.exe与简单Qt程序)
  6. python 代码段的标志_Python代码类型标志
  7. 如何使用Visual Studio创建SQL Server数据库项目
  8. php网站模板怎么修改,自己做网站如何用好并自主修改网上的免费模板
  9. ftp文件传输协议的匿名用户、系统用户的实现详解过程
  10. 错误与异常_2-7选择题
  11. HandlerMethodArgumentResolver 参数解析器
  12. 微软小娜服务器,微软小娜正在继续被边缘化中:奇妙清单也不再支持小娜连接-...
  13. 分享124个PHP源码,总有一款适合您
  14. 微信小程序 (布局适配与物理逻辑像素)
  15. 高德坐标系转天地图坐标系(GCJ02转WGS坐标系)
  16. java cstring_CString 操作指南
  17. 本地安全策略命令行secedit设置本地账户安全策略
  18. VUE经典面试题2022年,面试常用题
  19. c4droid编译java_C4droid 的多文件编译
  20. 推荐系统冷启动问题的常见解决方案

热门文章

  1. 互联网盈利模式77种创新 【 很八股的标题,不过内容还是可以参考一下的 】
  2. 还在犹豫写不写博客吗?
  3. 大学328门专业课程标准英文翻译模板
  4. YY游戏云的AngularJS实践
  5. 美学心得(第二百二十四集)罗国正
  6. 手把手教你用Arcgis绘制地图【热力图】
  7. /etc/ssh/ssh_config line 59: Unsupported option “gssapiauthentication“
  8. 基于Docker搭建DzzOffice与OnlyOffice线上协同办公服务器
  9. 吉林银行2021年上半年经营成果丰硕
  10. 计算机硬盘能达到5g的速度,5G网络速度达到1G,但硬盘读写速度才几十兆,怎么办...