hadoop 安装/启动步骤中常见问题


Hadoop 2.x 命令及可执行文件目录的变化:
在1.x中,所有的命令文件,都是放在bin目录下,没有区分客户端和服务端命令,并且最终命令的执行都会调用hadoop去执行;而在2.x中将服务端使用的命令单独放到了sbin目录,其中有几个主要的变化:

  • 将./bin/hadoop的功能分离。在2.x中./bin/hadoop命令只保留了这些功能:客户端对文件系统的操作、执行Jar文件、远程拷贝、创建一个Hadoop压缩、为每个守护进程设置优先级及执行类文件,另外增加了一个检查本地hadoop及压缩库是否可用的功能,详情可以通过命令“hadoop -help”查看。
    而在1.x中,./bin/hadoop命令还包括:NameNode的管理、DataNode的管理、 TaskTracker及JobTracker的管理、服务端对文件系统的管理、文件系统的检查、获取队列 信息等,详情可以通过命令“hadoop -help”查看。
  • 增加./bin/hdfs命令。./bin/hadoop命令的功能被剥离了,并不是代表这些命令不需要了,而是将这些命令提到另外一个名为hdfs的命令中,通过hdfs命令可以对NameNode格式化及启动操作、启动datanode、启动集群平衡工具、从配置库中获取配置信息、获取用户所在组、执行DFS的管理客户端等,详细可以通过“hdfs -help”查看。
  • 增加./bin/yarn命令。原来1.x中对JobTracker及TaskTracker的管理,放到了新增的yarn命令中,该命令可以启动及管理ResourceManager、在每台slave上面都启一个NodeManager、执行一个JAR或CLASS文件、打印需要的classpath、打印应用程序报告或者杀死应用程序等、打印节点报告等,详情可以通过命令“yarn -help”查看。
  • 增加./bin/mapred命令。该命令可以用于执行一个基于管道的任务、计算MapReduce任务、获取队列的信息、独立启动任务历史服务、远程目录的递归拷贝、创建hadooop压缩包,详情可以通过“./mapred -help”。

参考资料:Hadoop入门进阶步步高(六)-Hadoop1.x与Hadoop2的区别


dfs.replication这个参数是个client参数(需要在每台datanode或client上设置)
默认值=3个副本已经够用了,设置越大越浪费存储空间
上传一个文件到hdfs://上时,当前dfs.replication指定的是几就会存储几份文件。即使以后你修改了dfs.replication的默认值,也对已经上传了的文件也不会起任何作用。另外,可以在上传文件的同时指定创建的副本数
$HADOOP_HOME/bin/hdfs dfs -D dfs.replication=1 -put 本地文件名 远端存储位置

参考资料:hadoop 的 dfs.replication 参数


hadoop 2.7 版及以上版本指定 namenode 主机地址时用到的 xml 变量是 fs.defaultFS (之前老版本用的是 fs.default.name):

<property><name>fs.defaultFS</name><value>hdfs://192.168.0.52:54310</value>
</property>

端口号由用户自行指定, 例如上面的端口号是54310

指定 secondary namenode 在哪台主机上运行用到的 xml 变量是:

<property><name>dfs.namenode.secondary.http-address</name><value>0.0.0.0:9868</value>
</property>

secondary 默认值是在运行start-dfs.sh脚本的主机上启动 secondary namenode. 其 web服务器运行在 9868(http) 或 9869(https)端口上.

各种参数默认值如下:

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/core-default.xml

http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/hdfs-default.xml


dfs.client.socket-timeout
默认值60秒(60000毫秒)


自己添加一个新的datanode,修改etc/hadoop/hdfs-site.xml时拼错了一个XML标签,导致从namenode端start-all.sh时启动不了。hadoop提示的错误信息却只说ssh exit with code 1,缺少详细提示不利于新手排查错误。


start-dfs.sh 错误提示信息 rcmd: socket: Permission denied

解决方法:
在/etc/pdsh/目录下面新建文件rcmd_default,写入ssh,然后回车,记得一定要输入一个回车符另起一行,不然会提示ssh exit with code 1

另外之前已经用 sudo apt-get install pdsh 安装 pdsh

配置 Hadoop 时遇到的一些问题相关推荐

  1. 配置hadoop时,Linux主机名称不要带有下划线

    Linux主机名称不要带有下划线啊,否则报ERRORorg.apache.hadoop.hdfs.server.namenode.NameNode: java.lang.IllegalArgument ...

  2. 配置hadoop集群一

    花了1天时间最终把环境搭建好了.整理了一下,希望对想学习hadoop的有所帮助. 资料下载:http://pan.baidu.com/s/1kTupgkn 包括了linux虚拟机.jdk, hadoo ...

  3. Linux中安装配置hadoop集群

    原文:http://www.cnblogs.com/lijingchn/p/5574476.html 一. 简介 参考了网上许多教程,最终把hadoop在ubuntu14.04中安装配置成功.下面就把 ...

  4. 配置HADOOP开发环境

    考虑到Windows平台尽管界面友好,但Hadoop环境配置较"怪异",需借助cygwin,这个过程并不优雅.正好我手上另有一套ubuntu环境,用着也很顺手,就在ubuntu中安 ...

  5. Hadoop的学习前奏(一)——在Linux上安装与配置Hadoop

    前言 笔者目前是在做Android开发,又是在一个信息安全的公司.公司的主要是做在虚拟机上运行的产品,又涉猎云计算,心想是要去搞一下云计算.自我感觉移动互联网 + 云计算 + 信息安全会是一个很好的方 ...

  6. redhat6.下安装配置hadoop环境--单实例版本

    redhat6.4下(用作hadoop master :记录所有数据分布情况--namenode)--安装单实例计算机 1.修改hostname [root@hadoop01 ]# vim /etc/ ...

  7. guava读取配置文件_使用Guava MapSplitters配置Hadoop

    guava读取配置文件 在本文中,我们将为通过Context对象将配置参数传递给Hadoop Mapper提供新的思路. 通常,我们在启动map-reduce作业时将配置参数设置为Context对象上 ...

  8. 使用Guava MapSplitters配置Hadoop

    在本文中,我们将为通过Context对象将配置参数传递给Hadoop Mapper提供新的思路. 通常,我们在启动map-reduce作业时将配置参数设置为Context对象上的键/值对. 然后,在M ...

  9. Hadoop入门进阶步步高(三-配置Hadoop

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 三.配置 ...

最新文章

  1. Flash Catalyst之乱盖
  2. 2016012075 谢月月 散列函数的应用及其安全性
  3. Starzhou:EOSIO1.0 版本环境搭建
  4. 《mongodb权威指南》学习
  5. BUUCTF firmware
  6. .net的label的背景如何设置成为透明_新一轮广告呈现方式变革,新橱窗广告,如何收割注意力经济?...
  7. linux远程升级运行程序,运用RedHat的Kickstart升级Linux系统方法
  8. ubuntu16.04安装gcc g++7.5.0及各个版本的切换
  9. tomcat 配置https安全认证协议报错解决方案
  10. Python获取同目录下json文件内容
  11. 《摄影测量学》空间后方交会详细解读
  12. 时间序列可预测性度量
  13. 为什么建网站需要服务器,建网站需不需要服务器
  14. 微型计算机原理DL,微机原理试题
  15. MATLAB打不开,选择licenses激活成功后还是要激活
  16. “神奇小子”于品海 再展零成本收购绝技
  17. 普林斯顿邓嘉学生亲述:一定要博士学位?不,我本科生也能在大厂当应用科学家...
  18. 基于51单片机的简易计算器proteus仿真 数码管显示
  19. JVm - Parallel Scavenge 垃圾回收器
  20. iOS开发-集成一网通支付

热门文章

  1. python竞赛试题及答案_【技术分享】用python解NOIP竞赛题
  2. new关键字执行过程
  3. 计算年龄案例(JS)
  4. JavaScript:数据的存储
  5. python等比例压缩图片_python(PIL)图像处理(等比例压缩、裁剪压缩) 缩略(水印)图详解...
  6. 201409-2-画图
  7. F8-Nginx代理缓存负载均衡后端均衡
  8. Linux命令解释之rpm
  9. 计算机网络期末复习资料
  10. 「管理数学基础」4.1 模糊数学:模糊现象与模糊集、隶属函数、模糊集的运算、水平截集与分解定理