1:下载

本来想传到csdn上的,但是最大只支持70M的文件,还是网上找吧

2:解压在C:\cygwin\hadoop

3:配置

hadoop/conf下需要配置的文件:
1.hadoop-env.sh

修改JDK的路径 export JAVA_HOME

# Set Hadoop-specific environment variables here.
# The only required environment variable is JAVA_HOME.  All others are
# optional.  When running a distributed configuration it is best to
# set JAVA_HOME in this file, so that it is correctly defined on
# remote nodes.
# The java implementation to use.  Required.
export JAVA_HOME=/cygdrive/d/java/Tomcat6/jdk
# Extra Java CLASSPATH elements.  Optional.
# export HADOOP_CLASSPATH=

2.core-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

3.hdfs-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
<description>
The actual number of replications can be specified when the file is created.
</description>
</property>
</configuration>

<value>1</value> 该变量意思是文件系统中文件的复本数量。在单独的一个数据节点上运行时,HDFS无法将块复制到三个数据节点上。

4.mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
<description>NameNode</description>
</property>
</configuration>

4:启动Hadoop

第一步,在hadoop目录下创建目录logs,用于保存日志
第二步,Format a new distributed-filesystem: 格式化namenode,创建HDFS
执行命令: bin/hadoop namenode -format

如果有错误请参考:org.apache.hadoop.util.PlatformName //cgywin下Hadoop-0.21.0 错误问题

lenovo@lenovo-PC /hadoop
$ bin/hadoop namenode -format
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.
[INFO ][mgmnt  ] Local JMX connector started
13/07/02 09:43:50 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = lenovo-PC/10.6.3.180
STARTUP_MSG:   args = [-format]
STARTUP_MSG:   version = 0.21.0
STARTUP_MSG:   classpath = C:\cygwin\hadoop\conf;D:\java\Tomcat6\jdk\lib\tools.jar;C:\cygwin\hadoop\;C:\cygwin\hadoop\hadoop-common-0.21.0.jar;C:\cygwin\hadoop\......
STARTUP_MSG:   build = https://svn.apache.org/repos/asf/hadoop/common/branches/branch-0.21 -r 985326; compiled by 'tomwhite' on Tue Aug 17 01:02:28 EDT 2010
************************************************************/
13/07/02 09:43:51 INFO namenode.FSNamesystem: defaultReplication = 1
13/07/02 09:43:51 INFO namenode.FSNamesystem: maxReplication = 512
13/07/02 09:43:51 INFO namenode.FSNamesystem: minReplication = 1
13/07/02 09:43:51 INFO namenode.FSNamesystem: maxReplicationStreams = 2
13/07/02 09:43:51 INFO namenode.FSNamesystem: shouldCheckForEnoughRacks = false
13/07/02 09:43:51 INFO security.Groups: Group mapping impl=org.apache.hadoop.security.ShellBasedUnixGroupsMapping; cacheTimeout=300000
13/07/02 09:43:51 INFO namenode.FSNamesystem: fsOwner=lenovo
13/07/02 09:43:51 INFO namenode.FSNamesystem: supergroup=supergroup
13/07/02 09:43:51 INFO namenode.FSNamesystem: isPermissionEnabled=true
13/07/02 09:43:51 INFO namenode.FSNamesystem: isAccessTokenEnabled=false accessKeyUpdateInterval=0 min(s), accessTokenLifetime=0 min(s)
13/07/02 09:43:51 INFO common.Storage: Image file of size 112 saved in 0 seconds                                   .
13/07/02 09:43:52 INFO common.Storage: Storage directory \tmp\hadoop-lenovo\dfs\name has been successfully formatted.
13/07/02 09:43:52 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at lenovo-PC/10.6.3.180
************************************************************/

第三步,启动Hadoop,执行命令: bin/start-all.sh

lenovo@lenovo-PC /hadoop
$ bin/start-all.sh
This script is Deprecated. Instead use start-dfs.sh and start-mapred.sh
starting namenode, logging to C:\cygwin\hadoop\logs/hadoop-lenovo-namenode-lenovo-PC.out
lenovo@localhost's password:
localhost: starting datanode, logging to C:\cygwin\hadoop\logs/hadoop-lenovo-datanode-lenovo-PC.out
lenovo@localhost's password:
localhost: starting secondarynamenode, logging to C:\cygwin\hadoop\logs/hadoop-lenovo-secondarynamenode-lenovo-    PC.out
starting jobtracker, logging to C:\cygwin\hadoop\logs/hadoop-lenovo-jobtracker-lenovo-PC.out
lenovo@localhost's password:
localhost: starting tasktracker, logging to C:\cygwin\hadoop\logs/hadoop-lenovo-tasktracker-lenovo-PC.out

还需要输入3次密码,运行5个JVM进程,查看进程:

lenovo@lenovo-PC /hadoop
$ ps
PID    PPID    PGID     WINPID   TTY     UID    STIME COMMAND
29756       1   30500      30576  ?       1000 10:02:19 /cygdrive/d/java/Tomcat6/jdk/bin/java
28184       1   21636      26008  pty0    1000 10:01:52 /cygdrive/d/java/Tomcat6/jdk/bin/java
23856       1   21636      22664  pty0    1000 10:01:11 /cygdrive/d/java/Tomcat6/jdk/bin/java
31320    4868   31320      31332  pty0    1000 10:03:38 /usr/bin/ps
27224       1   19108      27980  ?       1000 10:01:49 /cygdrive/d/java/Tomcat6/jdk/bin/java
25556       1   24812      26308  ?       1000 10:01:27 /cygdrive/d/java/Tomcat6/jdk/bin/java
8732       1    8732       8732  ?       1000 09:12:27 /usr/bin/mintty
4868    8732    4868       9376  pty0    1000 09:12:27 /usr/bin/bash

运行成功。

命令:

1):bin/hadoop fs -copyFromLocal local/hibernate.rar /user/pdf/hibernate.rar

上传本地文件到HDFS

lenovo@lenovo-PC /hadoop
$ bin/hadoop fs -copyFromLocal local/hibernate.rar /user/pdf/hibernate.rar
13/07/02 10:15:06 INFO security.Groups: Group mapping impl=org.apache.hadoop.security.ShellBasedUnixGroupsMapping; cacheTimeout=300000
13/07/02 10:15:06 WARN conf.Configuration: mapred.task.id is deprecated. Instead, use mapreduce.task.attempt.id

2):查询上传的文件

lenovo@lenovo-PC /hadoop
$ bin/hadoop fs -ls /user/pdf
13/07/02 15:57:26 INFO security.Groups: Group mapping impl=org.apache.hadoop.security.ShellBasedUnixGroupsMapping; cacheTimeout=300000
13/07/02 15:57:26 WARN conf.Configuration: mapred.task.id is deprecated. Instead, use mapreduce.task.attempt.id
Found 1 items
-rw-r--r--   1 lenovo supergroup    3375455 2013-07-02 10:15 /user/pdf/hibernate.rar

也可以在web中查询:

hadoop默认的NameNode 和 JobTracker

  • NameNode - http://localhost:50070/
  • JobTracker - http://localhost:50030/

hadoop-0.21.0 在Windows环境下的部署(2)Hadoop配置相关推荐

  1. windows环境下利用python进行CGI配置

    windows环境下利用python进行CGI配置(win10,visual stdio 2017中的python3.6) 写在前面,初学python,看到python的CGI编程这一章的时候尝试在教 ...

  2. mysql8.0卸载出现问题,Windows环境下MySQL 8.0 的安装、配置与卸载

    软件版本 Windows:Windows10 MySQL:mysql-8.0.17-winx64.zip 安装步骤 1.配置环境变量 2.新建my.ini文件 文件位置:C:\Program File ...

  3. Sonar Qube连续代码质量管理(三)sonar-scanner-3.3.0.1492在Windows环境下安装部署和代码检查使用

    继续上篇内容,对sonar-scanner在Windows 10环境下安装部署操作步骤进行分解,安装过程相对较简单,并且作为sonar客户端通常都是安装在开发设备上,后期一般不会考虑在Linux上部署 ...

  4. Sonar Qube连续代码质量管理(二)Sonar Qube7.6在Windows环境下安装部署和服务启停

    继续上篇内容,对Sonar Qube7.6在Windows 10环境下安装部署操作步骤进行分解,后期将会考虑在Linux上部署. 一.启动服务 进入到D:\DevelopSoft\Sonar\sona ...

  5. windows环境下apache VC14+php境配置

    windows环境下apache VC14+php环境配置 版本选择:apache 2.4.41 VC14+php7.1.33 X64 一.安装Apache 1.登录 http://httpd.apa ...

  6. hadoop-1.1.2 在Windows环境下的部署

    1:先安装Cygwin 参考http://blog.csdn.net/wind520/article/details/9223003 2:下载 http://download.csdn.net/det ...

  7. Dolphin scheduler在Windows环境下的部署与开发

    这里写自定义目录标题 环境介绍 WSL2 工程下载 修改POM文件 java版本 mysql驱动 修改mysql密码 IDEA配置 JDK8+模块导出 运行配置 启动 加入远程调试接口 开始调试 前端 ...

  8. windows环境下php安装composer和配置php全局变量

    今天在云服务器上办公,重新搭建的服务环境,做laravel压缩文件并下载需要引用插件zipper扩展,是新环境没有composer,需要安装,在同事电脑按下面顺序安装成功. 第一步.下载安装器 php ...

  9. hadoop-0.21.0 在Windows环境下的部署(1)Cygwin 安装

    Cygwin 安装: 1:下载 http://cygwin.com/setup.exe http://www.cygwin.com/setup.exe 2:运行 我们看到有三种安装模式: •Insta ...

最新文章

  1. python如何启动前端_python- 前端进阶
  2. Xcode出现( linker command failed with exit code 1)错误总结
  3. python创建不可变集合_python不可变集合是什么
  4. mysql5.6定时备份_Mysql自动备份
  5. html写原生曲线图,HTML5 平滑的正弦波曲线图
  6. linux容器安卓下载,Docker 1.7.0 发布下载,Linux 容器引擎
  7. html中遍历表单,萌新提问!!!如何用for循环循环表单?
  8. 【算法】数独解题——用python代码
  9. BT种子文件(.torrent)的具体文件结构
  10. app接口开发整理(1)
  11. c# 使用NOPI 操作Excel
  12. 织梦如何添html5播放器,织梦视频播放器,织梦cms网页播放器,dedecms视频播放器,内容管理系统(DedeCMS)的应用,网页视频播放器...
  13. matlab字符识别ocr,OCR字符识别 matlab
  14. 英国留学生论文introduction部分怎么写比较好?
  15. Spring Security(14)——权限鉴定基础
  16. C语言:利用指针编写程序,用梯形法计算给定的定积分
  17. c++我的世界小游戏
  18. Android 设置黑白滤镜
  19. EasyX教程(一)
  20. java 连接Linux服务器并执行指令

热门文章

  1. eclipse lib中包不能打开_Eclipse环境搭建
  2. php 计算字符串相邻最大重复数_php查找字符串出现次数的方法
  3. java 写文件 异常 磁盘空间满_系统磁盘空间满的一个问题
  4. 【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库
  5. sklearn线性回归
  6. 二十三、Python队列实现多线程(下篇)
  7. 不能兼顾速度与精度,STOC 2021最佳论文揭示梯度下降复杂度理论
  8. 生物岛实验室闵明玮课题组诚聘副研究员/博士后/科研助理/实习生
  9. AI到底有多吃香?推荐一个斯坦福、CMU、清北学生都在上的AI课
  10. 数学建模第四节2020.4.24-5.3补