Haoop0.20.1+Ubuntu11.10+Eclipse3.5.2
最近几天闲来无事,准备研究一下Hadoop,折腾了一个星期,总算在elcipse下将WordCount跑起来了,写篇日志,以做记录。
各种下载请看这里,http://dl.dbank.com/c0b3kwezsa,这个搭配完全可以运行,一开始下载了各种版本的eclipse和hadoop,结果搭配不是那么完美。
ubuntu的安装就不在这里介绍了,ubuntu11.10的软件源里没有jdk,索性连jdk的安装也在这里一并说了。主要说一下jdk,hadoop,eclipse的安装。
1. JDK的安装(jdk-6u30-linux-i586.bin)
sudo cp jdk-6u30-linux-i586.bin /usr/lib/jvm //将jdk复制到所安装的目录下cd /usr/lib/jvm //进入所安装的目录sudo ./jdk-6u30-linux-i586.bin //执行.bin文件sudo rm jdk-6u30-linux-i586.bin //删除.bin文件
在/usr/lib/jvm下存在一个文件夹为jdk1.6.0_30
设置环境变量:
sudo gedit /etc/profile //设置全局环境变量最下面添加:
export JAVA_HOME=/usr/lib/jvm/jdk1.6.0_30
export JRE_HOME=/usr/lib/jvm/jdk1.6.0_30/jre
export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/lib:$PATH
如果你的ubuntu安装了OpenJDK,那么你还需要选择一下系统使用为Sun-JDK,而不是OpenJDK
sudo update-alternatives --install /usr/bin/java java /usr/lib/jvm/jdk1.6.0_30/bin/java 300
sudo update-alternatives --install /usr/bin/javac javac /usr/lib/jvm/jdk1.6.0_30/bin/javac 300
sudo update-alternatives --config java
有 2 个候选项可用于替换 java (提供 /usr/bin/java)。
选择 路径 优先级 状态------------------------------------------------------------0 /usr/lib/jvm/java-6-openjdk/jre/bin/java 1061 自动模式1 /usr/lib/jvm/java-6-openjdk/jre/bin/java 1061 手动模式* 2 /usr/lib/jvm/java-6-sun/bin/java 300 手动模式
要维持当前值[*]请按回车键,或者键入选择的编号:2
如上所示,这样就设置好了要使用的java了。最后我们验证一下:
sachie@ubuntu:~/Software$ java -version
java version "1.6.0_30"
Java(TM) SE Runtime Environment (build 1.6.0_30-b12)
Java HotSpot(TM) Server VM (build 20.5-b03, mixed mode)
查看jdk配置的路径
sachie@ubuntu:~$ echo $JAVA_HOME
sachie@ubuntu:~$ echo $PATH
sachie@ubuntu:~$ echo $CLASSPATH
2. Eclipse3.5的安装(eclipse-SDK-3.5.2-linux-gtk.tar.gz)
首先将eclipse解压到所安装的文件夹下
sudo tar -zxvf eclipse-SDK-3.5.2-linux-gtk.tar.gz /usr/local sudo chown -R sachie:sachie eclipse //设置eclipse所属的用户和组sudo chmod 777 /usr/local/eclipse/eclipse //拥有执行权限 sudo /usr/local/eclipse/eclipse //启动eclipse
创建ubuntu的eclipse菜单
sudo gedit /usr/share/applications/eclipse.desktop
添加以下内容
[Desktop Entry]
Type=Application
Name=Eclipse
Comment=Eclipse Integrated Development Environment
Icon=/usr/local/eclipse/icon.xpm
Exec=/usr/local/eclipse/eclipse
Terminal=false
Categories=Development;IDE;Java;
此时你可以在/usr/share/applications/中看到Eclipse图标,并且可以启动
也可以在主面板里启动,eclipse配置到这里。
3. Hadoop-0.20.1配置 (hadoop-0.20.1.tar.gz)伪分布式单节点
在这里首先安装SSH,hadoop环境中都是采用SSH来访问其他节点的信息的,无论是在伪分布式还是完全分布式中,在这里我们用openssh-server
sudo apt-get install openssh-server
下来配置SSH,这样集群之间就可以实现无密码登录
ssh-keygen -trsa -P "" //生成公钥和私钥对,放在~/.ssh文件夹下
cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys //使集群之间通过无密码方式通过SSH访问分布式文件系统
通过以下命令来测试,是否安装成功
ssh localhost
下来配置Hadoop
首先解压hadoop-0.20.1.tar.gz到用户文件夹下:
sudo tar -zxvf hadoop-0.20.1.tar.gz ~/ //将hadoop-0.20.1解压到/home/sachie/目录下cd hadoop-0.20.1/conf
修改四大配置文件 注意文件夹的所属权限
第一:hadoop-env.sh
将
# Thejava implementation to use. Required. # export JAVA_HOME=/usr/lib/j2sdk1.5-sun
修改为:
# Thejava implementation to use. Required. export JAVA_HOME=/usr/lib/jvm/jdk1.6.0_30
第二:修改core-site.xml
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?><!-- Put site-specific property overrides in this file. --><configuration> <property><name>fs.default.name</name><value>hdfs://localhost:9000</value> </property> <property><name>hadoop.tmp.dir</name><value>/home/sachie/program/tmp</value> </property> </configuration>
第三:修改hdfs-site.xml
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?><!-- Put site-specific property overrides in this file. --><configuration> <property><name>dfs.replication</name><value>1</value> </property> </configuration>
第四:修改mapred-site.xml
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?><!-- Put site-specific property overrides in this file. --><configuration> <property><name>mapred.job.tracker</name><value>localhost:9001</value> </property> </configuration>
运行hadoop
在命令行里执行hadoop,如果说无此命令,那么请注销一下当前用户,重新登录。
首先设置环境变量export HADOOP_HOME=/home/sachie/hadoop-0.20.1export PATH=$HADOOP_HOME/binhadoop namenode -format //格式化分布式文件系统(HDFS) start-all.sh //启动hadoop
如果启动成功,执行jps命令,会出现一下5个JVM进程。
sachie@ubuntu:~$ jps 3913 NameNode 4347 SecondaryNameNode 4642 TaskTracker 4433 JobTracker 4121 DataNode 4686 Jps
停止单节点集群:
stop-all.sh
另外可以通过以下网址查看节点的运行情况:
http://localhost:50030/ - Hadoop 管理介面
http://localhost:50060/ - Hadoop Task Tracker 状态
http://localhost:50070/ - Hadoop DFS 状态
如果没有执行成功,请对照日志文件进行修改
另外:
从上面所给出的网站下载的eclipse打开的时候可能会出现让你选择路径的问题,无论你怎么选择路径都不会好使,这里给出解决办法
sudo gedit /usr/local/eclipse/configuration/.settings/org.eclipse.ui.ide.prefs
将最下面的一句话去掉:RECENT_WORKSPACES=/home/sachie/workspace
或者稍作修改。
wordcount例子程序以及elipse上插件的配置,有时间在写吧。
转载于:https://www.cnblogs.com/sachie/archive/2012/04/24/Sachie_Dong.html
Haoop0.20.1+Ubuntu11.10+Eclipse3.5.2相关推荐
- Ubuntu11.10下载android4.0.1源码
好记不如料笔头,学习新奇的东东就是要多记一下,今天用虚拟机安装了一个Ubunut11.10的系统. 目的就是为了深入android底层方向研究,顺便做一下笔记 目前使用的是XP系统内安装VM8+Ubu ...
- arm-linux-gcc armv4,ubuntu11.10 下 arm-linux-gcc4.4.3
参考了前人的成果,结合自己实践. 1 下载arm-linux-gcc-4.4.3.tgz到任意的目录下,进入这个文件夹 $ sudo tar xvzf arm-linux-gcc-4.4.3.tgz ...
- VirtualBox虚拟机中Ubuntu11.10安装Additions出现 读写错误的解决办法
VirtualBox虚拟机中Ubuntu11.10安装Additions出现 读写错误的解决办法 其主要原因是硬盘的控制器的冲突造成的,考虑到兼容性,将硬盘的控制器统一改成ide即可,还用原来的虚拟文 ...
- Ubuntu11.10配置Eclipse下Android开发环境
系统:ubuntu11.10*64位 JDK:1.7.0_04 Eclipse:eclipse-mobile-juno-linux-gtk-x86_64 1.安装好ubuntu,JDK:eclipse ...
- ubuntu11.10中配置OGRE1.8
在这里提到的版本有点低,但对于Ubuntu11.10+Ogre1.8照样适用. 对于Ubuntu 9.10及以上版本: 安装编译器及配置工具: sudo apt-get install build-e ...
- 在ubuntu11.10上安装6款顶级漂亮的BURG主题
最新文章:Virson's Blog 文章来自lmcn.me:http://imcn.me/html/y2011/9336.html BURG基本上是一个基于GRUB的Linux引导装载程序.BURG ...
- 7-2 计算Fibonacci数列的前N(N<=20)项 (10 分)
7-2 计算Fibonacci数列的前N(N<=20)项 (10 分) 编译器:C++ (g++) 从键盘读入正整数N(N<=20),用动态分配空间的方法计算Fibonacci数列的前N项 ...
- 7-7 斐波那契(Fibonacci)数列前20项 (10 分)
7-7 斐波那契(Fibonacci)数列前20项 (10 分) 输出斐波那契(Fibonacci)数列(1,1,2,3,5,8,13--)的前20项 链接 输出格式: 每个数输出占8列. 输出样例: ...
- Win7下安装Ubuntu11.10(解决linux try(hd0,0):NTFS5:no ang0引导问题)
Win7下安装Ubuntu11.10(解决linux try(hd0,0):NTFS5:no ang0引导问题) 参考文章: (1)Win7下安装Ubuntu11.10(解决linux try(hd0 ...
最新文章
- Nginx自定义模块编写:根据post参数路由到不同服务器
- zabbix 4.0.3 use docker-compose deploy
- 你在过度测试你的软件吗?
- 小程序provisional headers are shown_万圣节~英语早教绘本Five Little Pumpkins五个小南瓜...
- 压力不是来自于任务本身,而是任务在大脑中的堵塞,带来的焦虑和心理的抵触(转)...
- Unity3D学习笔记(四)Unity的网络基础(C#)
- swoole 协程coroutine
- One-Dimensional Battle Ships CodeForces - 567D
- linux上mysql分区磁盘位置_Linux下Oracle软件、数据文件等所在的磁盘分区空间不足的解决思路...
- Linux debian ubuntu安装GIMP软件
- 解决MSN无法登录问题的意外收获
- BlackArch 创建软件包
- Python个 flask 教程地址 做个记录方便以后学习用
- 计算机论文的字体要求,论文格式要求及字体大小
- 降了还是涨了?瓶装水市场再秀迷幻操作
- Octree 了然于胸
- JavaScript实现点击一下显示,再点击一下隐藏的功能(使用工厂函数)
- 做人做事箴言录(3)
- 【100%通过率】华为OD机试真题 JS 实现【最接近最大输出功率的设备 /查找充电设备组合】【2023 Q1 | 200分】
- ajax contentType 设置
热门文章
- python 上下文管理器
- 知方可补不足~sqlserver中使用sp_who查看sql的进程
- [转]C#和C++结构体Socket通信
- linux运行c程序a. out,无法运行已编译的文件 – bash:./ a.out:权限被拒绝. (我试过chmod)...
- python 排列组合算法_排 列 组 合 公 式 及 排 列 组 合 算 法
- 项目review会议的步骤_进行完美的30分钟会议的6个步骤
- Bootstrap按钮的状态
- Bootstrap 下拉菜单
- 编码器的一点微小认识
- verp之增加接近传感器(proximity sensor)