毕业设计要开始了,出于个人对ERP和高端技术的兴趣,选了个基于Hadoop的生产管理系统,现在开始要折腾Linux和Hadoop了,今天折腾了一天的开发环境,总算对Hadoop有个感性的初步认识。大体上一个比较粗旷的理解是这样的:Hadoop是分布式并行编程框架,其中最重要的部分是分布式文件系统(HDFS,Hadoop Distributed File System),注意:是文件系统。基于Hadoop,屏蔽了实习分布式计算、云计算的细节,你不需要知道将一个程序如何分布到给不同的机器、不同的操作系统上并行操作、运算,你只要遵守它的框架和规则就好了。 综合一些网上配置教程和自己的实际操作,讲讲刚开始对Linux不熟悉时走的一些弯路,避免大家重蹈覆辙。讲讲Fedora17下的Hadoop-1.0.4的系统配置,开发环境另外开个文章讲。 我选择的安装方案是Vmware workstation 9+Fedora17 32位+Hadoop-1.0.4,一个比较保守的方案,就是稍微有点慢。

1.各种资源的下载地址

VMware worksation 9
Licence Key:HA2VM-220EP-3ZAN8-JR156-8CNHD
Fedora17 32位这里边包含了多个版本的fedora,可以自行选择
JDK 1.7
Hadoop-1.0.4对Linux不熟的童鞋们,我在这补充点Linux小常识:Linux下,下载的安装包的格式主要有rpm,tar.gz,deb。rpm是Redhat Package Manager,red-hat Linux支持的,如果用ubantu的话就比较麻烦;tar.gz,所有Linux系统通用,就是个压缩包,解压后基本就能使用,相当于绿色软件了;deb则是ubantu支持的安装包。个人推荐一律都下tar.gz格式的,因为其他安装包不像windows那样可以选择安装路径,安装之后不好找到文件的路径,还有就是通用性。

2.安装VMware workstation和安装Fedora17

相信要来玩Hadoop的童鞋不会连虚拟机都没玩过吧,安装就不多说了。

说些安装完之后,各位用惯了Windows而没用过Linux的童鞋会觉得非常蛋疼的事,你会发现桌面没法用,找不到窗口最大最小化按钮,中文输入法问题,当然除了这些你还需要装下vm-tools用起来稍微顺手些。想要使用桌面的话,你需要用到gnome-tweak-tool,中文输入法系统会自带的。下边一件一件事来。

(1)安装中文输入法

在activities里查找input method selector,选者use iBus,Preferences,然后在Input Method选项卡里将中文拼音添加进去就好了

(2)安装配置gnome-tweak-tool

a.在终端输入命令yum install gnome-tweak-tool
b.安装完成后输入命令gnome-tweak-tool,进入插件的界面
c.如图配置:
Desktop--have file manager handle the desktop ON

Shell--Arrangement of buttons on the titlebar ALL

这样基本上界面的现实和使用就比较舒服了

(3)安装vm-tools

参考这篇文章,我也是照着这个弄的

注意:Fedora17系统对用户权限有严格的限制,不支持root登录,配置时很多配置文件的修改都需要root,只有root才有读写权限。我的方法是通过终端输入指令su然后输入root账户密码获取权限后,通过vi指令对系统文件进行修改。在配置过程中如果出现错误或权限不够的情况,可以尝试以root进行操作。

3.配置hadoop

前面的基础知识讲了半天,归根原因还是自己Linux基础不好,大神请无视。以下才是重点,配置完成后可让Hadoop运行在单节点的伪分布模式下。大部分内容来自:http://blog.csdn.net/janpylx/article/details/7922561 并补充上我实际操作过程中遇到的问题和解决方案,以及对当中的一些内容进行修正和详细说明

(1).安装SSH服务器

yum install openssh-server

(2).建立ssh无密码登录

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

直接回车,完成后会在 ~/.ssh/ 生成两个文件: id_dsa 和 id_dsa.pub 。这两个是成对 现,类似钥匙和锁。 再把 id_dsa.pub 追加到授权 key 里面 ( 当前并没有 authorized_keys文件 ) :

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys 。
service sshd start

开启SSH服务,完成后可以实现无密码录本机:

$ ssh localhost 

(3)关闭防火墙:

在终端中输入:

service iptables stop

(4).安装配置JDK

解压好JDK后,在/etc/profile中加入

export JAVA_HOME=(JDK的路径 ,例如/home/ssj/jdk1.7.0)
export JRE_HOME=(JRE的路径,在JDK的目录中会有个JRE文件夹,例如/home/ssj/jdk1.7.0/jre)
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

这里对profile的改写会需要root权限,要用su命令获取root权限,然后用vi指令对profile进行编辑保存,vi指令的用法可以自行查找

配置完成后可在终端中输入:

java -versionjavac -versionjavadoc

检查Java环境是否配置正确

(5).安装Hadoop

解压Hadoop的压缩包,然后同样在/etc/profile中加入:

export HADOOP_INSTALL=(解压出来的Hadoop的路径,如/home/ssj/hadoop-1.0.4)
export PATH=$HADOOP_INSTALL/bin:$PATH

Hadoop的新版本中将HADOOP_HOME改为了HADOOP_INSTALL,如果仍用HADOOP_HOME会出现一条警告

(6).配置Hadoop

hadoop 的主要配置都在 hadoop-1.0.4 /conf 下。

a. 在conf/hadoop-env.sh中配置 Java 环境,加入:

export JAVA_HOME=(JDK的路径 ,例如/home/ssj/jdk1.6.0_21)

b.配置conf/masters 和 conf/slaves 文件 只在 namenode 上配置 )

masters中加入:localhost
slaves中加入:localhost 

注意:因为这是在单机上,则都配置成localhost,若有多台节点机,则masters配置用作masters的机器ip,而slaves则配置多个slaves的ip。

c. 配置conf/core-site.xml, conf/hdfs-site.xml 及 conf/mapred-site.xml(简单配置,datanode 的配置相同,在这里只配置localhost,因为只有一台机子)

core-site.xml:
<configuration><property>
<name>hadoop.tmp.dir</name>
<value>/home/chen/hadoop-1.0.4/tmp</value> (这里可以自己配置一个存放tmp的文件夹路径)
<description>A base for other temporary directories.</description>
</property>
<!-- file system properties -->
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

hdfs-site.xml <onfiguration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
mapred-site.xml:
<onfiguration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

注意:XML配置文件中,标签之间不要出现空格,否则会出错

(7)运行Hadoop,最激动人心的时刻来了

启动SSH Server,service sshd start,如果已经启动则跳过

进入hadoop-1.0.4/bin ,首先格式化文件系统 hadoop namenode -format

启动hadoop start-all.sh(-之前无空格)

用jps命令查看进程:

[root@localhost cloud]# jps
2733 TaskTracker
2672 JobTracker
2610 SecondaryNameNode
3927 Jps
2486 NameNode
2547 DataNode

TaskTracker ,JobTracker,SecondaryNameNode,NameNode ,DataNode必须都要起起来,如果哪个没有启动,请自行到hadoop目录下的logs文件夹中查看对应的log文件,看出了什么错

查看集群状态: $ hadoop dfsadmin -report
Hadoop 的 web 方式查看:http://localhost:50070

如果能查看集群状态则说明Hadoop已经安装配置成功。

Fedora17下的hadoop-1.0.4系统配置相关推荐

  1. eclipse的plugins导入hadoop-eclipse-plugin-2.6.0.jar后Preference下没有hadoop Map/Reduce的解决方法

    参考文章:eclipse下的plugins导入hadoop-eclipse-plugin-2.7.1.jar,Preference下没有hadoop Map/Reduce的解决方法 这种现象一般是由于 ...

  2. 在Ubuntu11.10下构建hadoop实验环境笔记

    1,安装虚拟机virtual box,添加虚拟机hdp1.vdi(网络1:nat或bridge, 网络2:internal),安装ubuntu 11.10,添加用户hadoop作为运行hadoop之用 ...

  3. linux下安装hadoop

    关键词:Ubuntu;hadoop; 注意:开始这一步之前,需安装Oracle的jdk,参见: http://www.cnblogs.com/fengfengqingqingyangyang/arch ...

  4. hadoop 2.0 详细配置教程

    作者:杨鑫奇 PS:文章有部分参考资料来自网上,并经过实践后写出,有什么问题欢迎大家联系我. update: 20130518  大家可以尝试下Ambari来配置Hadoop的相关环境 快速的部署Ha ...

  5. linux下搭建hadoop环境步骤分享

    linux下搭建hadoop环境步骤,需要的朋友可以参考下 1.下载hadoop包 wget http://apache.freelamp.com/hadoop/core/stable/hadoop- ...

  6. linux下运行hadoop,Linux环境下hadoop运行平台的搭建

    1.hadoop版本认识 截至目前(2012年12月23日),Apache Hadoop版本分为两代,我们将第一代Hadoop称为Hadoop 1.0,第二代Hadoop称为Hadoop 2.0.第一 ...

  7. Windows平台下安装Hadoop

    http://www.cnblogs.com/kinglau/archive/2013/08/20/3270160.html 1.安装JDK1.6或更高版本 官网下载JDK,安装时注意,最好不要安装到 ...

  8. Hadoop从0开始 (安装配置:转) (一) - 沐魇

    之前一直在找安装教程 都是0.20版本的 弄了好久没有弄出来..我下载的是0.23.11 后来发现是新版跟旧版有很大的不同.官方文档都不更新简直是丧心病狂.. 今天终于找到新版的安装配置方法.多次失败 ...

  9. Apache Hadoop 3.0.0 GA版正式发布,可以部署到线上

    今天凌晨 Apache Hadoop 3.0.0 GA 版本正式发布,这意味着我们就可以正式在线上使用 Hadoop 3.0.0 了!这个版本是 Apache Hadoop 3.0.0 的第一个稳定版 ...

最新文章

  1. Python使用tkinter构建一个多元回归预测模型GUI界面(接受用户输入数据并给出模型推理结果)
  2. windows 如何配置 Go 环境(Zip archive 方式)?
  3. 自学python能干些什么副业好-安利1个副业,不限专业,有人一天赚了2万…
  4. chrome Native Client 让你可以使用 C 以及 C++ 语言开发 Web 应用
  5. Android之解决布局文件图片太大同步放缩后挤掉其它布局的问题
  6. echarts加载动画效果_入门ae教程:科技类的加载动画,非常酷炫的效果,附带教程...
  7. mysql用户信息备份还原_mysql迁移之新建用户、备份还原数据库
  8. 正则表达式匹配 任意字符和空格的一个简便方式?
  9. 利用JavaScript生成随机数字!
  10. GoJS图表组件简介
  11. 金字塔固定资产管理软件_目前常用固定资产管理软件有哪些?
  12. VLAN隔离技术 — 端口隔离
  13. java 中“==”与“equal” 的区别
  14. 苏州科技大学的计算机专业怎么样,苏州科技大学怎么样?有什么王牌专业?排名如何?...
  15. linux中tac的用法,如何在Linux中使用“cat”和“tac”命令与示例
  16. 家用无线路由器服务器,家用无线路由器DHCP服务器配置方法
  17. 活动(已结束)--我们是冠军,啊呸,我们是CSDN VIP
  18. spooling技术和通道及实现打印机共享
  19. 【MyBatis】mybatis分页插件
  20. mac 更新10.11后,出现command not found的解决办法

热门文章

  1. 文件管理android2.3,Tomi文件管理器下载 v2.3.4 安卓版
  2. 【AD封装】RJ45座子(带3D)
  3. unity aces_评论:UiPath Aces机器人流程自动化
  4. AS2:实现右滑删除,点击展开及点击跳转
  5. 哈尔滨工业大学软件学院诚聘英才
  6. graphpad prism8教程柱状图_一起来看看Graphpad Prism 8.0进阶篇吧!
  7. 江涛与《再给我十年》
  8. 标准C语言基础知识1
  9. 010Editor破解版png模板失效解决方法
  10. PHP房贷计算器算法