Required Software

1. 安装Java环境推荐的版本在链接中有介绍HadoopJavaVersions.

2. 安装ssh以使用hadoop脚本管理远程Hadoop daemons.

Download Hadoop

Installing Software

安装JDK,网上的教程比较多,不做详述

安装ssh,在Ubuntu Linux系统上通过如下指令安装:

$ sudo apt-get install ssh

$ sudo apt-get install rsync

对于mac操作系统,需要在偏好设置中开启远程登录服务。

Configuration

配置Hadoop环境变量

export HADOOP_HOME="/Users/majun/mysoftware/hadoop272"

export PATH="$PATH:/Users/majun/mysoftware/scala/bin:$HADOOP_HOME/bin"

export HADOOP_OPTS="$HADOOP_OPTS -Djava.library.path=/usr/local/hadoop/lib/native"

修改etc/hadoop/core-site.xml:

fs.defaultFS

hdfs://localhost:9000

etc/hadoop/hdfs-site.xml:

dfs.replication

1

Setup passphraseless ssh

使用如下命令来判断是否需要输入密码来ssh登陆:

ssh localhost

如果无法登陆在不输密码的情况下,可以执行下面的语句:

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

$ chmod 0600 ~/.ssh/authorized_keys

Execution

序列化数据

$ bin/hdfs namenode -format

启动namenode和datanode daemon

$ sbin/start-dfs.sh

打开NameNode的web

NameNode - http://localhost:50070/

创建hdfs目录

$ bin/hdfs dfs -mkdir /user

$ bin/hdfs dfs -mkdir /user/

将本地input拷进hdfs系统中

$ bin/hdfs dfs -put etc/hadoop input

运行官方提供的sample

$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a-z.]+'

检验输出文件,将hdfs文件拷到本地

$ bin/hdfs dfs -get output output

$ cat output/*

Reference

hadoop 单机单间_Hadoop单机模式配置相关推荐

  1. hadoop 单机单间_初学Hadoop之单机模式环境搭建

    本文仅作为学习笔记,供大家初学Hadoop时学习参考.初学Hadoop,欢迎有经验的朋友进行指导与交流! 1.安装CentOS7 准备 CentOS系统镜像CentOS-7.0-1406-x86_64 ...

  2. Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    给力星 追逐内心的平和 首页 笔记 搜藏 代码 音乐 关于 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 2014-08-09 (updated: 2016 ...

  3. hbase单机模式配置

    1.软件 https://pan.baidu.com/s/1mgPA8s02FFyPqcc9DmR-FA 提取码: 337t 2.在安装hbase之前,确保你的电脑已经安装Hadoop3.1.3,hb ...

  4. CENTOS上的网络安全工具(九)走向Hadoop(1) SingleNode模式安装与配置

    如果只是在小型企业中构架网络安全,单机的suricata.arkime等工具基本够用了.大型的企业,必然带来更大的需要分析的数据量,如果只是粗略统计一下,提取个别典型协议的少数要素,大致SiLK也就够 ...

  5. Kafka单机、集群模式安装详解(二)

    本文环境如下: 操作系统:CentOS 6 32位 JDK版本:1.8.0_77 32位 Kafka版本:0.9.0.1(Scala 2.11) 接上篇 Kafka单机.集群模式安装详解(一) 6. ...

  6. Hadoop集群_Hadoop安装配置

    1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesy ...

  7. hadoop 实战练习_Hadoop 实战实例

    Hadoop 是Google MapReduce的 一个Java实现.MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行.就如同java程序员可以 不 ...

  8. Hadoop下水环境模拟集群运算模式

    Hadoop下水环境模拟集群运算模式 马金锋1, 唐力2, 饶凯锋1, 洪纲3, 马梅1,4 1 中国科学院饮用水科学与技术重点实验室(中国科学院生态环境研究中心),北京 100085 2 深圳市环境 ...

  9. Hadoop集群—完全分布式模式(Fully-Distributed Mode)

    云服务器---Hadoop集群完全分布式模式 1.配置环境 2.创建hadoop用户 3.修改主机名 4.设备之间的免密登录 4.1单机的免密登录 4.2多服务器的免密登录 5.安装jdk 6.安装H ...

最新文章

  1. 针对2013年B题碎纸片拼接问题(附件一、附件二)
  2. day31 logging 日志模块
  3. [以太坊源代码分析]III. 挖矿和共识算法的奥秘
  4. 一些Base64编码/解码及数据压缩/解压方面的知识
  5. scrum 开发方式学习笔记
  6. 都说程序员是吃青春饭!
  7. 制图折断线_无锡春华教育AutoCAD家具制图/机械/工程制图
  8. python内置模块在哪个文件夹_用 Python 内置模块处理 ini 配置文件
  9. linux基本命令学习(一)文件处理命令
  10. java分析dump文件_干货分享丨jvm系列:dump文件深度分析
  11. 微信背后的产品观---张小龙内部8小时演讲
  12. Kali系统安装Visual Studio Code
  13. html折叠段落标记,HTML 段落标记“p”与换行标记,标题标记“h”!
  14. python画圆填色_如何用python在图像上绘制不同笔触和填充颜色的文本?
  15. 一个夭折 脱裤子放屁的QSql Sqlite操作类
  16. 树莓派远程监控水位传感器
  17. MATLAB2016笔记(八):符号数学计算(MATLAB-Maple组件)
  18. OPT3001DNPR人眼响应数字环境光照传感器
  19. 南邮 OJ 1531 A ? Sixth Grade Math
  20. 斯坦福教授张首晟谈人工智能与未来

热门文章

  1. Java LinkedList公共对象pollLast()方法(带示例)
  2. 360修复导致服务器,桌面安装360软件修复漏洞补丁导致桌面TC端无法登陆,FC端VNC登陆一键修复显示HDC不可达...
  3. MATLAB学习——常用语句
  4. 0到100速度测试软件,【图】到底如何完成 揭晓0-100公里/小时测试_汽车江湖
  5. 第一弹!安利10个让你爽到爆的IDEA必备插件!
  6. 面试官 | 说一下什么是代理模式?
  7. 【逆强化学习-2】最大熵学习(Maximum Entropy Learning)
  8. sas sql 读取最后一行数据_SAS基础编程和数据处理
  9. vscode如何创建一个go项目_如何用手机创建一个网站
  10. 计算机网络最短路径路由选择,最短路径算法Dijkstra算法在路由选择中的应用.pdf...