一、操作系统环境配置

1. 安装jdk

rpm文件默认安装目录是 /usr

复制jdk路径配置环境变量

配置环境变量的目录

环境配置代码

刷新配置信息

使用jps检测是否配置成功(使用之前一定要先执行. /etc/profile来刷新配置信息 )

2. 免秘钥

执行完上面两条程序后:

检测密钥是否设置成功:

发现现在登录自己的已经不需要输入密码了,说明密钥设置成功。

二、Hadoop部署

1. 传入Hadoop包到root目录,然后解压

解压命令:

一般把软件移动到/opt/software目录(先在/opt目录下创建好software文件夹)

2. 为了让hadoop执行的时候能找到java的配置目录,所以需要配置

将上面三个文件下都修改如下:

3. 配置Hadoop的环境变量

配置完后记得加载一下

4. 修改下面两个目录分别为

配置说明:运行HDFS需要将一台机器指定为namenode。属性fs.defaultFS描述HDFS文件系统的URI,其中主机是namenode的主机名(我这里用是hadoop01),或者IP地址,端口号是namenode监听RPC的端口。如果没有指定,那么默认端口是8020.

副本配置一个节点

修改datanode:

修改核心文件 core-site.xml,由于系统默认目录是/tmp文件下,即临时文件,这样下次启动就会自动丢弃,所以自己需要配置一个目录。

修改hdfs-site.xml,配置secondarynamenode:

5. 格式化namenode

格式化完成后会生成如下几个文件:

说明:

Version文件是一个java属性文件,其中包含正在运行的HDFS的版本信息。

fsimage文件是文件系统元数据的完整的永久性检查点

6. 启动

启动后dfs目录下多了两个文件夹data和namesecondary

而current的目录下多了个edits文件

同时也可以看到三个进程已启动:

7. 在浏览器上面验证

hadoop01:50070

现在没有任何文件,可以用hdfs命令创建一个文件

再刷新浏览器:

可以看到/user/root目录了。不过里面还没有东西。这个时候就可以上传文件了。

上传完成:

点击hadoop这个文件:

可以看到已经按照block进行了分割

文件大小为175.09M,默认的分割大小为128M,所以分割为两块。

上面的分割大小是默认的128M,还可以自己定义分割大小。

准备一个小程序:

生成的这个test文件大小为1.9M

test.txt文件中存的数据如下:

即1-100000行数据

自己设置block大小最小可以设置1M

1.6M可以切成两个block,那么如何自定block呢?

刷新浏览器:

可以看到block size的确是自定义的1M

并且成功地对test.txt文件进行了切割

以上就是伪分布式的全部流程。

HDFS伪分布式集群搭建相关推荐

  1. HADOOP 伪分布式集群搭建

    一 linux 环境的搭建 由于笔者这里使用的是vmware 虚拟机 采用centos7 linux 操作系统进行搭建,所以一下示例均以centos7进行示例 1.  搭建vmware 虚拟机 (1) ...

  2. zookeeper伪分布式集群搭建

    zookeeper集群搭建注意点: 配置数据文件myid1/2/3对应server.1/2/3 通过zkCli.sh -server [ip]:[port]检测集群是否配置成功. 第一步:首先我们将我 ...

  3. 第二节HDFS完全分布式集群搭建与配置及常见问题总结

    提示:此文章内容超级全面和详细 文章目录 前言 一.HDFS完全分布式集群是什么? 二.HDFS完全分布式集群搭建与配置 1.HDFS完全分布式集群搭建库 2.HDFS完全分布式集群搭建配置 HDFS ...

  4. Hadoop单机/伪分布式集群搭建(新手向)

    此文已由作者朱笑笑授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. 本文主要参照官网的安装步骤实现了Hadoop伪分布式集群的搭建,希望能够为初识Hadoop的小伙伴带来借鉴意 ...

  5. HDFS完全分布式集群搭建

    在上一篇伪分布式的基础上搭建完全分布式集群 一.配置环境 1. 每一台主机安装jdk hadoop01已经安装过了,先把安装包,远程发送给hadoop02 hadoop03 hadoop04服务器 然 ...

  6. 【ManggoDB】安装配置(伪分布式集群搭建)Replia Set

    文章目录 ManggoDB 参考资料 安装配置 配置 MongoDB 复制集(Replica Set)搭建 搭建伪节点 集群测试 注意 配置Debezium的connect 连接器 创建数据库 配置文 ...

  7. HFDS伪分布式集群搭建

    HFDS伪分布式,顾名思义就是不是真正的分布式,它是搭建在一台其上的HDFS,以下是搭建HFDS伪分布式的操作和一些相关问题 设置免密登录 先生成公钥和密钥 [root@localhost .ssh] ...

  8. Hadoop框架:单服务下伪分布式集群搭建

    本文源码:GitHub·点这里 || GitEE·点这里 一.基础环境 1.环境版本 环境:centos7 hadoop版本:2.7.2 jdk版本:1.8 2.Hadoop目录结构 bin目录:存放 ...

  9. 伪分布式集群搭建(hadoop)

    1.安装VMware Tools 创建文件,实现挂载 创建文件夹software装软件的安装包.module装解压后的安装包 将VMwareTools的安装包移动到software文件中进行解压 解压 ...

最新文章

  1. oracle 触发器 merge,如何从触发器中解决Oracle变异错误
  2. mysql控制台增加一个用户_MySQL 纯命令行添加用户
  3. nanotime java 博客园_System.nanoTime (计时工具类)
  4. Berenson机器人艺术鉴赏家亮相切尔西画廊
  5. linux 中断和进程 传递,Linux内核之进程上下文和中断上下文的区别
  6. 支付分当钱花有人信了?微信辟谣:开通微信支付分不收费
  7. python之高性能网络编程并发框架eventlet实例
  8. js获取ck_js取不到ckeditor textarea值
  9. php的laravel框架下载,Laravel(PHP开发框架)官方下载 5.4稳定版_Win10镜像官网
  10. 物联网技术目前存在的问题
  11. js MessageBox 类 无插件,支持弹出层(原页面div 或者 div代码),消息框(alert confirm)
  12. 定位position-relative
  13. 我的世界服务器ess配置信息,我的世界ess指令大全及用法详解
  14. Vue项目中的Emitted value instead of an instance of Error问题
  15. 走近棒球运动·休斯敦太空人队·MLB棒球创造营
  16. 移动端项目总结 - <基础>
  17. 社群运营中KOL的作用
  18. 简单易懂的CRC校验原理阐述
  19. 接口隔离原则:接口里的方法,你都用得到吗?
  20. 从装大象中我们学会了什么设计模式

热门文章

  1. Node聊天程序实例04:chat_ui.js
  2. Win7双屏显示设置
  3. QSerialPort线程内接收异常
  4. iOS 程序 main函数之前发生什么
  5. CentOS7安装Zabbix3.0
  6. zw版【转发·台湾nvp系列Delphi例程】HALCON HighpassImage
  7. Bsie(鄙视IE)
  8. QT错误:collect2:ld returned 1 exit status
  9. 随机模拟的基本思想和常用采样方法(sampling)
  10. Q107:Mac系统下GDB对PBRT-V3进行debug