一、机架感知是什么?

告诉 Hadoop 集群中哪台机器属于哪个机架

二、那么怎么告诉呢?

Hadoop 对机架的感知并非是自适应的,亦即,hadoop 集群分辨

某台 slave 机器是属于哪个 rack 并非是智能感知的,而是需要 hadoop

的管理者人为的告知 hadoop 哪台机器属于哪个 rack,这样在 hadoop

的 namenode 启动初始化时,会将这些机器与 rack 的对应信息保存

在内存中,用来作为对接下来所有的 HDFS 的写块操作分配 datanode

列表时(比如 3 个 block 对应三台 datanode)的选择 datanode 策略,

尽量将三个副本分布到不同的 rack。

三、什么情况下会涉及到机架感知?

Hadoop 集群规模很大的情况下。

四、机架感知需要考虑的情况(权衡可靠性、可用性、带宽消耗)

(1)不同节点之间的通信能够尽量发生在同一个机架之内,

而不是跨机架

(2)为了提高容错能力,名称节点会尽可能把数据块的副本

放到多个机架上。

五、通过什么方式能够告知 hadoop namenode 哪些 slaves

机器属于哪个 rack?以下是配置步骤。

1.默认情况下,hadoop 的机架感知是没有被启用的。所以,在通常

情况下,hadoop 集群的 HDFS 在选机器的时候,是随机选择的,也

就是说,很有可能在写数据时,hadoop 将第一块数据 block1 写到了

rack1 上,然后随机的选择下将 block2 写入到了 rack2 下,此时两个

rack 之间产生了数据传输的流量,再接下来,在随机的情况下,又将

block3 重新又写回了 rack1,此时,两个 rack 之间又产生了一次数据

流量。在 job 处理的数据量非常的大,或者往 hadoop 推送的数据量

非常大的时候,这种情况会造成 rack 之间的网络流量成倍的上升,

成为性能的瓶颈,进而影响作业的性能以至于整个集群的服务。 
要将 hadoop 机架感知的功能启用,配置非常简单,在 namenode

所在机器的 hadoop-site.xml 配置文件中配置一个选项:

topology.script.file.name

/path/to/RackAware.py

这个配置选项的 value 指定为一个可执行程序,通常为一个脚本,该

脚本接受一个参数,输出一个值。接受的参数通常为某台 datanode

机器的 ip 地址,而输出的值通常为该 ip 地址对应的 datanode 所在

的 rack,例如”/rack1”。Namenode 启动时,会判断该配置选项是否

为空,如果非空,则表示已经用机架感知的配置,此时 namenode

会根据配置寻找该脚本,并在接收到每一个 datanode 的 heartbeat

时,将该 datanode 的 ip 地址作为参数传给该脚本运行,并将得到的

输出作为该 datanode 所属的机架,保存到内存的一个 map 中。

至于脚本的编写,就需要将真实的网络拓朴和机架信息了解清楚

后,通过该脚本能够将机器的 ip 地址正确的映射到相应的机架上去。

一个简单的实现如下:

1.#!/usr/bin/python 2.#--coding:UTF-8 --3.import sys

5.rack = {“hadoopnode-176.tj”:”rack1”,

“hadoopnode-178.tj”:”rack1”,

“hadoopnode-179.tj”:”rack1”,

“hadoopnode-180.tj”:”rack1”,

“hadoopnode-186.tj”:”rack2”,

“hadoopnode-187.tj”:”rack2”,

“hadoopnode-188.tj”:”rack2”,

“hadoopnode-190.tj”:”rack2”,

“192.168.1.15”:”rack1”,

“192.168.1.17”:”rack1”,

“192.168.1.18”:”rack1”,

“192.168.1.19”:”rack1”,

“192.168.1.25”:”rack2”,

“192.168.1.26”:”rack2”,

“192.168.1.27”:”rack2”,

“192.168.1.29”:”rack2”,

}

24.if name==”main“:

print “/” + rack.get(sys.argv[1],”rack0”)

由于没有确切的文档说明 到底是主机名还是 ip 地址会被传入到脚

本,所以在脚本中最好兼容主机名和 ip 地址,如果机房架构比较复

杂的话,脚本可以返回如:/dc1/rack1 类似的字符串。

执行命令:chmod +x RackAware.py

重启 namenode,如果配置成功,namenode 启动日志中会输出:

INFO org.apache.hadoop.net.NetworkTopology: Adding a

new node: /rack1/192.168.1.15:50010

六、网络拓扑机器之间的距离

这里基于一个网络拓扑案例,介绍在复杂的网络拓扑中 hadoop 集群

每台机器之间的距离 
 
有了机架感知,NameNode 就可以画出上图所示的 datanode 网络拓

扑图。D1,R1 都是交换机,最底层是 datanode。则 H1 的

rackid=/D1/R1/H1,H1 的 parent 是 R1,R1 的是 D1。这些 rackid

信息可以通过 topology.script.file.name 配置。有了这些 rackid 信息

就可以计算出任意两台 datanode 之间的距离。

1.distance(/D1/R1/H1,/D1/R1/H1)=0 相同的 datanode

2.distance(/D1/R1/H1,/D1/R1/H2)=2 同一 rack 下的不同 datanode

3.distance(/D1/R1/H1,/D1/R1/H4)=4 同一 IDC(互联网数据中心(机

房))下的不同 datanode

4.distance(/D1/R1/H1,/D2/R3/H7)=6 不同 IDC 下的 datanode

HDFS机架感知概念及配置实现相关推荐

  1. HDFS机架感知功能原理(rack awareness)

    HDFS NameNode对文件块复制相关所有事物负责,它周期性接受来自于DataNode的HeartBeat和BlockReport信息,HDFS文件块副本的放置对于系统整体的可靠性和性能有关键性影 ...

  2. [Hadoop]HDFS机架感知策略

    HDFS NameNode对文件块复制相关所有事物负责,它周期性接受来自于DataNode的HeartBeat和BlockReport信息,HDFS文件块副本的放置对于系统整体的可靠性和性能有关键性影 ...

  3. YARN的机架感知功能

    最近几天做Hadoop机架感知功能时,在网上可以找到很多关于HDFS机架感知的资料,但是对于YARN机架感知的介绍却很少.这篇文章最主要就是说明机架感知功能对于YARN来说起到的作用,若有理解的偏差请 ...

  4. HDFS 集群的机架感知

    HDFS 集群的机架感知 1.背景 1.1.Hadoop 的设计目的 1.2.Hadoop 的设计考虑 1.3.副本存放策略 2.配置机架感知 2.1.修改配置文件 core-site.xml 2.2 ...

  5. HDFS副本放置策略和机架感知

    副本放置策略 的副本放置策略的基本思想是: 第一block在复制和client哪里node于(假设client它不是群集的范围内,则这第一个node是随机选取的.当然系统会尝试不选择哪些太满或者太忙的 ...

  6. Hadoop配置机架感知(python脚本)

    昨天QQ群里提了一个hadoop运行效率分配的问题,总结一下,写个文章.集群使用hadoop-1.0.3 有些hadoop集群在运行的时候,不完全是绝对平均的分配,不过需要尽可能平均的分配任务,避免某 ...

  7. Hadoop配置机架感知

    配置机架感知 core-site.xml cat $HADOOP_HOME/etc/hadoop/core-site.xml <property> <name>net.topo ...

  8. Hadoop机架感知配置及配置问题解决

    Hadoop在搭建集群的时候,集群的网络拓扑都是默认在同一个机架下的.以/default-rack为一个机架,如下格式. Rack: /default-rack 192.168.71.100:5001 ...

  9. 提到HDFS就会想到机架感知,那么机架感知你真的知道是什么吗?

    写在前面 本文隶属于专栏<1000个问题搞定大数据技术体系>,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和文献引用请见1000个问题搞定大数 ...

最新文章

  1. POJ 1860 Currency Exchange
  2. 关于Linux下s、t、i、a权限
  3. Django(models中字段+参数)
  4. 自动驾驶横向运动学分析和非线性问题处理方法
  5. ubuntu 两行命令自动安装最合适的NVIDIA驱动
  6. CopyBeanUtils坑,xxDto cannot be cast to xxxEntity 类型转化错误
  7. JavaScript案例分享+复盘——小米闪购界面
  8. 通达OA2008从windows环境移植到linux部署手册
  9. SPSS典型相关分析(Canonical Correlation Analysis)案例(SPSS25最新版)
  10. liteide+g:Goland多版本管理
  11. linux英文转换成中文
  12. CodeForces 760B Frodo and pillows
  13. 企业网站常见误区-金瑞帆高端建站
  14. IP地址的划分-------IP地址的借位情况
  15. 构建根文件系统的/dev目录
  16. 计算机电脑怎么改皮肤,终极:如何更改计算机鼠标的皮肤
  17. 分号的html文本,在Vue中利用v-HTML按分号将文本换行的例子_輕微_前端开发者
  18. 螺旋传动设计系统lisp_螺旋传动设计.doc
  19. 汉诺塔问题(Towers of Hanoi)
  20. matlab costas环,基于Matlab的Costas环仿真设计

热门文章

  1. harbor重置mysql密码_Harbor密码重置 密码修改 admin密码重置
  2. Python MySQL创建表
  3. sqlite数据库主键自增_sqlite 中主键id自增的方法(转)
  4. js文件中怎么使用thymeleaf标签_007、Spring Boot集成Thymeleaf模板引擎
  5. C++混淆点-static关键字理解
  6. 数据结构排序1-冒泡,选择,插入排序
  7. 选择排序算法python
  8. 通过NGINX location实现一个域名访问多个项目
  9. WPF编程,将控件所呈现的内容保存成图像的一种方法。
  10. MySQL高级特性之分区表