之前一直没做过rebalance,以为速度很快,结果大意了,等到磁盘达到90%的时候,才开始做rebalance。

默认的从日志中可以看到总共需要迁移1.89T,但是每次只移动40G大小的量。

然后查看40G的数据量从15:45分到15:48分,所以结算结果为每分钟13G,每秒228M左右。(感觉这计算结果有问题)

hadoop有个balancerBandwidth可以通过设置带宽流量来增加数据移动的大小。

所以通过以下设置来增加每秒流量为500M.

hadoop dfsadmin -setBalancerBandwidth 524288000

start-balancer.sh -threshold 5

hadoop rebalance相关推荐

  1. hadoop balancer

    一.balancer是当hdfs集群中一些datanodes的存储要写满了或者有空白的新节点加入集群时,用于均衡hdfs集群磁盘使用量的一个工具.这个工具作为一个应用部署在集群中,可以由集群管理员在一 ...

  2. Hadoop的那些事儿

    一台单机在存储容量.并发性上毫无疑问都是有很大限制的.为了解决单机无法完成的大存储(>1TB)和大规模计算,分布式系统就应运而生了. MapReduce MapReduce计算框架适用于超大规模 ...

  3. Hadoop 副本存储策略的源码修改和设置

    Table of Contents BlockPlacementPolicy Hadoop 提供的 BlockPlacementPolicy 实现 BlockPlacementPolicyDefaul ...

  4. KafkaController 分区Rebalance平衡机制

    private def checkAndTriggerPartitionRebalance(): Unit = {   if (isActive()) {     trace("checki ...

  5. hadoop+hive+hbase+spark补充内容

    全栈工程师开发手册 (作者:栾鹏) 架构系列文章 Linux安装Scala步骤 一.下载Scala安装包 从scala官方网站地址:http://www.scala-lang.org/download ...

  6. Hadoop之POC测试总结

    POC测试总结 一.       测试内容 测试内容 测试目的 其他 功能测试 验证产品的自动部署安装.集成统一管理.运维监控功能是否完善.对SQL的支持能力(SQL-标准.事务支持能力.索引.存储过 ...

  7. 大数据Hadoop、Hive、Kafka、Hbase、Spark等框架面经

    大数据组件 学习路线: 阶段1:学习绿色箭头的知识点: 阶段2:学习红色箭头的知识点: 阶段3:学习蓝色箭头的知识点: 1 Hadoop 1.1 Hadoop1.x与Hadoop2.x的区别 1.2 ...

  8. 笔记:分布式大数据技术原理(二)构建在 Hadoop 框架之上的 Hive 与 Impala

    """ 有了 MapReduce,Tez 和 Spark 之后,程序员发现,MapReduce 的程序写起来真麻烦.他们希望简化这个过程.这就好比你有了汇编语言,虽然你几 ...

  9. hadoop基础选择题

    1.Hadoop 2.x中,DataNode中默认的块配置的大小是()MB A 128 B 64 C 256 D 1025 A.正确,Hadoop2.0中,HDFS默认的块大小是128MB,所以,比如 ...

最新文章

  1. java errorlevel_bat中errorlevel与%errorlevel%的区别
  2. 疯狂JAVA讲义---第十二章:Swing编程(五)进度条和滑动条
  3. c语言sort函数_C语言的那些经典程序 第八期
  4. 解决phpMyAdmin在nginx+php-fpm模式下无法使用的问题
  5. Java final修饰符的作用,Java中的final修饰符
  6. MemCache详细解读(转)
  7. wordpress后台加载慢的解决方法
  8. linux vnc 安装目录,Linux环境VNC服务安装、配置与使用(图)
  9. 有赞实时任务优化:Flink Checkpoint 异常解析与应用实践
  10. 23种设计模式(6):模版方法模式
  11. Excel转PDF方法
  12. K8S加入新的node节点
  13. 长春高中计算机考试时间安排,2019年长春中考考试时间安排,长春中考考试科目时间安排表...
  14. pytorch detach解析
  15. i7 1165g7和i7 9750h 哪个好
  16. 【Tableau 设计提示 6.0】Tableau有关设计地图提示
  17. bpduguard使用在接着虚拟机的服务器上,避免网络环路:STP和VMware vSwitch
  18. 通过ajax记录打印信息
  19. python爬虫招聘网站(智联)
  20. Linux下使用磁带机的直接备份操作

热门文章

  1. 如何设计一门语言(十二)——设计可扩展的类型
  2. 序列化和反序列化的对单例破坏的防止及其原理
  3. oracle 日期格式转换 ‘ddMONyyyy’ 'ddMMMyyyy'
  4. HDU2553 N皇后问题
  5. WEBSERVICE之JDK开发webservice
  6. juniper路由器主备路由引擎主机名配置
  7. CTO下午茶: 没有安全,一切创新都是套路
  8. Ubuntu 配置Tomcat环境
  9. C++编码中减少内存缺陷的方法和工具
  10. sscanf函数中类型不匹配警告引发的BUG和思考