报错:

master.HMaster: Failed to become active master

环境: 
  OS: CENTOS6.5

Hadoop: 2.7.1

Hbase: 1.0.4

ZooKeeper: 3.4.6

动作:

Hbase 升级版本1.0.4 --> 1.2.4

下午接到老朋友电话,说Hbase Master开不起来,因为是生产环境,所以异常着急。事发在凌晨4点多,有一个服务器的硬盘坏了,导致该服务器的Hadoop服务异常了,Hbase也受到了影响,应该是程式正在写hbase的进程受到影响,随之Hbase集群挂掉了。管理员接到产线电话后,×××连接到服务器重启服务,hadoop开启是正常的,可是Hbase的Master一直无法重启。并报错,如下:

参考了很多很多的文章,一直无法解决此问题,一般Hbase的问题解决就是2个思路,要么内存分配有问题,要么就是参数异常,这次显然并不简单,我们有怀疑过是不是Zookeeper异常,导致一直无法获得ClusterID,可是如果Zookeeper异常的话hadoop不可能开得起来,所以排除Zookeeper异常造成。

最后看到google上有提到,是bug的影响。最终,定出2种方案,要么升级Hbase版本,要么数据清除重构。相对之下,更新Hbase版本比较快和安全,因为Hbase的数据是存储在Hadoop里的,Hadoop的数据没有问题,所以升级Hbase不会对Hadoop的数据产生影响。

由于接近吃饭时间了,我就去外面打个饭,还没有打包完,就接到好消息,说数据库集群开起来了,而且数据没有丢,一切正常。

整个解决过程接近4个小时,花了很多时间去研究问题,也尝试了很多的方法,最终要升级数据库集群版本,这还是第一次。Bug这种东西,不会经常遇到,可是遇到的时候就是最郁闷的时候,要么绕过,要么迎面解决。这次我们是迎面解决了问题。Yeah.

转载于:https://blog.51cto.com/10264683/2058473

升级Hbase,解决bug问题相关推荐

  1. Centos6.X升级glibc解决“libc.so.6 version GLIBC_2.14 not found”报错问题

    Centos6.X升级glibc解决"libc.so.6 version GLIBC_2.14 not found"报错问题 参考文章: (1)Centos6.X升级glibc解决 ...

  2. python3.7怎么设置中文_解决 Bug · Python3.7.3官方文档 简体中文 · 看云

    ### 导航 - [索引](genindex.xhtml "总目录") - [模块](py-modindex.xhtml "Python 模块索引") | - ...

  3. 这些解决 Bug 的套路,你都会了不?

    最近整理了我原创的 140 篇编程经验和技术文章,欢迎大家阅读,一起成长!指路:https://t.1yb.co/ARnD 大家好,我是鱼皮. 学编程的过程中,我们会遇到各式各样的 Bug,也常常因为 ...

  4. 自我提升解决bug的能力(一)

    我和大家分享一个我的自我提升解决bug的能力(满满的干货).一名优秀的程序员会具备较强解决bug的能力.如果你觉得自己不够优秀,解决bug能力不足,学习处于被动的状态.那我要大声的告诉你请不要迷茫,陷 ...

  5. 解决bug问题,查找bug的方法

    想告别"写代码2分钟,找bug两小时"吗?,就必须掌握查找bug的能力 下面这些方法都是我这几年解决bug常用的 一.定位bug:如果在控制台中看不出bug,可以使用以下方法帮助查 ...

  6. 解决bug: .cpython-37m-x86_64-linux-gnu.so: undefined symbol:

    解决bug: .cpython-37m-x86_64-linux-gnu.so: undefined symbol: 时间:2023年1月23日 一. 问题 用python下pytorch编写cuda ...

  7. 程序猿解决BUG之总结

    今天看到一遍博文(老程序员解Bug的通用办法),提到程序猿解决BUG的思路和方法,结合自己的经验总结一些:对待BUG,广大程序猿态度不同,解决方法也不同,各人有各人的法宝,但总结一下,希望对新入行的同 ...

  8. 解决bug : KeyError: ‘Non-existent config key: MODEL.×××××××ב

    解决bug: KeyError: 'Non-existent config key: MODEL.××××××××' 时间:2023.4.3 一.背景 用detectron2跑代码,在配置文件(*.y ...

  9. iOS / iPadOS 15.7.4发布安全更新 旧版iPhone和ipad无法升级系统解决方法

    苹果于昨日面向无法升级到 iOS / iPadOS 16 的旧款 iPhone 和 iPad,发布了 iOS / iPadOS 15.7.4 更新.本次更新并未引入新的功能,而是重点修复了存在于 We ...

最新文章

  1. android Button源码分析
  2. 一键洞察全量SQL ,远离性能异常
  3. [Python] L1-055 谁是赢家-PAT团体程序设计天梯赛GPLT
  4. 开发的一款IDEA电子阅读器功能介绍
  5. 三十而立,从零开始学ios开发(八):Autorotation and Autosizing
  6. MVC架构下,使用NPOI读取.DOCX文档中表格的内容
  7. MATLAB生成随机数
  8. Android查看手机sqlite数据库(可视化)
  9. 深入理解java虚拟机-第三版-周明志 Java虚拟机规范(java se 8) pdf
  10. php获取客户端ip端口,Phpwind获取用户真实IP
  11. Aseprite学习/技巧
  12. 让谷歌浏览器不再显示不安全内容的提示
  13. 西安c语言培训班培训,零基础学c语言难吗 西安C语言培训班传授学习技巧
  14. macOS开启高性能模式
  15. 分享 | 物体检测和数据集
  16. Linux进程信号——信号的产生
  17. 遗传+BP神经网络 求解故障诊断问题(python)
  18. 33个与众不同的Web表单设计
  19. 小白学习日记 eclipse的下马威
  20. atom插件默认安装目录修改

热门文章

  1. boost::gil::num_channels用法的测试程序
  2. GDCM:gdcm::FileExplicitFilter的测试程序
  3. boost::core模块实现交换primitive
  4. Boost:由内部绑定的值返回的智能指针的测试程序
  5. DCMTK:创建大型(> 4 GB)增强型CT对象的测试
  6. 计算机科学计算第二版期末,计算机专业学生期末考试试卷2.pdf
  7. 制作本地 CentOS-7-x86_64-Everything-2009.iso对应的源
  8. Mongodb参数详解(参考:http://blog.csdn.net/freebird_lb/article/details/8229567)
  9. 1.Linux下libevent和memcached安装
  10. Oracle到出dmp