Newstart HA进阶
当集群软件newstart HA部署并上线后,后期维护变得既是重点也是难点,如何管理?出现问题如何处理?这对接触集群软件不深的维护人员来说是首要面对的难题.下面与大家一起深入了解newstart HA,解决这两难题。
管理工具:CLI
Newstart HA提供了命令行下的管理工具cli来对其进行日常管理,所以要想管理好集群软件,必须熟悉它。Cli工具使用很简单,只要了解其操作指令即可,下面来详细讲解。
首先,命令行下直接输入cli即可进入该工具:
# cli NewStartHA High Available System. Version 3.0.1.07, release 20130107. Copyright 2008-2012 Guangdong NewStart Technology Service Ltd. You are using a trial license, and 61 days remain. Please register. Product SN = 00TB24-FC0TCF-629A1H-B00D46 cli:~> |
关于查询提供的管理指令,进入cli工具后双击Tab键会列出所有管理指令,如:
cli:~> alarmIP-modify cluster-show help resource-stop service-modify check-config cluster-start lockdisk-adm service-add service-show check-script cluster-stat modify-config service-delete service-start clear-fault cluster-stop quit service-disable service-stop cluster-init exit resource-critical service-enable show-status cluster-modify heartbeat-add resource-enable service-init thirdpartyip-add cluster-restart heartbeat-delete resource-start service-migrate thirdpartyip-delete |
管理指令简述:
alarmIP-modify:配置SNMP告警监控
cluster-show:显示集群配置
help:查看管理指令的说明及用法,如help + 指令
resource-stop: 停止服务中的某些资源
service-modify:调整服务配置,如增、删和修改服务中某些资源
check-config:检查集群及服务配置文件
cluster-start:启动集群
lockdisk-adm:配置仲裁盘
service-add:增加一个服务
service-show:显示服务详细配置信息
check-script:用于检测HA脚本是否合理的工具,要求全pass.
cluster-stat:持续显示集群状态
modify-config:转换集群及服务配置文件
service-delete:删除一个服务
service-start:启动服务
clear-fault:刷新集群状态显示,重置显示界面
cluster-stop:集群停止
quit/exit:退出cli工具
service-disable:服务脱离集群管控
service-stop:停止服务
cluster-init:集群初始化,刚部署完程序才会用动,后续很少用
resource-critical:设置关键资源
service-enable:集群重新管控服务
show-status:显示一次集群状态
cluster-modify:集群配修改
heartbeat-add:增加心跳链路
resource-enable:服务的脚本资源管控/脱控
service-init:服务初始化
thirdpartyip-add:增加第三方IP,与工作链路同一网段的存在的IP
cluster-restart:集群重启
heartbeat-delete:删除心跳链路
resource-start:启动服务中的脚本资源、
service-migrate:服务手动切换
thirdpartyip-delete:删除第三方IP
从上面列出的指令来看,数量也有几十个,但只需熟悉其中的一些(粗体标识)即可轻松管理好集群软件,为了加深印象,下面结果实际场景来说明。在此之前,有个小技巧要分享一下,指令可以使用tab键补全,不用每个字符敲。
1、查询当前集群运行状态。
指令:cluster-stat/show-status
2、确认当前集群和服务的配置情况。
指令:cluster-show、service-show
3、集群中的机器名称(hostname)需要修改,则需要调整集群及服务的配置文件。
指令:cluster-modify、service-modify
PS:
这两指令是最重要,最常用的,因为配置文件里面涉及的资源都可修改/调整,如增/删浮动IP,修改服务名称,重定义脚本路径等。
4、集群环境中按需求新增/删除一个服务
指令:service-add/service-delete
5、业务需升级,涉及的操作有集群停止、集群启动和升级后的服务进行倒换。
指令:cluster-stop、cluster-start、service-migrate
6、集群软件推出新版本,对其新增功能有需求,需要升级到新版本,但又不想影响业务运行;此需求需要把业务脱离HA管控,待升级后重新管控业务。
指令:service-disable、service-enable
7、原集群中仅有一条心跳链路,存在风险,现需增加一条心跳链路。
指令:heartbeat-add
同样,删除心跳使用指令:heartbeat-delete
8、业务做维护,需要停止,待检查完成后再手动启动
指令:service-stop、service-start
故障处理
运行的系统难免会出现一些“意外”,这也是维护人员存在的原因,那针对集群环境,在遇到故障时如何排查?如何分析?如何处理?首先,当出现可能性故障时,先登陆cli管理工具查看集群运行状态,一般情况下可以从状态图看出哪方面出现问题。举个例子:假如业务tomcat 运行在1节点上,下面有人反应某个时间点出现过业务系统登陆不上的情况,登陆cli查看集群运行状态,如:
Press Ctrl-C or 'Q' to exit Date: Tue May 14 13:54:07 2013 Member status centos6-1 UP centos6-2 UP WorkLink centos6-1 centos6-2 eth0 ONLINE ONLINE HeartbeatLink centos6-1 centos6-2 status network eth1 eth1 ONLINE network eth2 eth2 ONLINE ServiceName centos6-1 centos6-2 Enable *tomcat stopped:stu(A) running YES str start fail, stp stop fail, stu status fail, op operation fail, G Gateway A Application, I IP, M Mount, S Storage, W Work link,T Time out B Split Brain |
从上面状态图可以看到,集群节点、工作链路和心跳链路都是正常的(up或online),但服务tomcat现已切换到2节点,1节点tomcat停止,报stu(A),查看最后两行的简述得知业务的状态检测发现业务(应用)异常,并已成功倒换,这时候就要查看业务的日志定位具体异常原因并做出处理。
从集群状态图中可以了解集群运行状态及故障出现原因的大体定位,但很多时候需了解当时详细情况,这就需要分析HA(ha-log)及系统(messages)的相关日志。messages日志相信大家都不陌生,这里就不多说,下面来了解一下HA的日志.
HA日志级别分为四级:错误(error/ERROR),警告(warn/WARN),信息(info),调试(debug/DEBUG),我们主要关注其中的错误及警告级信息(这些信息打印挺简单,阅读起来也挺容易的),其它两级日志较次要,可以跳跃查看/不看。同时,HA日志打印的信息量较大,在比较紧急情况下,还是建议直接发给HA专业人员分析,以便快速定位;日志分析有时需要结合其它资料来看,如配置文件,系统相关信息等,为了方便收集分析所需的全部资料,HA提供了名为hareport的资料收集工具,使用方法的话,在命令行下输入工具名称,然后直接运行即可。
先与大家分享这些,希望对你有所帮助,同时相信了解并熟悉以上两块的知识后,后期集群维护工作也会变得容易起来。
转载于:https://blog.51cto.com/gdlinux/1217879
Newstart HA进阶相关推荐
- Newstart HA常见使用场景
随着社会的发展,业界对系统的持续性运行要求越来越高,特别一些关键的业务系统,更是要求提供7*24小时不间断服务保证,如何来保证呢?高可用软件的出现解决了这一难题,其确保了软.硬件故障时关键业务系统拥有 ...
- 手把手教你使用Newstart HA
什么是newstart HA?有什么作用?如何搭建?如何使用?当我们接触到新的知识时,会带有一系列的疑问,下面我们带着疑问共同探索一番. HA,全称High Availability(即高可用性),而 ...
- Newstart HA 典型配置指导
NewStart HA是一款支持多种Linux平台的双机高可用软件,具有稳定可靠,简约易用等特性.在很多电信级服务器中都有用.本文关于提供NewStart HA的典型配置技巧. 1.业务需求(orac ...
- 双机热备_双机热备软件哪个好?双机热备软件推荐
服务器维护和管理是企业健康稳定运营的一项重要工作,而双机热备可以提供服务器的高可用性.但是成熟好用的双机热备软件有哪些呢?下面就给大家推荐几款. 微软MSCS MSCS(Microsoft Clust ...
- 双机热备_什么是高可用双机热备?双机热备概念原理详解
双机热备是什么意思?为什么要用双机热备?双机热备有哪些种类?包含了哪些双机热备软件?下面就来简单地说说. 什么是双机热备? 从广义上讲,就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务. ...
- 国内外主流容灾备份厂商介绍
国内外主流容灾备份厂商介绍 国内外主流的容灾备份厂商都有哪些?下面就来带大家了解一下! 1.赛门铁克 国外厂商,他们最早的产品是Ghost,这是一款非常强大的产品,相信很多人都有用过.后来赛门铁克收购 ...
- NewstartHA 配置技巧
目前大多数企业对业务的运行要求越来越高,高可用产品应运而生, Newstart HA做为一款优秀的ha解决方案,应用越来越广泛. Newstart HA提供命令行工具(cli)及web工具配置方式,下 ...
- 服务器双机热备软件是什么?有什么作用?有哪些?
最近看到不少小伙伴在问,服务器双机热备软件是什么?有什么作用?有哪些?今天我们小编就来给大家简单回答一下这三个问题,希望对大家有用. 服务器双机热备软件是什么? 服务器双机热备软件就是一套解决服务器单 ...
- 双机热备软件哪个好?双机热备软件推荐
服务器维护和管理是企业健康稳定运营的一项重要工作,而双机热备可以提供服务器的高可用性.但是成熟好用的双机热备软件有哪些呢?下面就给大家推荐几款. 微软MSCS MSCS(Microsoft Clust ...
最新文章
- 近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文
- 开源 java CMS - FreeCMS2.8 数据对象 applyopen
- 网页如何调用flash的方法
- 清华大学计算机图形学课程
- Linux下的socket演示程序
- maven国内镜像配置
- 阿里云与中国联通首个公共云平台上线
- xlwings 合并单元格 读取_xlwings,让excel飞起来
- 使用Navicat Premium 12 连接远程Oracle数据库
- 开会浪费时间?高效会议的秘诀,是用数据支撑
- 线程池中 corePoolSize, maximumPoolSize, poolSize理解
- java邮件程序实例_java 发送邮件简单实例
- jQuery京东分类导航菜单
- 介绍几款知名的工作流系统软件
- python 合并word并生成目录_使用Python制作WORD报告
- VSCODE Vue插件
- Avant浏览器的插件妙用
- 华南农业大学计算机学院院长,华南农业大学外国语学院院长何高大
- 华为路由器Serial接口及串口无法实现ACL访问控制解析
- 数学不好学计算机有影响吗,数学很差能学计算机吗
热门文章
- 什么叫贴片(电子元器件)
- CSS3 背景图 插入 SVG 或图片 base64
- php ean13,php生成EAN_13标准条形码实例_php实例
- 两平面平行但不重合的条件是_____黑龙江省大庆外国语学校高中数学_第二章《2.2_直线、平面平行的判定及其性质》单元测试5_新人教A版必修3...
- ZEALER王自如品味逼格感悟
- 【原理+实战+视频+源码】抖音,快手大热背后——Android 贴心的音视频学习指南来咯!
- 华为摄像头(海思3519A/3516D)开发环境nfs共享目录
- uniCloud更新APP
- android如何编程红外遥控,全志A20[android教程]-红外遥控器调试
- 增值电信业务经营许可证有哪些?如何区分业务类型?