1、理论部分

1.1、群集的分类

我们用到的集群系统主要就2种:

高可用(High Availability)HA集群, 使用Heartbeat实现;也会称为”双机热备”, “双机互备”, “双机”。

负载均衡群集(Load Balance Cluster),使用Linux Virtual Server(LVS)实现;

1.2、heartbeat的作用

通过heartbeat,可以将资源(IP以及服务等资源)从一台已经故障的计算机快速转移到另外一台正常运转的计算机上继续提供服务,一般称之为高可用服务。

1.3、heartbeat (Linux-HA)的工作原理

heartbeat最核心的包括两个部分,心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,它们之间相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方发送的报文,那么就认为对方失效,这时需启动资源接管模块来接管运行在对方主机上的资源或者服务。

1.4、heartbeat的相关术语

1)node(节点)- 运行heartbeat进程的一个独立主机,称为节点,节点是HA的核心组成部分。

- 节点有主次之分

- 有唯一的主机名

- 有属于自己的资源

- 主节点运行一个或多个应用服务,而备用节点一般处于监控状态。

2)resource(资源)- 资源是节点可以控制的实体,当故障发生时这些资源能够被其他节点接管。

- 磁盘分区、文件系统

- IP地址

- 应用程序服务

- NFS文件系统

3)event(事件)

- 节点系统故障

- 网络连接故障

- 应用故障

- ……

4)action(动作)

事件发生时HA的响应方式(由shell script控制)

1.5、heartbeat的组成

beartbeat - 节点间通讯检测模块

ha-logd - 集群事件日志服务

CCM(Consensus Cluster Membership) - 集群成员一致管理模块

LRM(Local Resource Manager) - 本地资源管理模块

Stonith Daemon - 使出现问题的节点从群集环境中脱离

CRM(Cluster Resource Management) - 群集资源管理模块

Cluster policy engine - 集群策略引擎

Cluster transition engine - 集群转移引擎

2、实践部分

2.1、主机信息

HA1:

eth0

ipaddress=10.168.0.161

vip=10.168.0.160

gateway=10.168.0.1

eth1

ipaddress=10.0.0.1

hostname=HA1

HA2:

eth0

ipaddress=10.168.0.162

vip=10.168.0.160

gateway=10.168.0.161

eth1

ipaddress=10.0.0.2

hostname=HA2

client:

ipaddress=10.168.0.8

2.2、yum源安装

In HA1&HA2

1
2
3
yum -y install http://mirrors.opencas.cn/epel/6/i386/epel-release-6-8.noarch.rpm
yum -y install heartbeat* libnet nginx
yum -y install ntp

2.3、实验步骤

2.3.1、step1

In HA1

1
2
cd /usr/share/doc/heartbeat-3.0.4/
cp authkeys ha.cf haresources /etc/ha.d/

vim编辑/etc/ha.d/authkeys

把以下内容的注释去掉(删除#)或直接加入如下内容:

1
2
auth 3
3 md5 hello!

更改文件权限

1
chmod 600 /etc/ha.d/authkeys

vim编辑/etc/ha.d/haresources加入如下内容:

1
ha1 10.168.0.160/24/eth0 nginx

vim编辑/etc/ha.d/ha.cf,把以下内容的注释去掉(删除#)或直接加入如下内容:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility local0
keeplive 2
deadtime 30
warntime 10
initdead 60
udpport 694
ucast eth1 10.0.0.2
auto_failback on
node HA1
node HA2
ping 10.168.0.1
#respawn hacluster /usr/libheartbeat/ipfail
respawn hacluster /usr/lib64/heartbeat/ipfail

注:

1)hostname带后缀的域名(HA1.cmdschool.org)会出报错。

2)x86与x64要分别使用14与15行

2.3.2、step2

In HA2

1
scp 10.168.0.161:/etc/ha.d/{authkeys,ha.cf,haresources} /etc/ha.d/

vim编辑/etc/ha.d/ha.cf,修改ucast参数:

1
ucast eth1 10.0.0.1

IP修改为对端主机的IP地址(10.0.0.1)

2.3.3、step3

启动服务并配置自启动

In HA1&HA2

1
2
3
4
/etc/init.d/nginx start
/etc/init.d/heartbeat start
chkconfig heartbeat on
chkconfig nginx on

2.3.4、step4

开放端口

In HA1&HA2

1)vim编辑/etc/sysconfig/iptables

1
2
-A INPUT -m state --state NEW -m tcp -p tcp --dport 80 -j ACCEPT
-A INPUT -m state --state NEW -m udp -p udp --dport 694 -j ACCEPT

2)重启防火墙

1
/etc/init.d/iptables restart

2.3.5、step5

调整时区并对时:

In HA1&HA2

1
2
cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
ntpdate 0.centos.pool.ntp.org

2.3.6、step6

1)创建网站测试网站

In HA1

1
2
mkdir -p /var/www/www.cmdschool.org
echo HA1 > /var/www/www.cmdschool.org/index.html

In HA2

1
2
mkdir -p /var/www/www.cmdschool.org
echo HA2 > /var/www/www.cmdschool.org/index.html

2)检查配置文件

In HA1&HA2

1
grep include /etc/nginx/nginx.conf

应当包含如下语句:

1
include /etc/nginx/conf.d/*.conf;

3)增加配置文件

In HA1&HA2

vim编辑/etc/nginx/conf.d/www.cmdschool.org.conf

1
2
3
4
5
6
7
8
9
server {
listen       80;
server_name  www.cmdschool.org;
location / {
root   /var/www/www.cmdschool.org;
index  index.html index.htm;
}
}

4)重启服务

In HA1&HA2

1
/etc/init.d/nginx restart

5)模拟dns并测试

In client

vim编辑/etc/hosts

1
10.168.0.161 www.cmdschool.org

修改www.cmdschool.org指向10.168.0.161,并做如下测试:

1
curl http://www.cmdschool.org

vim编辑/etc/hosts

1
10.168.0.162 www.cmdschool.org

修改www.cmdschool.org指向10.168.0.162,并做如下测试:

1
curl http://www.cmdschool.org

5)配置虚拟IP的模拟dns指向

vim编辑/etc/hosts

1
10.168.0.160 www.cmdschool.org

修改www.cmdschool.org指向10.168.0.160,并做如下测试:

1
curl http://www.cmdschool.org

2.3.7、step7

测试步骤

1)关闭或重启主节点heartbeat服务

In HA1

1
/etc/init.d/heartbeat restart

In client

1
curl http://www.cmdschool.org

注:服务无缝切换

2)关闭主节点网络

In HA1

1
ifdown eth0

In client

等待30秒后:

1
curl http://www.cmdschool.org

注:30秒接管

3)关闭主节点电源

In HA1

1
halt

In client

等待30秒后:

1
curl http://www.cmdschool.org

注:30秒接管

4)切断主节点的所有网络

In HA1

1
ifdown eth1

注:心跳线中断不会引起资源接管

1
ifdown eth0

In client

等待30秒后:

1
curl http://www.cmdschool.org

注:30秒接管

5)heartbeat守护进程意外结束

1
killall -9 heartbeat

注:30秒接管(包含内核模块watchdog不出现资源争用)

watchdog模块确认方法:

1
modinfo softdog

显示如下:

1
2
3
4
5
6
7
8
9
10
11
12
filename:       /lib/modules/2.6.32-431.el6.x86_64/kernel/drivers/watchdog/softdog.ko
alias:          char-major-10-130
license:        GPL
description:    Software Watchdog Device Driver
author:         Alan Cox
srcversion:     47DC8C5D5D2AF6E6652F271
depends:
vermagic:       2.6.32-431.el6.x86_64 SMP mod_unload modversions
parm:           soft_margin:Watchdog soft_margin in seconds. (0 < soft_margin < 65536, default=60) (int)
parm:           nowayout:Watchdog cannot be stopped once started (default=0) (int)
parm:           soft_noboot:Softdog action, set to 1 to ignore reboots, 0 to reboot (default depends on ONLY_TESTING) (int)
parm:           soft_panic:Softdog action, set to 1 to panic, 0 to reboot (default=0) (int)

------------------------------------------------

参考资料:

http://www.linux-ha.org/

http://book.51cto.com/art/200912/168029.htm

本文出自 “老谭linux集群博客” 博客,请务必保留此出处http://cmdschool.blog.51cto.com/2420395/1702729

转载于:https://blog.51cto.com/lucifer119/1732527

Linux集群系统Heartbeat相关推荐

  1. linux 内核round-robin scheduler代码,用LVS构架负载均衡Linux集群系统 linux lvs

    never queue scheduling --- IPVS application helper FTP protocol helper 以上所有项建议全部选择. (4)Networking op ...

  2. 基于Linux的集群系统(五) Linux集群系统的实现

    1.设计目标 设计一个基于Linux的集群系统,它能够提供负载平衡的功能.系统能够不断监视集群中各台实际服务器的负载状况,并且将来自外部网的多种请求转发到内部网中的某一台实际服务器上执行. 具体来说, ...

  3. 全面讲述linux集群负载均衡

    学习linux时,你可能会遇到linux集群的问题,这里将介绍linux集群负载均衡的方法,经过仔细整理,在这里拿出来和大家分享一下,希望本文能教会你更多东西. 集群原理 linux集群系统包括集群节 ...

  4. Linux Linux 集群

    Linux 集群 Page navigation 什么是集群? 集群分类 基于 Linux 的集群 Linux 服务器集群系统 Linux 高性能计算集群 集群系统 MOSIX 构建 Linux 集群 ...

  5. LINUX集群技术构建ANSYS分布式高性能计算平台

    (转载请注明出处)随着仿真理论和求解技术越来越成熟,人们对产品虚拟的开发要求越来越高,系统级多体耦合和多物理场耦合计算已经成为计算机仿真的发展方向,用户不在追求单一个体在单一物理场(如结构力学,流体力 ...

  6. linux地柜查找文件_图文详解 文件柜内DIY自己的Linux集群机

    专业3D图形渲染中需要进行大量的浮点运算(包括物理实体.几何转换.剪切.光效,以及三角形设定)和整数运算(包括三角形设定和像素渲染),是一项CPU密集型任务,通常处理这项繁重任务的一个办法就是使用计算 ...

  7. 集群-大规模Linux集群部署-MPI集群搭建与MPI编程

    一.集群的概念及其相关技术 集群计算机是指利用高速通信网络将一组高档工作站或PC按某种结构连接起来,在并行程序设计甚至可视化人机交互集成开发环境支持下,统一调度,协调处理,实现高效并行处理的系统,利用 ...

  8. Linux服务器集群系统(二)--转

    引用地址:http://www.linuxvirtualserver.org/zh/lvs2.html LVS集群的体系结构 章文嵩 (wensong@linux-vs.org)  2002 年 4 ...

  9. 服务器 ha linux,Linux 高可用(HA)集群之Heartbeat详解

    大纲 一.Heartbeat 的定义 二.Heartbeat 的版本与组件 三.Heartbeat 的各版本之间的区别 四.Heartbeat 集群的一般拓扑图 推荐阅读: 一.Heartbeat的定 ...

最新文章

  1. php常见的几种排序以及二分法查找
  2. java web每天定时执行任务(四步轻松搞定)
  3. 5.什么是二叉查找树?原理
  4. 【HDU6701】Make Rounddog Happy【权值线段树+双向单调队列】
  5. OpenCASCADE绘制测试线束:布尔运算命令之处理多个参数的通用命令
  6. python123温度转换-python二级备考 day2
  7. ASP.Net页面刷新后自动滚动到原来位置
  8. 2021年科技赋能中医药产业发展报告
  9. .html好 还是.asp好,各位说说在ASP.net里 用静态函数的好 还是实例函数出处HTML好???...
  10. 网站访客系统php,PHP实现网站访客来访显示访客IP浏览器操作系统
  11. Rabbtmq 消费端-幂等性保障
  12. python 线程(一)理论部分
  13. echarts设置标题样式_Pyecharts 全局配置项之标题配置项
  14. IMU、INS、DGPS和POS
  15. 汽车HUD抬头显示全产业链深度解析报告
  16. matlab 轮廓系数,kmeans聚类理论篇K的选择(轮廓系数)
  17. java实现批量去除图片水印
  18. 原来证件照还可以这样拍?美炸了!再也不怕证件照丑到家了!
  19. 淘宝客,根据淘宝Url,获取到商品的ID
  20. C++代码重用(一)

热门文章

  1. python适合做后端开发吗-Python后端开发是什么职位?
  2. python3教程-Python3教程
  3. python版本选择-【小白学python】之一:版本选择
  4. UVa1377 Ruler(dfs或者bfs)
  5. [Nikon D80]Beauty
  6. 全面理解 ASP.NET Core 依赖注入
  7. php 按汉字首字母查询[转载]
  8. 【转】并行计算、分布式计算、集群计算和云计算
  9. ajax 遍历select 下拉框
  10. 针对测试行业,新人的一些建议:我适合做测试吗?