01

概述

本文主要对Cetus的监控模块的使用及原理进行介绍,并介绍Cetus使用过程中,监控模块常见的问题及解决方法。

Cetus监控模块拥有独立的监控线程,主要是对Cetus后端各个MySQL实例进行监控,监控的内容主要包括三方面:

1 仅监控MySQL实例的存活状态;

2 监控主从复制延迟;

3 监控MGR集群中主从角色的转换及节点的增删。

下面章节将依次详细介绍。

02

相关参数

监控模块的参数主要分三类:1 用于检测后端各个MySQL实例时,使用的账号;2 是否开启主从延迟及主从延迟阈值;3 所支持的MySQL集群模式。

参数含义 default-username 检测后端MySQL实例所使用的账号。 注意,该账号的密码需要在users.json文件中正确配置。 check-slave-delay true表示检测主从延迟;false表示不检测主从延迟;默认为false 注意,true/false均小写。 slave-delay-down 延迟到达该阈值时,会将该DB摘掉,不再提供服务,单位是秒,默认60s slave-delay-recover 延迟恢复到该阈值时候,会使之前由于延迟过大摘除的DB重新提供服务,单位是秒,默认30s 。group-replication-mode 1表示支持单主MGR集群模式;0表示普通MySQL集群,默认为0; 注意,暂时不支持多主MGR模式 。

03

监控模版实现原理

3.1

监控存活状态

当Cetus没有配置参数check-slave-delay时,或配置该参数值为false时候,只会检测后端各个MySQL实例的存活状态,不会检测主从延迟。

Cetus会为监控模块维护一个连接池,按照后端MySQL实例的ip:port维度来管理连接池中各个连接。

Cetus会周期性(目前是3秒)的检测后端各个MySQL实例的状态。检测每个MySQL实例的状态时,会首先尝试从监控模块的连接池中,根据该MySQL实例的ip:port获取连接,如果成功从连接池中获取到连接,则会调用mysql_ping()来检测该MySQL实例是否存活;如果未能从连接池中成功获取连接,则需要调用mysql_real_connect()来创建新的连接,通过是否创建成功来判断该MySQL实例是否存活,创建成功的新连接也会随即加入监控模块连接池中。

3.2

监控主从延迟

当Cetus配置了参数check-slave-delay=true时,会检测主从延迟,主从延迟实时信息,可以通过命令select * from backends执行的结果的slave delay列来查看,如果该列显示的值为2147483647,则一般表示主从没有配置主从同步。

当主从同步延迟超过slave-delay-down时,该MySQL实例会被临时摘掉,不再处理新到来的SQL请求;如果主从同步延迟恢复到slave-delay-recover,该MySQL实例会恢复,重新提供服务。设置两个阈值的主要目的除了使业务使用更加灵活外,也为了防止在某个阈值附近波动,造成从库的频繁摘除、添加。

Cetus会周期性(300ms)的向主库的proxy_heart_beat.tb_heartbeat表更新当前时间戳,随后(50ms后)会从各个从库读取该时间戳,当前时间与该时间戳的差值,则作为主从延迟的时间。

主从延迟的检测依赖于proxy_heart_beat库的tb_heartbeat表,因此在开启Cetus主从延迟检测功能之前,需要在主库上创建proxy_heart_beat库和tb_heartbeat表,与此同时,default-user需要具有proxy_heart_beat.tb_heartbeat表的对应权限。当然也需要成功将该建表信息同步到各个从库上。

CREATE TABLEtb_heartbeat(p_idvarchar(128) NOT NULL,p_tstimestamp(3) NOT NULL DEFAULT CURRENT_TIMESTAMP(3), PRIMARY KEY (p_id) ) ENGINE = InnoDB DEFAULT CHARSET = utf8;

3.3

支持MGR模式

普通的MySQL集群,主库的高可用一般通过MHA保障。当出现failover时,MHA会进行主从切换,并会通过Cetus的admin端口提供的命令,通知Cetus当前MySQL集群中拓扑结构的变化。

MySQL集群在MGR模式时,当出现failover时,MGR集群内部各个节点会主动进行主从角色的切换;同时可以处理节点的加入与退出。而MGR集群中的这些拓扑结构的改变,无法及时的通知Cetus,因此Cetus需要主动周期性探测MGR集群内部的拓扑结构的变化(节点角色转换、故障节点的删除、新节点的加入等)。

当MySQL集群配置为单主MGR模式后,不再需要使用MHA,需要在Cetus的配置文件中配置group-replication-mode=1,使得Cetus自动探测MGR集群拓扑结构的变化。

当设置group-replication-mode=1之后,Cetus的监控模块会在监控存活和监控主从延迟逻辑之前,首先进行拓扑结构的探测。探测时,会首先找到MGR集群中的当前可用的主库,再通过主库找到所有可用的从库,获得主从信息之后,便会修改Cetus内部现有的主从拓扑信息。Cetus中主从拓扑信息修改完成后,再进入监控存活或监控主从延迟的逻辑。

04

监控模版未来优化

后续Cetus的监控模块会考虑进一步优化,诸如:

监控账号单独,不再使用default-username账号进行监控,更好的进行权限管理。 监控各个MySQL实例时,通过返回值的不同进一步细化流程,提高监控效率和精准度。 监控线程检测的周期,支持参数化配置。

05

常见问题

5.1

monitor线程不工作

monitor线程不工作大致有两个原因:

a. 配置文件中配置了default-username=xxx,xxx没有在users.json中配置对应密码

日志中会打印提示信息如下:

2018-06-19 10:20:13: (warning) no password for , monitor will not work

如遇该问题,配置正确的参数,重启即可。

b. 配置文件中配置了disable-threads=true

日志中会打印提示信息如下:

2018-06-19 10:40:13: (message) monitor thread is disabled

该参数配置为true一般仅用于调试场景,线上环境不需要配置,默认为false。

5.2

连接不上MySQL

日志不断的提示监控线程连接不上某MySQL实例 日志中会打印提示信息如下:

2018-06-19 11:42:57: (critical) monitor thread cannot connect to backend: ght@172.17.0.5:3306

如遇该问题,当检查MySQL实例和网络没有问题的情况下,可能是由于MySQL实例上没有配置监控线程使用的账号。可以在Cetus所在机器使用监控账号直连MySQL实例,从而确定是否是账号配置的问题。

5.3

打印错误日志

日志中循环打印错误日志”Check slave delay no data” 日志中会打印提示信息如下:

2018-06-19 11:51:19: (critical) Check slave delay no data:select p_ts from proxy_heart_beat.tb_heartbeat where p_id=’/home/tsthght/cetus_install/conf_54321_12345’

该情况一般是由于从库没有从主库上将用于主从延迟检测的proxy_heart_beat.tb_heartbeat表或数据正确同步过来。将主从proxy_heart_beat.tb_heartbeat表数据同步即可。

了解更多Cetus相关信息,欢迎参加2018年网易乐得数据库及运维分享会。

2018年网易乐得数据库及运维分享会

7月1日网易北京研发中心举行

名额有限,速度扫码报名

点击阅读原文也可以报名

——————————————

网易MySQL中间件Cetus开源啦

社群  cetus开源qq群号: 521824702

微信社群:扫码加入分享会群

欢迎分享

网易乐得DBA组负责网易乐得电商、网易邮箱、网易技术部数据库日常运维,负责数据库私有云平台的开发和维护,负责数据库及数据库中间件的开发和测试等,分享最前沿实用数据库干货,关注网易乐得DBA,精修数据库功底。

关注「网易乐得DBA」

了解数据库前沿技术

cetus权限连接主从mysql_网易开源中间件 -Cetus监控模块相关推荐

  1. cetus权限连接主从mysql_cetus/cetus-rw.md at master · gczheng/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  2. cetus权限连接主从mysql_cetus/cetus-rw.md at master · eonezhang/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  3. cetus权限连接主从mysql_cetus/cetus-rw.md at master · smudkey/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  4. cetus权限连接主从mysql_cetus/cetus-rw.md at master · sqlercn/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  5. cetus权限连接主从mysql_cetus/cetus-rw.md at master · eimens/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  6. cetus权限连接主从mysql_cetus/cetus-rw.md at master · javadoge/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  7. cetus权限连接主从mysql_cetus/cetus-rw.md at master · shop-zhang/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  8. cetus权限连接主从mysql_cetus/cetus-rw.md at master · sea009/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

  9. cetus权限连接主从mysql_cetus/cetus-rw.md at master · niumanniu/cetus · GitHub

    Cetus 读写分离版使用指南 简介 Cetus 读写分离版将前端发来的读请求和写请求分别发送到不同的服务器后端,由于底层的数据库都是Master/Slave架构,做到读写分离能大大提高数据库的处理能 ...

最新文章

  1. 服务器Jmail配置问题
  2. unity节目素材ProceduralMaterial采用
  3. 关于conda和anaconda不可不知的误解和事实——conda必知必会
  4. ClickHouse【环境搭建 02】设置用户密码的两种方式(明文+SHA256)及新用户添加及只读模式 Cannot execute query in readonly mode 问题解决
  5. 小波说雨燕 第三季 构建 swift UI 之 UI组件集-视图集(二)ActionSheet视图 学习笔记...
  6. JavaScript 开发的40个经典技巧
  7. wordpress插件feed count中文版
  8. Java中线程池,你真的会用吗
  9. eveningplan
  10. 20145217 《信息安全系统设计基础》第0周学习总结
  11. 快速上手Google C++ 测试框架googletest
  12. matlab高级数据结构,Matlab讲义-第四章Matlab语言数据结构1-10.pdf
  13. .html() 与.text() 获取值、取值 区别
  14. 用于无人驾驶技术的车道线_自动驾驶汽车可用于查找车道的4种技术
  15. 白话区块链 之4: 区块链分类与架构
  16. 第九届蓝桥杯单片机省赛题‘彩灯控制器’程序实现
  17. Javaweb —— JSP技术
  18. vue 图片写入文字,图片注入文字,图片添加文字
  19. 电脑误删了计算机 怎么恢复,电脑误删文件怎么恢复 电脑误删文件恢复方法【步骤介绍】...
  20. 指针使用入门与 unsafe.Pointer

热门文章

  1. libxml主要函数说明
  2. BGP协议学习笔记——BGP基础
  3. mysql 触发器 模板_MySQL 触发器例子(两张表同步增加和删除)
  4. python代码加密运行在win10_如何在Win10上正确安装Python,VSCode和flake8
  5. “收藏本站” 的代码
  6. 基本数据类型引用数据类型
  7. 【数据结构--散列函数】
  8. 用linux模拟彩票摇号器下载,大乐透模拟摇奖器拟选号器
  9. 北京市社会保险网上服务平台_城镇职工用户登陆_注册手机号更改
  10. netstat -an