在使用lepus3.7监控MySQL数据库的时候,碰到了以下几个问题,本博客给出了这些问题产生的原因,以及相应的解决办法。

1. 问题1:php页面无法连接数据库

直接使用php程序执行php文件,可以连接mysql,但是在httpd中同样的php页面无法连接mysql。

lepus的web程序(PHP代码)无法连接数据库时,web界面上什么操作也无法继续。

为此编写了最简单的PDO连接测试代码:

php代码如下:

[linuxidc@linuxidc lepus]$ cat mysql.php

try{

#$dsn="mysql:host=127.0.0.1;dbname=lepus;";

$dsn="mysql:host=11.1.1.11;dbname=lepus;";

$user="coe2coe";

$pwd="XXXXXXXXXX";

$sql="select now() as a";

$dbh=new PDO($dsn,$user,$pwd);

$stmt=$dbh->prepare($sql);

$stmt->execute();

$row=$stmt->fetch(PDO::FETCH_ASSOC);

echo "result:".$row['a'];

}

catch(PDOException $e) {

echo  "FAILED:".$e->getMessage();

}

?>

php程序直接执行php文件:

[linuxidc@linuxidc lepus]$ php mysql.php

result:2018-09-27 00:03:44

通过浏览器访问这个页面:

FAILED:SQLSTATE[HY000] [2003] Can't connect to MySQL server on '11.1.1.11' (13)

lepus的web程序给出的错误提示信息更加模糊。

原因:

通过一番baidu之后,终于看到了一个比较靠谱的分析。

Linux(CentOS7)的selinux安全机制禁止了httpd中的模块访问网络。

[linuxidc@linuxidc lepus]$ sudo getsebool -a |grep httpd

httpd_anon_write --> off

httpd_builtin_scripting --> on

httpd_can_check_spam --> off

httpd_can_connect_ftp --> off

httpd_can_connect_ldap --> off

httpd_can_connect_mythtv --> off

httpd_can_connect_zabbix --> off

httpd_can_network_connect --> off

httpd_can_network_connect_cobbler --> off

httpd_can_network_connect_db --> off

httpd_can_network_memcache --> off

httpd_can_network_relay --> off

httpd_can_sendmail --> off

httpd_dbus_avahi --> off

httpd_dbus_sssd --> off

httpd_dontaudit_search_dirs --> off

httpd_enable_cgi --> on

httpd_enable_ftp_server --> off

httpd_enable_homedirs --> off

httpd_execmem --> off

httpd_graceful_shutdown --> on

httpd_manage_ipa --> off

httpd_mod_auth_ntlm_winbind --> off

httpd_mod_auth_pam --> off

httpd_read_user_content --> off

httpd_run_ipa --> off

httpd_run_preupgrade --> off

httpd_run_stickshift --> off

httpd_serve_cobbler_files --> off

httpd_setrlimit --> off

httpd_ssi_exec --> off

httpd_sys_script_anon_write --> off

httpd_tmp_exec --> off

httpd_tty_comm --> off

httpd_unified --> off

httpd_use_cifs --> off

httpd_use_fusefs --> off

httpd_use_gpg --> off

httpd_use_nfs --> off

httpd_use_openstack --> off

httpd_use_sasl --> off

httpd_verify_dns --> off

解决办法:

临时办法:临时禁用SELINUX。

[linuxidc@linuxidc lepus]$ sudo setenforce 0

永久办法:修改selinux配置文件,禁用SELINUX。

[linuxidc@linuxidc lepus]$ cat /etc/selinux/config

# This file controls the state of SELinux on the system.

# SELINUX= can take one of these three values:

#    enforcing - SELinux security policy is enforced.

#    permissive - SELinux prints warnings instead of enforcing.

#    disabled - No SELinux policy is loaded.

#SELINUX=enforcing

SELINUX=disabled

# SELINUXTYPE= can take one of three two values:

#    targeted - Targeted processes are protected,

#    minimum - Modification of targeted policy. Only selected processes are protected.

#    mls - Multi Level Security protection.

SELINUXTYPE=targeted

验证:

再次在浏览器中访问这个php页面:

result:2018-09-27 00:09:26

2. 问题2:lepus日志中出现group by警告。

2018-09-27 01:12:41 [WARNING] check mysql 11.1.1.11:3408 failure: 1055 Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'information_schema.processlist.USER' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

原因:

这是lepus后端监控程序写的log。

默认情况下sql_mode包含ONLY_FULL_GROUP_BY。

mysql> select @@sql_mode;

+-------------------------------------------------------------------------------------------------------------------------------------------+

| @@sql_mode                                                                                                                                |

+-------------------------------------------------------------------------------------------------------------------------------------------+

| ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION |

+-------------------------------------------------------------------------------------------------------------------------------------------+

1 row in set (0.01 sec)

解决办法:

去掉ONLY_FULL_GROUP_BY。

sql_mode=STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION

3. 问题3:复制监控查询不到数据。

没有查询到数据.

解决办法:

show_compatibility_56=1

4. 问题4:表空间分析没有数据。

5. 问题5:慢查询没有数据。

前提:

MySQL的my.cnf配置文件中已经配置了慢查询日志。

slow_query_log=1

long_query_time=10

log_slow_admin_statements=1

log_slow_slave_statements=1

原因:

1.lepus慢查询分析基于pecona-toolkit工具包中的pt-query-digest程序。需要先安装这个工具包。

2. pt-query-digest程序与lepus3.7建的表有点冲突。

Pipeline process 5 (iteration) caused an error: DBD::mysql::st execute failed: Data truncated for column 'checksum' at row 1 [for Statement "REPLACE INTO `lepus`.`mysql_slow_query_review_history`(`checksum`, `sample`, `serverid_max`, `db_max`, `user_max`, `ts_min`,

.....

Terminating pipeline because process 4 (iteration) caused too many errors.

修改mysql_slow_query_review:

mysql> alter table mysql_slow_query_review modify checksum varchar(100) not null ;

Query OK, 0 rows affected (0.03 sec)

Records: 0  Duplicates: 0  Warnings: 0

修改mysql_slow_query_review_history:

mysql> alter table mysql_slow_query_review_history modify checksum varchar(100) not null;

Query OK, 0 rows affected (0.02 sec)

Records: 0  Duplicates: 0  Warnings: 0

mysql> alter table mysql_slow_query_review_history modify serverid_max smallint(4) null;

Query OK, 0 rows affected (0.02 sec)

Records: 0  Duplicates: 0  Warnings: 0

修改脚本:

原始的lepus_slowquery.sh文件存在一些问题。

(1) 需要人工指定lepus_server_id。这个脚本需要在每个MySQL服务器上部署,因此如果要监控的MySQL很多,会比较容易出错。

lepus_server_id这个参数很重要。下面的代码可以自动取得这个id。

id=$( $mysql_client -h$lepus_db_host -P$lepus_db_port -u$lepus_db_user -p$lepus_db_password  -e "select id,host,port from $lepus_db_database.db_servers_mysql where host='$mysql_host' and port=$mysql_port\G" 2>/dev/null |grep "id:" |awk -F": " '{print $2}')

(2)同一台机器上如果部署有多个MySQL服务实例时,应该只需要一个定时任务即可,在另一脚本中同时对本机的多个MySQL服务实例进行检查。

这个总的定时脚本如下,测试时开启了6个MySQL实例,端口依次为:3306 3307 3308 3406 3407 3408.其中3306和3406为MASTER,其它为SLAVE。在这个总的脚本中对每个实例调用lepus_slowquery.sh。

[linuxidc@linuxidc mysql]$ cat slowquery.sh

##################################################################

#  FileName    :slowquery.sh

#  Author      : coe2coe@qq.com

#  Created    :2018-09-27

#  Description :http://www.cnblogs.com/coe2coe/

#################################################################

#!/bin/bash

ports=(3306 3307 3308 3406 3407 3408)

i=0

while [ $i -lt ${#ports[*]} ]

do

port=${ports[$i]}

echo -e "/lepus_slowquery.sh $port"

./lepus_slowquery.sh $port

let i=i+1

done

(3)原始的lepus_slowquery.sh会去修改MySQL的全局配置参数,个人认为不需要修改,这两个配置还是应该按照MySQL服务器的my.cnf文件中配置的为准,不应该因为部署了一个lepus监控系统就随意的修改这个参数。因此直接注释掉了最后面的几行代码。

long_query_time

slow_query_log_file

修改后的完整的lepus_slowquery.sh文件如下:

[linuxidc@linuxidc mysql]$ cat lepus_slowquery.sh

#!/bin/bash

#****************************************************************#

# ScriptName: /usr/local/sbin/lepus_slowquery.sh

# Create Date: 2014-03-25 10:01

# Modify Date: 2014-03-25 10:01

#***************************************************************#

port=$1

id=$2

if [ "$port" == "" ] || [ $port -lt 1 ]

then

echo -e "invalid argument port"

exit 1

fi

echo -e "mysql port is :{$port} "

#config lepus database server

lepus_db_host="11.1.1.11"

lepus_db_port=3306

lepus_db_user="lepus_monitor"

lepus_db_password="XXXXXXXXXX"

lepus_db_database="lepus"

#config mysql server

mysql_client="/usr/bin/mysql"

mysql_host="11.1.1.11"

mysql_port=$port

mysql_user="lepus_monitor"

mysql_password="XXXXXXXXXX"

id=$( $mysql_client -h$lepus_db_host -P$lepus_db_port -u$lepus_db_user -p$lepus_db_password  -e "select id,host,port from $lepus_db_database.db_servers_mysql where host='$mysql_host' and port=$mysql_port\G" 2>/dev/null |grep "id:" |awk -F": " '{print $2}')

if [ "$id" == "" ] || [ $id -lt 1 ]

then

echo -e "invalid argument id"

exit 2

fi

echo -e "mysql lepus id is :{$id}"

#config slowqury

slowquery_dir="/tmp/"

slowquery_long_time=1

slowquery_file=`$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password  -e "show variables like 'slow_query_log_file'" 2>/dev/null |grep log|awk '{print $2}'`

pt_query_digest="/usr/bin/pt-query-digest"

#config server_id

lepus_server_id=$id

#collect mysql slowquery log into lepus database

$pt_query_digest --user=$lepus_db_user --password=$lepus_db_password --port=$lepus_db_port --review h=$lepus_db_host,D=$lepus_db_database,t=mysql_slow_query_review  --history h=$lepus_db_host,D=$lepus_db_database,t=mysql_slow_query_review_history  --no-report --limit=100% --filter=" \$event->{add_column} = length(\$event->{arg}) and \$event->{serverid}=$lepus_server_id " $slowquery_file > /tmp/lepus_slowquery.log

##### set a new slow query log ###########

#tmp_log=`$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password -e "select concat('$slowquery_dir','slowquery_', '$port','_', date_format(now(),'%Y%m%d%H'),'.log');" 2>/dev/null |grep log|sed -n -e '2p'`

#config mysql slowquery

#$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password -e "set global slow_query_log=1;set global long_query_time=$slowquery_long_time;" 2>/dev/null

#$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password -e "set global slow_query_log_file = '$tmp_log'; "

#delete log before 7 days

#cd $slowquery_dir

#/usr/bin/find ./ -name 'slowquery_*' -mtime +7|xargs rm -rf ;

####END####

6. 问题6:web慢查询查询不到lepus中的数据

在mysql_slow_query_review表中记录了慢查询,但是在lepus web界面上没有数据。

执行:select sleep(14)有时候无法在web界面查询到。

原因:有时候pt-query-digest产生的结果中db_max为NULL,导致查询不出来。

这个字段安装的原始数据库是NOT NULL,但是在NOT NULL的情况下pt-query-digest有时会插入NULL数据,导致报错。所以修改为了NULL。

修改为NULL后,web界面中查询时使用的PHP程序的SQL语句有问题,没有考虑NULL的情况,导致查询不出来这部分数据。

解决办法:

临时打开general_log这个全局参数,再做web查询慢日志,就可以很快找到这个SQL语句,再根据这个SQL语句就可以找到有问题的PHP代码。

将 application/controllers/lp_mysql.php中的以下语句注释掉即可。

修改前:

$this->db->where( "b.db_max !=", 'information_schema'");

修改后:

//$this->db->where( "b.db_max !=", 'information_schema'");

7. 问题7:主机监控中的三项都没有数据。

原因:监控主机以及被监控主机上没有安装snmpd,snmptrapd。

解决办法:

在所有主机上安装snmpd和snmptrapd。

软件包:

[linuxidc@linuxidc snmp]$ ls net-snmp*

net-snmp-5.7.2-32.el7.x86_64.rpm

net-snmp-agent-libs-5.7.2-32.el7.x86_64.rpm

net-snmp-devel-5.7.2-32.el7.x86_64.rpm

net-snmp-libs-5.7.2-32.el7.x86_64.rpm

net-snmp-perl-5.7.2-32.el7.x86_64.rpm

net-snmp-Python-5.7.2-32.el7.x86_64.rpm

net-snmp-sysvinit-5.7.2-32.el7.x86_64.rpm

net-snmp-utils-5.7.2-32.el7.x86_64.rpm

CentOS7-everything-xxx.iso上有这些软件包。

安装完毕后启动snmpd和snmptrapd服务。

lepus监控oracle数据库_MySQL数据库监控软件lepus使用问题以及解决办法相关推荐

  1. ACCESS数据库操作必须使用一个可更新的查询 解决办法

    ACCESS数据库操作必须使用一个可更新的查询 解决办法 ACCESS数据库无法更新问题: 一般在Winxp与windows 2003 server下,文件目录的只读属性会影响网站程序写数据库操作,即 ...

  2. ASP导入Excel数据提示:外部数据库驱动程序(1)中的意外错误 解决办法

     ASP导入Excel数据提示:外部数据库驱动程序(1)中的意外错误 解决办法 最近拿起很久以前写的ASP导入excel数据程序测试时,发现好好的程序出现运行问题,之前都是好好的.真是怪事. 怎么 ...

  3. oracle ogg00423,【案例】Oracle报错PLS-00378 PLS-00439产生原因和MOS官方解决办法

    [案例]Oracle报错PLS-00378 PLS-00439产生原因和MOS官方解决办法 时间:2016-11-12 21:31   来源:Oracle研究中心   作者:代某人   点击: 次 天 ...

  4. oracle lms进程 内存,【案例】Oracle ges resource消耗内存高报错ORA-04031 MOS解决办法...

    天萃荷净 Oracle研究中心案例分析:运维DBA反映Oracle数据库10.2.0.4.12每间隔一段时间就必须重启,运行一断时间报ORA-04031错误oracle ges res cache l ...

  5. mysql中报了 tmp空间不足的问题,【案例】Oracle安装 检测阶段警告Free space: /tmp空间不足解决办法...

    天萃荷净 运维DBA反映在Oracle 11G数据库安装过程中,在检测阶段出现报错警告Free space: /tmp空间不足 1.ORACLE 11G报Free space: /tmp空间不足错误 ...

  6. ”这个动作需要从没有授权的软件源来安装软件包“解决办法

    "这个动作需要从没有授权的软件源来安装软件包"解决办法: Ubuntu 安装软件包时提示"需要安装不能信任的软件包","这个动作需要从没有授权的软件源 ...

  7. CAD、3dmax等Autodesk系列软件安装报错1603解决办法

    一级标题CAD.3dmax等Autodesk系列软件安装报错1603解决办法 使用Auto Remove清理后,安装报错1603 ,如下图 该错误只会出现在2020和2021版本上,其他版本不存在该问 ...

  8. 安全警告——“Windows已经阻止此软件因为无法验证发行者”解决办法

    安全警告--"Windows已经阻止此软件因为无法验证发行者"解决办法 上网浏览网页的时候,经常会出现提示"Windows已经阻止此软件因为无法验证发行者",无 ...

  9. 关于Visio软件无法正常显示的解决办法

    关于Visio软件无法正常显示的解决办法 一.症状图 二.寻找办法 三.结果展示 最近在使用Visio软件查看拓扑图的时候发现打开软件什么也看不到. 经过好一番折腾才解决这个问题,决定写下来以备再犯. ...

  10. 关于VSCode和electron系软件字体发虚/模糊的解决办法

    关于VSCode和electron系软件字体发虚/模糊的解决办法 最直接的解决办法是关闭GPU渲染 另一种解决办法,关闭GPU FXAA选项 最直接的解决办法是关闭GPU渲染 在应用程序的快捷方式中加 ...

最新文章

  1. go 语言 链表 的增删改查
  2. python的切片和索引是什么_NumPy 切片和索引
  3. 一加7充电_夜话丨一加7超级快充明天见
  4. Google正式将网速列为网站排名因素
  5. 基于OpencvTensorflow实现实时查找停车位置
  6. 数学问题->分数的四则运算
  7. 使用多个struts-config配置文件,模块化
  8. 微信小程序四种父子相互传值方式
  9. centos7安装docker笔记
  10. JTable表格内容导出execl表
  11. 【测试】echo发送和接收TCP/UDP数据包|shell 发送TCP/UDP数据包
  12. 判断字符串是否为空方法
  13. MATLAB中figure函数
  14. win 7系统出现计算机内存不足,win7系统计算机内存不足的解决方法
  15. ACL的rule中的deny/permit在各个业务模块里的场景是怎样的
  16. 拿捏Fiddler抓包教程(10)-Fiddler如何设置捕获Firefox浏览器的Https会话
  17. Android HDMI audio设备插拔事件
  18. 如何写一份详细的创业计划书?
  19. 步进电机基础(6.2)-步进电机的特性测量方法-动态特性的测量法和步距角度精度的测量
  20. 保险巨头安联将测试代币用于内部资金流转

热门文章

  1. Flex学习记录(一)——MXML基本知识
  2. 谷歌、雅虎支持中文域名搜索 有助提升SEO
  3. 把一个人的特点写具体作文_五年级下册第五单元习作把一个人的特点写具体写作指导+范文赏析+图文解读...
  4. mysql主从同步从库上Slave_IO_Running: Connecting问题
  5. mysql-行锁的实现
  6. mysql免密码登录, 及使用-e 参数执行sql脚本
  7. Mysql京东的一道面试题目 比较综合
  8. jQuery按键事件keyup
  9. php 0行,php – 如果返回0行,MySQL返回结果
  10. python函数包_python-函数包和模块