公司里有两个mysql服务器做主从同步,某天Nagios发来报警短信, mysqla is down ...赶紧联系机房,机房的人反馈来的信息是  HARDWARE ERROR  后面信息省略,让机房记下错误信息后让他们帮忙重启下看是不是能正常起来,结果竟然正常起来了,赶紧导出所有数据。
   问题又出现了,nagios 又报警,mysql_AB error,检查从库
show slave status \G;  果然 
Slave_IO_Running: Yes
Slave_SQL_Running: No
而且出现了 1062 错误,还提示 
Last_SQL_Error: Error 'Duplicate entry '1001-164761-0' for key 'PRIMARY'' on query. Default database: 'bug'. Query: 'insert into misdata (uid,mid,pid,state,mtime) values (164761,1001,0,-1,1262623560)'
很显然,由于主库重启导致 从库数据不同步而且主键冲突。查看error 日志发现error日志文件变得好大,比以前大了将近好几倍,
tail -f mysql_error.log 最开始查看到的是这条信息
发现这条信息
  [ERROR] Slave SQL: Error 'Duplicate entry '1007-443786-0' for key 'PRIMARY'' on query. Default database: 'ufo'. Query: 'insert into misdata (uid,mid,pid,sta
te,mtime) values (443786,1007,0,-1,1262598003)', Error_code: 1062
100104 17:39:05 [Warning] Slave: Duplicate entry '1007-443786-0' for key 'PRIMARY' Error_code: 1062
100104 17:39:05 [ERROR] Error running query, slave SQL thread aborted. Fix the problem, and restart the slave SQL thread with "SLAVE START". We stopped at log 'ufolog.000058
8' position 55793296
报错和上面的意思差不多,

最先想到的就是首先手动同步一下,从库上首先  stop slave; 停止同步
进入主库锁表,
FLUSH TABLES WITH READ LOCK;
mysql>  show master status;
+-------------------+-----------+--------------+------------------+
| File              | Position  | Binlog_Do_DB | Binlog_Ignore_DB |
+-------------------+-----------+--------------+------------------+
| ufo.000063 | 159164526 |              |                  |
+-------------------+-----------+--------------+------------------+
1 row in set (0.00 sec)
进入从库
mysql>change master to master_host='192.168.1.141', master_user='slave', 
master_password='xxx', 
master_port=3306, 
master_log_file='ufo.000063', 
master_log_pos=159164526;

完成上面这些后
start slave;
回到主库
unlock tables;  解锁

回到从库 查看
show slave status \G;
发现正常了,长处了一口气。可是还没过一分钟,发现又开始报错了,还是最开始那个错误,这是怎么回事...
于是又想到了跳过错误的办法,(不过我不太喜欢用这种方法)马上进入从库
stop slave; 
set global sql_slave_skip_counter=1;  (1是指跳过一个错误)
slave start;
再 show slave status \G ;查看
还是报错 只不过 原来的 164761 变成了 165881,连续执行了几次后
除了上面的数值 在变,错误依然还在
郁闷了,看来只能先强制跳过 1062错误了,于是修改从库的/etc/my.cnf文件
在里面的 [mysqld] 下面加入了一行
slave-skip-errors = 1062  (忽略所有的1062错误)
重启下从库的 mysql /etc/init.d/mysqld restart
再  show slave status \G; 一下发现正常了,但是我知道这时的数据可能已经不同步了,
再次查看一下日志,让我感到意外的是 tail -f mysql_error.log  出现大量的
.......
100106 16:54:21 [Warning] Statement may not be safe to log in statement format. Statement: delete from `system_message_1` where `to_uid` = 181464 ORDER BY `id` ASC LIMIT 1
.........
日志里面有大量的这种警告,意思应该是statement 格式不安全,用vim 打开他看了一下,发现好多这类警告,我说为什么错误日志怎么变这么大了呢!!
statement format  应该是 binlog的一种格式,进入从库查看一下
show global variables like 'binlog_format';
果然当前的格式为 statement

我需要把格式改为  mixed 格式
修改 从库的 my.cfg
在 [mysqld] 下面加入下面这行
binlog_format=mixed

然后重启mysql服务,发现错误日志里的 警告 都停止了。这回清静多了~~

我突然想起一件事,记得有朋友说过 RBR 模式可以解决很多因为主键冲突导致的主从无法同步情况,想到这里我就想要不要把 slave-skip-errors = 1062 去掉再试试,
于是就进入到my.cnf 里在注释掉了 slave-skip-errors = 1062
再次重新启动 mysql服务
进入从库
show slave status \G;
.........               
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
........

恢复了!!!有观察了一段时间没有出现问题这才放心,

看来导致 mysql 主从复制出错的原因还真不少修复的办法也不止一个,binlog的格式也是其中之一。
希望遇到和这次一样问题的朋友看到这篇文章后会得到 一些启发和解决问题的方法~~

MYSQL主从同步故障一例及解决过程相关推荐

  1. mysql data too large_MySQL数据库之mysql 主从同步故障解决   Error 'Row size too large ( 8126)....

    本文主要向大家介绍了MySQL数据库之mysql 主从同步故障解决   Error 'Row size too large (> 8126). ,通过具体的内容向大家展现,希望对大家学习MySQ ...

  2. MySQL 主从同步延迟的原因及解决办法

    首页 博客 专栏·视频 下载 论坛 问答 代码 直播 能力认证 高校 会员中心 收藏 动态 消息 创作中心 MySQL 主从同步延迟的原因及解决办法 hao_yunfeng 2018-09-04 23 ...

  3. mysql主从同步故障整理

    快速简单的解决办法:根据错误日志情况,简单快速确认故障点,然后确认是否可以跳过这个错误,跳过错误的方法是:set global sql_slave_skip_counter=1;跳过并忽略错误. 故障 ...

  4. mysql主从同步故障_MySQL主从同步故障

    故障现象: 进入slave服务器,运行: mysql show slave status\G ....... Relay_Log_File: localhost-relay-bin.000535 Re ...

  5. mysql主从同步搭建和故障排除

    主从同步的定义:  是存储数据的一种结构模式. 主:被客户端访问的数据库服务器就是主库服务器master 从:连接主库服务器,自动同步主库的所有数据到本机slave 1.什么是mysql主从同步? 当 ...

  6. MySQL主从同步各类型故障总结

    主从同步故障总结 错误一 [ERROR] Slave I/O: error connecting to master 'replication@VMS00782:3306' - retry-time: ...

  7. 使用MySQL Proxy解决MySQL主从同步延迟

    MySQL的主从同步机制非常方便的解决了高并发读的应用需求,给Web方 面开发带来了极大的便利.但这种方式有个比较大的缺陷在于MySQL的同步机制是依赖Slave主动向Master发请求来获取数据的, ...

  8. mysql proxy 延迟严重_使用MySQL Proxy解决MySQL主从同步延迟

    MySQL的主从同步机制非常方便的解决了高并发读的应用需求,给Web方面开发带来了极大的便利.但这种方式有个比较大的缺陷在于MySQL的同步机制是依赖Slave主动向Master发请求来获取数据的,而 ...

  9. mysql 两个时间相差大于24小时的数据_MySQL 主从同步延迟的原因及解决办法(仅学习)...

    原文链接:https://blog.csdn.net/hao_yunfeng/article/details/82392261 Mysql主从基本原理,主要形式以及主从同步延迟原理 (读写分离)导致主 ...

最新文章

  1. android RadioGroup设置某一个被选中
  2. w10系统没有打开方式_小白怎么制作微软官方win10系统安装启动U盘
  3. docker部署python web应用_在 Docker 中运行一个 Python 的 Web 应用
  4. libjpeg编译使用详解
  5. 关于Core Data的一些整理(一)
  6. 有向加权图 最大弱连通分支_买入加权组合式等价对敲
  7. ansible 部署ssh 偶尔巨慢的解决方法
  8. KubeEdge 实践过程的记录
  9. mysql proxy php_mysql Proxy读写分离配置或php mysql读写分离类
  10. 2021年中国电热饭盒市场趋势报告、技术动态创新及2027年市场预测
  11. C#:当把U盘放插入,然后程序自动将U盘的内容复制到本地硬盘
  12. atom配置python环境_用Python制作网站Django实操与开发环境配置
  13. JavaWeb开发——注册登录的表单验证
  14. 鸿蒙系统hdc,HDC2020有看头:要揭开鸿蒙系统和EMUI11神秘面纱?
  15. 成龙坦言演蒲松龄曾打退堂鼓:我演大文豪谁信啊
  16. 志强系列的服务器能吃鸡吗,性能芯变化!三款至强E5 V3服务器体验
  17. Android 如何修改以太网IP
  18. 基于数据挖掘的共享单车骑行数据分析与预测
  19. MIFI与随身wifi、wifi共享软件,玩坏wifi的几种方法
  20. win7之下魔兽不能全屏

热门文章

  1. 深度学习-Tensorflow2.2-深度学习基础和tf.keras{1}-tf.keras函数式API-08
  2. 找中位数,找第k小,还存在问题
  3. Centos7 Minimal 版安装后安装图形界面教程
  4. Linux上用Jenkins执行shell
  5. 20、Flask实战第20天:Flask上下文
  6. L2-006. 树的遍历(不建树)
  7. Celery 启动报错 can_read() got an unexpected keyword argument timeout
  8. 如何设置并使用 Synology NAS 共享的多功能打印机
  9. 初学ctypes:打开进程并返回相关信息
  10. asp.net C# 时间格式大全