首页 > 工作 > MySQL主从同步之1032问题

MySQL主从同步之1032问题

之前出过1025问题,手工启动完事,今天出现1032问题,手工启动也解决不了。
受不了这种每次都临时解决的方式,决心这次彻底搞定。

本次1032问题状态如下:

mysql> show slave status\G
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 10.58.0.18
Master_User: repl
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: log-bin.000474
Read_Master_Log_Pos: 6858707
Relay_Log_File: mysql-relay-bin.000534
Relay_Log_Pos: 41309687
Relay_Master_Log_File: log-bin.000472
Slave_IO_Running: Yes
Slave_SQL_Running: No
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 1032
Last_Error: Could not execute Update_rows event on table quad_vote.vote_user; Can't find record in 'vote_user', Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND; the event's master log log-bin.000472, end_log_pos 41309751
Skip_Counter: 0
Exec_Master_Log_Pos: 41309543
Relay_Log_Space: 90813001
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: No
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: NULL
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 1032
Last_SQL_Error: Could not execute Update_rows event on table quad_vote.vote_user; Can't find record in 'vote_user', Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND; the event's master log log-bin.000472, end_log_pos 41309751
Replicate_Ignore_Server_Ids:
Master_Server_Id: 18306
1 row in set (0.00 sec)

找到一篇好文,这两种错误都描述得很具体,出处:http://blog.csdn.net/ylqmf/article/details/7382038

使用MySQL的业务,大多都会用到MySQL的Replication,做读写分离,HA,热备份或者增量都少不了利用主从机制.

不过,很多情况下都会报 1032 和 1205 错误.tudou@Gyyx

首先1032.

Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND;

造成1032错误的根本原因是主从数据库数据不一致,导致同步操作在从库上无法执行.

目前我所遇到的情况分为两种:

1 Replication 时使用了 主–binlog-do-db=db_name或者从–replicate_do_db=db_name.

假设 有两个库 pubs 和 test,忽略的是test,结果有这样一条sql 在 主上的test库执行:insert into pubs.tname values(XXXXX);

那么根据服务的配置,主上执行成功,从上没有执行,就会引发1032错误

2 TRIGGER 和 PROCEDURE的版本问题,如果在主从上版本不一致,例如主上的某个PROCEDURE执行后写入了5条数据,而从上执行后只写入了1行数据,这时,必然会引发1032错误

解决方法:

1 不使用 –binlog-do-db 和 –replicate_do_db=db_name

改为 从上 –replicate_wild_do_table=db_name.%

2 保证 主从 TRIGGER 和 PROCEDURE的版本一致

再说说 1205:

这个错误就比较好理解了,一般都是主上的操作连接是autocommit的,结果运行超时失败,从库上进行同步时就会报错.

两种做法:

1 在主上设置my.cnf innodb_rollback_on_timeout=1,超时时rollback

2 在从上忽略1052.my.cnf–slave-skip-errors=1205

主库上发生1205,往往是因为锁超时。例如对某张表使用事务,结果一个事务迟迟没有提交,另一个事务等待前一个事务提交,锁等待超时,后一个事务就挂了。这时主库上就发生1205错误。最常见的是一张表中有自增长id,一个insert开启的事务因为若干原因迟迟不能提交,这样后面的事务,再向表中做insert 操作时就要等待前面的insert操作commit。这些都需要DBA与R&D配合完成。服务表现是cpu使用率不高,但是load值奇高。查innodb status可以随机抓到锁冲突。

另外再某些网络中还会报[ERROR] Error reading packet from server: Lost connection to MySQL server during query ( server_errno=2013)

一般的情况下三种情况会造成2013错误

1 反向解析

2 max_allowed_packet 不一致

3 网络问题

解决方法

1 skip-name-resolve 禁用反向解析

2 配置主从max_allowed_packet为相同的值

3 调整 net_write_timeout 的值

小插曲,在我写手记的时候一个朋友报2013错误,使用了上面三种方案都不见效,并且非常准时的出现Lost connection to MySQL server ,最后查出竟然是网络代理程序控制了连接超过30分钟自动挂断…. replication from impossible position’

  1. 边城冰草
    2013年11月9日17:09 | #1

    幸好现在没有在sql中指定db的使用方式,也没有跨db的操作。手工操作时,也会先use db1。

    目前还没准备用binlog-do-db, binlog-ignore-db之类的选项。

    个人感觉MySQL的这种做法是有问题,只是基于连接中指定或use xx的数据才生效,这是不完备的。只是搞了个残缺的实现。

  2. 2013年11月4日05:43 | #2

    binlog-do-db 这个东西有个坑。
    如果你的mysql 连接中没有指定数据库, sql语句中都使用 db1.table1这样的语句,是有问题的。

    如果要使用binlog-do-db之类的,限制复制的语句,就必须sql改成 use db1; xxx table1 这样。

    否则,指定了do-db 参数为db1, 而用db1.table1这样的方式,还是不会复制。

  1. 本文目前尚无任何 trackbacks 和 pingbacks.