特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

当前位置 : 主页 > 网络编程 > 其它编程 >

分析与解决：MySQL分区表复制bug导致的主从延迟

来源：互联网收集：自由互联发布时间：2023-07-02

来自DBAplus社群作者介绍张松坡腾讯云数据库架构师主要负责腾讯云数据库MySQL、Redis等数据库架构设计、数据库运维、运营开来自DBAplus社群作者介绍张松坡腾讯云数据库架构师主要负

来自DBAplus社群作者介绍张松坡腾讯云数据库架构师主要负责腾讯云数据库MySQL、Redis等数据库架构设计、数据库运维、运营开

来自DBAplus社群

作者介绍

张松坡腾讯云数据库架构师主要负责腾讯云数据库MySQL、Redis等数据库架构设计、数据库运维、运营开发等工作。曾就职于腾讯新闻、腾讯视频。

写在前面感谢腾讯云数据库架构师团队祝海强、杜川、刘志祥在排障思路、源码分析上面提供的帮助让我学习到了很多不敢居功特此鸣谢

本文将以数据库实际使用中的某典型案例来分析造成主从延迟的原因。

主从延迟的原因

1、某用户在使用数据库过程中出现主从延迟很大的情况show slave status\G已经差了60多个binlog了。

2、观察发现应该是卡在一个大事物上面Retrieved_Gtid_Set一直在上升但是Executed_Gtid_Set卡在一个点不动了通过分析relay_log找到这个大事物是对表A进行删除操作的一个事物。

Relay_Log_File: relay-bin.000010

Relay_Log_Pos: 95133771

看到这里感觉又是一例在ROW模式下表没有主键引起的主从延迟。看看表结构确认一下发现这张表不小字段有上百个有主键且是一张分区表分区很多。这就有意思了并不是我们碰到过多次的由于ROW模式下没有主键DML引起的主从延迟PS为什么这种情况下会引起延迟而是有主键且走了二级索引那为什么回放还会这么慢呢。

后来了解到用户是在存储过程里面调用detele语句来进行归档数据清理看了一下存储过程现在的问题就可以简化为在存储过程中调用delete语句走了二级索引删除有主键的分区表从机回放延迟。

这个时候我们需要拆解一下问题控制好变量一个一个的查

1、直接执行deleteSQL会以statement的格式出现且不会产生主从延迟。

2、调用procedure该delete语句在procedure中执行的时候会变成ROW格式且会导致延迟。

OK有以上两个测试我们的问题可以聚焦为

1、为什么同样delete语句直接执行和在procedure里面执行记录的binlog格式不一样ROW格式的binlog导致回放慢全局设置在mixed模式下这条SQL应该走的是statement格式为什么在procedure里执行就变成了ROW格式怎么样才能让这条SQL再procedure里执行变成statement记录到binlog里面。

delete from xxxxx

where update_datetime

and DATE_FORMAT(update_datetime,%i) not in (00,05,10,15,20,25,30);

通过show processlist可以看到这条delete在procedure内部执行的时候被MySQL自动加上了NAME_CONST函数所以导致了以ROW模式记录binlog格式。那为什么在procedure中会被改写成这样的SQL呢怎么样才能让这条SQL记录为statement的格式呢

看了MySQL官方在procedure里面的限制描述MySQL会自动加上NAME_CONST主要是为了从机可以识别到B_DATE这个SP的Local vairable不至于从机回放的时候报错。

2、为什么ROW模式的binlog在从库回放的时候即使delete的这张表有主键也很慢。

我们先看一下SQL线程回放是卡在哪里了为什么会慢

通过pstack抓取堆栈找到SQL_thread线程对应的thread 15再结合perf信息可以看到从机回放慢是卡在了bitmap_get_next_set()。

看一下bitmap_get_next_set()的代码。

bitmap_get_next_set()都是一些位运算速度按理来说应该很快。所以不应该是程序卡在了这个函数中大概率是因为多次调用了这个函数。所以我们再往上层继续看代码。

get_next_used_partition(uint part_id) 直接调用了bitmap_get_next_set继续往上看。

try_semi_consistent_read() 这个函数中出现了可疑的循环这里会调用m_tot_parts次get_next_used_partition。看了一下定义m_tot_parts是分区表的总分区数

看到这里就真相大白了。

这个delele的SQL变更的行数大约在300W行左右总共的分区表数是7200个。那么这里调用bitmap_get_next_set的次数就被放大成了216亿次

对比以statement格式回放从机的堆栈信息并不会进入bitmap_get_next_set。

解决方案

分析了这么久怎么处理这么问题呢

方案1我们最后在SP中强制制定了session的binlog_formatstatement让这条delete在从机以statement的模式回放这样就避免触发MySQL中的这个bug。
方案2修复内核。
方案3在shell里面去调度而不使用存储过程。

长按订阅更多精彩▼

如有收获点个在看诚挚感谢

上一篇：七彩虹推无散热器RTX2080：自己上水冷
下一篇：没有了

分析与解决：MySQL分区表复制bug导致的主从延迟

相关文章