MySQL主从同步是基于Bin Log实现的,而Bin Log记录的是原始SQL语句。
Bin Log共有三种日志格式,可以binlog_format配置参数指定。
比如 update_time=now() Row 记录每行数据的变化,保证了数据与原库一致,缺点是数据量较大。 Mixed Statement和Row的混合模式,默认采用Statement模式,涉及日期、函数相关的时候采用Row模式,既减少了数据量,又保证了数据一致性。
常见的主从同步架构有一主多从、双主多从。
2. MySQL主从同步的作用- 读写分离,提升数据库性能
- 容灾恢复,主服务器不可用时,从服务器提供服务,提高可用性
- 冗余备份,主服务器数据损坏丢失,从服务器保留备份
一般是主库负责所有读写请求,而从库只负责容灾恢复和冗余备份。
如果做了读写分离的话,主库负责写请求,从库负责读请求,可以提升数据库性能。
双主多从架构:一般是主库1负责所有读写请求,主库2不对外提供服务,只用来容灾恢复。
相比一主多从架构,双主多从架构可以减少宕机时间,更快恢复数据库可用状态。
3. 主动同步的原理-
当主库数据发生变更时,写入本地Bin Log文件
-
从库IO线程发起dump主库Bin Log文件的请求
-
主库IO线程推送Bin Log文件到从库中
-
从库IO线程把Bin Log内容写入本地的Relay Log文件中
-
从库SQL线程读取Relay Log文件内容
-
从库SQL线程重新执行一遍SQL语句
主从同步最常遇到的问题就是主从同步延迟,可以通过在从库上执行show slave status命令查看延迟时间,Seconds_Behind_Master表示延迟的秒数。
主从同步延迟的原因有哪些?-
从库机器性能较差
主库负责所有读写请求,从库只用来备份,会用性能较差的机器,执行时间自然较慢。
-
从库压力更大
读写分离后,主库负责写请求,从库负责读请求。
互联网应用一般读请求更多,所以从库读压力更大,占用更多CPU资源。
-
网络延迟
当主库的Bin Log文件往从库上发送时,可能产生网络延迟,也会导致从库数据跟不上。
-
主库有大事务
当主库上有个大事务需要执行5分钟,把Bin Log文件发送到从库,从库至少也需要执行5分钟,所以这时候从库就出现了5分钟的延迟。
-
从库机器性能较差
把从库换成跟主库同等规格的机器。
-
从库压力更大
多搞几台从库,分担读请求压力。
-
网络延迟
联系运维或者云服务提供商解决。
-
主库有大事务
把大事务分割成小事务执行,大事务不但会产生从库延迟,还可能产生死锁,降低数据库并发性能,所以尽量少用大事务。
就是在主从同步的最后两步使用多线程,修改配置 slave_parallel_workers=4,代表开启4个复制线程。
2. 修改同步模式,改为异步主从同步共有三种复制方式:
-
全同步复制
当主库执行完一个事务,并且所有从库都执行完该事务后,才给客户端返回成功。
-
半同步复制
至少有一个从库执行完成后,就给客户端返回成功。
-
异步复制
主库执行完后,立即返回成功,不关心从库是否执行完成。
如果对数据安全性要求没那么高,可以把同步模式改成半同步复制或者异步复制。
3. 修改从库Bin Log配置修改sync_binlog配置:
sync_binlog=0 ,表示写binlog不立即刷新磁盘,由系统决定什么时候刷新磁盘。
sync_binlog=1,每次写binlog都刷新磁盘,安全性高,性能差。
sync_binlog=N,写N次binlog才刷新磁盘。
从库对数据安全性要求没那么高,可以设置sync_binlog=0。
修改innodb_flush_log_at_trx_commit配置:
innodb_flush_log_at_trx_commit=0,每隔一秒钟,把事务日志刷新到磁盘。
innodb_flush_log_at_trx_commit=1,每次事务都刷新到磁盘。
innodb_flush_log_at_trx_commit=2,每次事务都不主动刷新磁盘,由系统决定什么时候刷新磁盘。
从库对数据安全性要求没那么高,可以设置innodb_flush_log_at_trx_commit=2。
知识点总结:文章持续更新,可以微信搜一搜「 一灯架构 」第一时间阅读更多技术干货。