设计第13问:pt-table-checksum 到底会不会影响业务性能?
本文插图
问题 用 pt-table-checksum 时 , 会不会影响业务性能?
实验 实验开始前 , 给大家分享一个小经验:任何性能评估 , 不要相信别人的评测结果 , 要在自己的环境上测试 , 并(大概)知晓原理 。
我们先建一对主从:
本文插图
然后用 mysqlslap 跑一个持续的压力:
本文插图
开另外一个会话 , 将 master 上的 general log 打开:
本文插图
然后通过 pt-table-checksum 进行一次比较:
本文插图
查看 master 的 general log , 由于 mysqlslap 的影响 , general log 中有很多内容 , 我们找到与 pt-table-checksum 相关的线程:
本文插图
将该线程的操作单独列出来:
本文插图
操作比较多 , 我们一点一点来说明:
本文插图
这里工具调小了 innodb 锁等待时间 。 使得之后的操作 , 只要在 innodb 上稍微有锁等待 , 就会马上放弃操作 , 对业务影响很小 。
另外工具调小了 wait_timeout 时间 , 倒是没有特别的作用 。
本文插图
工具将隔离级别调整为了 RR 级别 , 事务的维护代价会比 RC 要高 , 不过后面我们会看到工具使用的每个事务都很小 , 加上之前提到 innodb 锁等待时间调到很小 , 对线上业务产生的成本比较小 。
RR 级别是数据对比的基本要求 。
本文插图
工具通过一系列操作 , 了解表的概况 。 工具是一个数据块一个数据块进行校验 , 这里获取了第一个数据块的下边界 。
本文插图
接下来工具获取了下一个数据块的下边界 , 每个 SQL 前都会 EXPLAIN 一下 , 看一下执行成本 , 非常小心翼翼 。
本文插图
之后工具获取了一个数据块的 checksum , 这个数据块不大 , 如果跟业务流量有冲突 , 会马上出发 innodb 的锁超时 , 立刻退让 。
以上是 pt-table-checksum 的一些设计 , 可以看到这几处都是精心维护了业务流量不受影响 。
工具还设计了其他的一些机制保障业务流量 , 比如参数 --max-load 和 --pause-file 等 , 还有精心设计的数据块划分方法 , 索引选择方法等 。 大家根据自己的情况配合使用即可达到很好的效果 。
总结 本期我们介绍了简单分析 pt-table-checksum 是否会影响业务流量 , 坊间会流传工具的各种参数建议或者不建议使用 , 算命的情况比较多 , 大家都可以用简单的实验来分析其中机制 。
推荐阅读
- 掌上新闻|杨幂腿围到底有多细?当她站在栏杆前被拍到后,一时分不清哪个更细
- 惠普|惠普战99 AMD版设计本上架:6299元起 买它!
- 驱动中国无缘屏下摄像头!华为Mate 40系列爆料:双曲面设计
- 星辰大海路上的种花家熬死了两位教授、历经100年的沥青滴漏实验,到底证明了什么?
- 初凉|快乐家族做客蘑菇屋,待遇到底有多高?看到晚饭场面真是第一次见
- Only篮球|2015年总决赛库里到底算不算单核夺冠?
- 车友料|为何不设计为左脚踩刹车,右脚踩油门?,自动挡没有离合器踏板
- 医疗圈那点事|差点惨死手术台,连过2难,醒来后第一件事是跟老婆复婚!他到底经历了什么?
- 『iphone12』iPhone12全新 5.4 英寸版本到底有多小?实机对比来了
- 游戏圈那点事|炉石传说:盘点最强五色龙 最后一名得罪了设计师?大表哥也不行
