- 搭建级联集群自动化
- 前/后置检查自动化
- 批量切读
- 批量切写
- 自动kill旧集群连接,检测切换后新集群连接
- 批量下线旧集群
- P3集群可在白天任意时间切换
- P2集群可在晚上8点-10点操作
- P1集群需要在凌晨停服期间操作
3.5 切换前、后置检查整个切换周期内,新、老集群的前、后置检查必不可少 。切换前后配置不一致可能引发故障,尤其是一些关键参数配置 。
前置检查:
- 新集群vip-rshost链路连通性
- buffer_pool_size
- sql_mode
- 从节点个数
- 级联延迟
- ...
- 新、老主read_only状态
- 新、老集群业务实时连接
- 域名切换后是否指向新集群
- ...
灰度切换顺序:
- 单套切换
- 小批量切换(<10)
- 大批量切换(>30)
- 多域名问题
- cmdb信息不准确
4 写在最后转转线上MySQL集群规模400+,需要在9月27日凌晨停服期间完成所有集群切换 。P3、P2集群在停服前已完成批量切换,剩余P1核心集群累计100+,平均耗时10s/套,半小时内结束战斗 。停服期间因前期已规避大部分问题,切换过程非常流畅,后续的验证、压测也均符合预期 。
【转转MySQL机房迁移半小时结束战斗?】

文章插图
推荐阅读
- 浅析MySQL的Table_cache实现
- 转转和闲鱼哪个比较可靠,闲鱼和转转哪个好?
- 律师|已经影响到我声誉了,被诬陷使用“机房”,唐艺发声明找律师维权
- MySql主从复制配置,你了解吗?来看这篇,全懂了
- Mysql主从模式搭建
- 一份比较完整的机房管理使用制度 机房管理制度
- 备份MySQL数据库的方法
- MySQL当你CRUD时BufferPool中发生了什么?
- MySQL是如何解决幻读问题的?
- mysql误删表如何恢复,恢复被删除表的步骤说明
