三、一致性解决方案
第一类:主库和从库一致性解决方案

文章插图
注:图中圈出的是数据同步的地方,数据同步(从库从主库拉取binlog日志,再执行一遍)是需要时间的,这个同步时间内主库和从库的数据会存在不一致的情况 。如果同步过程中有读请求,那么读到的就是从库中的老数据 。
如下图

文章插图
既然知道了数据不一致性产生的原因,有下面几个解决方案供参考:
1、直接忽略,如果业务允许延时存在,那么就不去管它 。
2、强制读主,采用 主备架构 方案,读写都走主库 。用缓存来扩展数据库读性能。有一点需要知道:如果缓存挂了,可能会产生雪崩现象,不过一般分布式缓存都是高可用的 。

文章插图
3、选择读主,写操作时根据库+表+业务特征生成一个key放到Cache里并设置超时时间(大于等于主从数据同步时间) 。
读请求时,同样的方式生成key先去查Cache,再判断是否命中 。若命中,则读主库,否则读从库 。代价是多了一次缓存读写,基本可以忽略 。

文章插图
4、半同步复制,等主从同步完成,写请求才返回 。就是大家常说的“半同步复制”semi-sync 。这可以利用数据库原生功能,实现比较简单 。代价是写请求时延增长,吞吐量降低 。
5、数据库中间件,引入开源(mycat等)或自研的数据库中间层 。个人理解,思路同 选择读主 。 数据库中间件的成本比较高,并且还多引入了一层 。**

文章插图
**
第二类:DB和缓存一致性解决方案

文章插图
先来看一下常用的缓存使用方式:
第一步:淘汰缓存;
第二步:写入数据库;
第三步:读取缓存?返回:读取数据库;
第四步:读取数据库后写入缓存 。
注:如果按照这种方式,图一,不会产生DB和缓存不一致问题;图二,会产生DB和缓存不一致问题,即4.read先于3.sync执行 。如果不做处理,缓存里的数据可能一直是脏数据 。解决方式如下:

文章插图
注:设置缓存时,一定要加上有效时间,以防延时淘汰缓存失败的情况!
四、个人的一些见解
1、架构演变
1、架构演变一:方案一 -> 方案一+分库分表 -> 方案二+分库分表 -> 方案四+分库分表;
2、架构演变二:方案一 -> 方案一+分库分表 -> 方案三+分库分表 -> 方案四+分库分表;
3、架构演变三:方案一 -> 方案二 -> 方案四 -> 方案四+分库分表;
4、架构演变四:方案一 -> 方案三 -> 方案四 -> 方案四+分库分表;
2、个人见解
1、加缓存和索引是通用的提升数据库性能的方式;
2、分库分表带来的好处是巨大的,但同样也会带来一些问题,详见前日推文 。
3、不管是主备+分库分表还是主从+读写分离+分库分表,都要考虑具体的业务场景 。
绝大部分的数据库架构还是采用方案一和方案一+分库分表,只有极少部分用方案三+读写分离+分库分表 。
另外,阿里云提供的数据库云服务也都是主备方案,要想主从+读写分离需要二次架构 。
4、 记住一句话:不考虑业务场景的架构都是耍流氓 。
End
作者:尜尜人物
来源:
https://www.cnblogs.com/littlecharacter/
推荐阅读
- 14 个实用的数据库设计技巧
- 超详细的5种用户密码加密方式介绍,选择哪种最安全?
- 了解白茶变味的3大问题
- 如何鉴别翻新茶 陈茶的质量就定差吗
- Python数据可视化的四种简易方法
- 浏览器隐身模式不会让您的浏览保密。你应该这样做
- 一文看懂四种基本的神经网络架构
- 切开的猕猴桃隔夜能吃吗 猕猴桃切开放一夜还能吃吗
- 阿里P8架构师谈:MySQL数据库的索引原理、与慢SQL优化的5大原则
- 自己一个人怎么漂发 漂流可以一个人自己漂的吗
