聊聊常见的数据库架构设计方案如何解决其中的各种数据一致性问题( 二 ) _数据库架构

三、一致性解决方案
第一类：主库和从库一致性解决方案

文章插图

注：图中圈出的是数据同步的地方，数据同步（从库从主库拉取binlog日志，再执行一遍）是需要时间的，这个同步时间内主库和从库的数据会存在不一致的情况。如果同步过程中有读请求，那么读到的就是从库中的老数据。
如下图

文章插图

既然知道了数据不一致性产生的原因，有下面几个解决方案供参考：
1、直接忽略，如果业务允许延时存在，那么就不去管它。
2、强制读主，采用主备架构方案，读写都走主库。用缓存来扩展数据库读性能。有一点需要知道：如果缓存挂了，可能会产生雪崩现象，不过一般分布式缓存都是高可用的。

文章插图

3、选择读主，写操作时根据库+表+业务特征生成一个key放到Cache里并设置超时时间（大于等于主从数据同步时间）。
读请求时，同样的方式生成key先去查Cache，再判断是否命中。若命中，则读主库，否则读从库。代价是多了一次缓存读写，基本可以忽略。

文章插图

4、半同步复制，等主从同步完成，写请求才返回。就是大家常说的“半同步复制”semi-sync 。这可以利用数据库原生功能，实现比较简单。代价是写请求时延增长，吞吐量降低。
5、数据库中间件，引入开源（mycat等）或自研的数据库中间层。个人理解，思路同选择读主。数据库中间件的成本比较高，并且还多引入了一层。**

文章插图

**
第二类：DB和缓存一致性解决方案

文章插图

先来看一下常用的缓存使用方式：
第一步：淘汰缓存；
第二步：写入数据库；
第三步：读取缓存？返回：读取数据库；
第四步：读取数据库后写入缓存。
注：如果按照这种方式，图一，不会产生DB和缓存不一致问题；图二，会产生DB和缓存不一致问题，即4.read先于3.sync执行。如果不做处理，缓存里的数据可能一直是脏数据。解决方式如下：

文章插图

注：设置缓存时，一定要加上有效时间，以防延时淘汰缓存失败的情况！
四、个人的一些见解
1、架构演变
1、架构演变一：方案一 -> 方案一+分库分表 -> 方案二+分库分表 -> 方案四+分库分表；
2、架构演变二：方案一 -> 方案一+分库分表 -> 方案三+分库分表 -> 方案四+分库分表；
3、架构演变三：方案一 -> 方案二 -> 方案四 -> 方案四+分库分表；
4、架构演变四：方案一 -> 方案三 -> 方案四 -> 方案四+分库分表；
2、个人见解
1、加缓存和索引是通用的提升数据库性能的方式；
2、分库分表带来的好处是巨大的，但同样也会带来一些问题，详见前日推文。
3、不管是主备+分库分表还是主从+读写分离+分库分表，都要考虑具体的业务场景。
绝大部分的数据库架构还是采用方案一和方案一+分库分表，只有极少部分用方案三+读写分离+分库分表。
另外，阿里云提供的数据库云服务也都是主备方案，要想主从+读写分离需要二次架构。
4、记住一句话：不考虑业务场景的架构都是耍流氓。
End
作者：尜尜人物
来源：
https://www.cnblogs.com/littlecharacter/