亿级流量场景下，大型缓存架构设计实现，你知道吗？(13) _缓存架构

-------------------------------------------------------------------------------------------------------
二、面向集群的jedis内部实现原理
开发，jedis，redis的java client客户端，redis cluster，jedis cluster api
jedis cluster api与redis cluster集群交互的一些基本原理
1、基于重定向的客户端
redis-cli -c，自动重定向
（1）请求重定向
客户端可能会挑选任意一个redis实例去发送命令，每个redis实例接收到命令，都会计算key对应的hash slot
如果在本地就在本地处理，否则返回moved给客户端，让客户端进行重定向
cluster keyslot mykey，可以查看一个key对应的hash slot是什么
用redis-cli的时候，可以加入-c参数，支持自动的请求重定向，redis-cli接收到moved之后，会自动重定向到对应的节点执行命令
（2）计算hash slot
计算hash slot的算法，就是根据key计算CRC16值，然后对16384取模，拿到对应的hash slot
用hash tag可以手动指定key对应的slot，同一个hash tag下的key，都会在一个hash slot中，比如set mykey1:{100}和set mykey2:{100}
（3）hash slot查找
节点间通过gossip协议进行数据交换，就知道每个hash slot在哪个节点上
2、smart jedis
（1）什么是smart jedis
基于重定向的客户端，很消耗网络IO，因为大部分情况下，可能都会出现一次请求重定向，才能找到正确的节点
所以大部分的客户端，比如java redis客户端，就是jedis，都是smart的
本地维护一份hashslot -> node的映射表，缓存，大部分情况下，直接走本地缓存就可以找到hashslot -> node，不需要通过节点进行moved重定向
（2）JedisCluster的工作原理
在JedisCluster初始化的时候，就会随机选择一个node，初始化hashslot -> node映射表，同时为每个节点创建一个JedisPool连接池
每次基于JedisCluster执行操作，首先JedisCluster都会在本地计算key的hashslot，然后在本地映射表找到对应的节点
如果那个node正好还是持有那个hashslot，那么就ok; 如果说进行了reshard这样的操作，可能hashslot已经不在那个node上了，就会返回moved
如果JedisCluter API发现对应的节点返回moved，那么利用该节点的元数据，更新本地的hashslot -> node映射表缓存
重复上面几个步骤，直到找到对应的节点，如果重试超过5次，那么就报错，JedisClusterMaxRedirectionException
jedis老版本，可能会出现在集群某个节点故障还没完成自动切换恢复时，频繁更新hash slot，频繁ping节点检查活跃，导致大量网络IO开销
jedis最新版本，对于这些过度的hash slot更新和ping，都进行了优化，避免了类似问题
（3）hashslot迁移和ask重定向
如果hash slot正在迁移，那么会返回ask重定向给jedis
jedis接收到ask重定向之后，会重新定位到目标节点去执行，但是因为ask发生在hash slot迁移过程中，所以JedisCluster API收到ask是不会更新hashslot本地缓存
已经可以确定说，hashslot已经迁移完了，moved是会更新本地hashslot->node映射表缓存的
-------------------------------------------------------------------------------------------------------
三、高可用性与主备切换原理
redis cluster的高可用的原理，几乎跟哨兵是类似的
1、判断节点宕机
如果一个节点认为另外一个节点宕机，那么就是pfail，主观宕机
如果多个节点都认为另外一个节点宕机了，那么就是fail，客观宕机，跟哨兵的原理几乎一样，sdown，odown
在cluster-node-timeout内，某个节点一直没有返回pong，那么就被认为pfail
如果一个节点认为某个节点pfail了，那么会在gossip ping消息中，ping给其他节点，如果超过半数的节点都认为pfail了，那么就会变成fail
2、从节点过滤
对宕机的master node，从其所有的slave node中，选择一个切换成master node
检查每个slave node与master node断开连接的时间，如果超过了cluster-node-timeout * cluster-slave-validity-factor，那么就没有资格切换成master
这个也是跟哨兵是一样的，从节点超时过滤的步骤
3、从节点选举
哨兵：对所有从节点进行排序，slave priority，offset，run id
每个从节点，都根据自己对master复制数据的offset，来设置一个选举时间，offset越大（复制数据越多）的从节点，选举时间越靠前，优先进行选举
所有的master node开始slave选举投票，给要进行选举的slave进行投票，如果大部分master node（N/2 + 1）都投票给了某个从节点，那么选举通过，那个从节点可以切换成master
从节点执行主备切换，从节点切换为主节点

亿级流量场景下，大型缓存架构设计实现，你知道吗？(13)

推荐阅读

怀来县|河北怀来县取消住房限购业内：环京楼市政策该调整了

nba|象棋中局疑难问题解答：出帅助攻左右合击

网曝储备玉米存质量问题？中储粮称视频与事实不符

「社区居委会」武汉“零新增”前后：封城两月，不是终点

『珠江』中国七大水系是哪七个，除了长江、黄河、珠江你还知道哪条

新机发布华为荣耀20再次曝光，采用侧边“指纹设别”！售价或良心

东风|东风风行将正式更换劲狮标：彻底告别双飞燕LOGO

为何农民发现母鸡学公鸡叫，就把母鸡杀掉？听完动物学家的话懂了

17亿韩元相当于多少人民币 17亿韩元相当于多少人民币百度

【中国篮球迷妹】拒绝排球女神苦追叶莉，难怪叶莉会喜欢他，姚明不仅球打得好

青年|IG淘汰后，南风言论引热议：有信心能赢，刚来IG时全队我最猛

央视网|巴基斯坦新增4133例新冠肺炎确诊病例累计逾21万例

没固定工作怎么申请信用卡？没工作怎么办理信用卡

鲁西乡土■于汉超进了拘留所

7岁孩子顶嘴叛逆怎么办，七岁孩子顶嘴的应对方法

小孩子@小孩子水痘白血病

埃及金字塔在哪个沙漠埃及金字塔位置

汪小菲|2022.1.9娱乐爆料：杨超越、刘亦菲、成龙、汪小菲、谭松韵、杨洋

跌停|强生控股跌停睿远成长价值混合为第二大流通股东

周迅|周迅平时穿的真不像是一线明星，一身洒脱背心，看着很接地气