【】月均活跃用户达1.3亿,B站高可用架构实践( 四 )
第四 , 超时控制强调两个点 , 进程内的超时和跨进程的传递 。 最终它的超时链路是由最上层的一个节点决定的 , 只要这一点做到了 , 我觉得大概率是不太可能出现连锁故障的 。
第五 , 变更管理 。 我们通常情况下发布都是因为一些变更导致的 , 所以说我们在变更管理上还是要加强 , 变更流程中出现的破坏性行为应该要进行惩罚 , 尽管是对事不对人 , 但是还是要进行惩罚以引起重视 。
第六 , 极限压测和故障演练 。 在做压测的时候 , 可能压到报错就停了 。 我建议最好是在报错的情况下 , 仍然要继续加压 , 看你的服务到底是一个什么表现?它能不能在过载的情况下提供服务?
在上了过载保护算法以后 , 继续加压 , 积极拒绝 , 然后结合熔断的话 , 可以产生一个立体的保护效果 。
经常做故障演练可以产生一个品控手册 , 每个人都可以学习 , 经常演练不容易慌乱 , 当在生产环境中真的出现问题时也可以快速投入解决 。
第七 , 考虑扩容、重启、消除有害流量 。
本文插图
如上图所示的参考 , 就是对以上几个策略的经典补充 , 也是解决各种服务问题的玄学 。
作者:毛剑
简介:bilibili 技术总监 , 腾讯云最具价值专家(TVP) 。 负责 bilibili 数据平台部 , 拥有近十年的服务端研发经验 。 擅长高性能、高可用的服务端研发 , 熟悉 Go、Java、C 等语言 。 在 B 站参与了 , 从巨石架构到微服务的完整转型 , 包含微服务治理、微服务可用性设计 , 微服务数据一致性设计 , 微服务中间件 , 微服务监控 , 微服务日志收集 , 微服务负载均衡 , 和微服务 RPC 框架开发等 。 开源业内比较有影响力的项目:https://github.com/Terry-Mao/goim , 分布式 IM 长连接广播服务;https://github.com/Terry-Mao/bfs , 分布式小文件存储 。
编辑:陶家龙
【【】月均活跃用户达1.3亿,B站高可用架构实践】出处:转载自微信公众号云加社区(ID:QcloudCommunity),本文是 B 站技术总监毛剑老师在「云加社区沙龙 online」的分享整理 。
推荐阅读
- 数码酷玩汇|6000元国产手机值不值得买?4款顶级旗舰用户评价复盘
- 音频怪物|彻底冲击销量!三星全能中端机能否收割更多用户,因为价格实在
- 用户用实力“打卡”外太空:荣耀30为十二星座“定妆”
- 推送|已经有用户的Pixel设备收到Android 11 Beta更新
- 联想|联想个人云存储Mac版上线 苹果电脑用户数据备份更便捷
- 生活海风说|Firefox 用户将很快能够获得把浏览器中的密码导出至本地的功能
- |稳定币周报:稳定币总活跃地址数创新高,揭秘DAI的用户画像
- 融资微信否认监听用户聊天记录;苹果将投3.3亿美元在台建厂;小鹏汽车秘密提交IPO文件
- 用户|继“梨喔喔”后,京东再推陌生人社交产品“盼汐”
- 极客微视数码说TB|iOS凌晨紧急推送!文字少事件大,建议iPhone用户都了解
