软件架构|基于Flink和ClickHouse打造轻量级点击流实时数仓
【软件架构|基于Flink和ClickHouse打造轻量级点击流实时数仓】Flink和ClickHouse分别是实时计算和(近实时)OLAP领域的翘楚 , 也是近些年非常火爆的开源框架 , 很多大厂都在将两者结合使用来构建各种用途的实时平台 , 效果很好 。
点击流数仓分层设计
点击流实时数仓的分层设计仍然可以借鉴传统数仓的方案 , 以扁平为上策 , 尽量减少数据传输中途的延迟 。 简图如下 。

文章图片
*DIM层:维度层 , MySQL镜像库 , 存储所有维度数据 。
*ODS层:贴源层 , 原始数据由Flume直接进入Kafka的对应topic 。
*DWD层:明细层 , 通过Flink将Kafka中数据进行必要的ETL与实时维度join操作 , 形成规范的明细数据 , 并写回Kafka以便下游与其他业务使用 。 再通过Flink将明细数据分别写入ClickHouse和Hive打成大宽表 , 前者作为查询与分析的核心 , 后者作为备份和数据质量保证(对数、补数等) 。
*DWS层:服务层 , 部分指标通过Flink实时汇总至Redis , 供大屏类业务使用 。 更多的指标则通过ClickHouse物化视图等机制周期性汇总 , 形成报表与页面热力图 。 特别地 , 部分明细数据也在此层开放 , 方便高级BI人员进行漏斗、留存、用户路径等灵活的ad-hoc查询 , 这些也是ClickHouse远超过其他OLAP引擎的强大之处 。
推荐阅读
- Zen3架构!锐龙5000G桌面APU样品现身:单核战平i9-10900K
- 华硕基于WRX80的主板现身 为AMD Ryzen Threadripper Pro打造
- Looking Glass推出由全息成像技术打造的3D照片软件
- 运动计数开发项目的对抗赛:飞算全自动软件工程平台碾压传统模式
- 每经18点丨美将禁止支付宝、微信支付等8个中国应用软件,外交部回应;铁路部门推出免费退票措施;违反居家隔离规定外出,大连3人被拘
- 微软新版电子邮件客户端截图曝光:基于网页端Outlook
- 别怪电池不耐用,这3类软件才是手机“耗电大户”,赶快告诉家人
- NVIDIA 5nm架构猛料:流处理器超1.84万个
- 戴尔新发布的商用显示器包含微软Teams软件专用按钮
- 曝光 | 小鹏或春节前推送NGP更新,基于高精地图可自动变道
