CSDN|一文带你认清数据仓库“维度模型设计”与“分层架构” | 原力计划( 二 )
- 业务库
- 埋点日志
- 消息队列
- DWD:data warehouse detail细节数据层 , 是业务层与数据仓库的隔离层 。
- DWB:data warehouse base 基础数据层 , 存储的是客观数据 , 一般用作中间层 , 可以认为是大量指标的数据层 。
- DWS:data warehouseservice 服务数据层 , 基于DWB上的基础数据 , 整合汇总成分析某一个主题域的服务数据 , 一般是宽表 。
本文插图
(1)ODS 数据准备层功能:ODS层是数据仓库准备区 , 为DWD层提供基础原始数据 , 可减少对业务系统的影响 。建模方式及原则:从业务系统增量抽取、保留时间由业务需求决定、可分表进行周期存储、数据不做清洗转换与业务系统数据模型保持一致、按主题逻辑划分 。(2)DWD 数据明细层功能:为DW层提供来源明细数据 , 提供业务系统细节数据的长期沉淀 , 为未来分析类需求的扩展提供历史数据支撑 。建模方式及原则:数据模型与ODS层一致 , 不做清洗转换处理 , 为支持数据重跑可额外增加数据业务日期字段、可按年月日进行分表、用增量ODS层数据和前一天DWD相关表进行merge处理 。(3)DW(B/S) 数据汇总层功能:为DW、ST层提供细粒度数据 , 细化成DWB和DWS;
- DWB是根据DWD明细数据进行转换 , 如维度转代理键、身份证清洗、会员注册来源清晰、字段合并、空值处理、脏数据处理、IP清晰转换、账号余额清洗、资金来源清洗等;
- DWS是根据DWB层数据按各个维度ID进行高粒度汇总聚合 , 如按交易来源 , 交易类型进行汇合 。
- 聚合、汇总增加派生事实;
- 关联其它主题的事实表 , DW层可能会跨主题域;
- DWB保持低粒度汇总加工数据 , DWS保持高粒度汇总数据;
- 数据模型可能采用反范式设计 , 合并信息等 。
- 尽量减少数据访问时计算(优化检索)
- 维度建模 , 星型模型
- 事实拉宽 , 度量预先计算
- 分表存储
- ST层面向用户应用和分析需求 , 包括前端报表、分析图表、KPI、仪表盘、OLAP、专题等分析 , 面向最终结果用户;
- 适合作OLAP、报表模型 , 如ROLAP , MOLAP;
推荐阅读
- |一文速览五月份隐私币重大进展:Monero、Zcash、Grin、Beam
- CSDN|牛!2020年,这项技术将获得99000000000元人民币“国家领投”!
- CSDN|儿童节教你用 Python 画出童年回忆
- CSDN|“不要害怕 RAID!”
- 腾讯科技|一文读懂网易招股书亮点:发售价不高于126港元 研发人员超1万名
- CSDN|Rust 让人奔溃的那些特性!
- CSDN|基础软件,未来只有开源一条路?
- CSDN|本来想用“{{”秀一波,结果却导致了内存溢出!
- CSDN|云计算,巨头们的背水一战
- CSDN|2020 AI 产业图谱启动,勾勒中国 AI 技术与行业生态
