1 值链
了解数据流通路径。
; 2 库存模型
2.1 周期库存快照
快照数据量大,过于稠密会造成损害。
可降低快照频度。
记录静态水平(库存水平、财务账户结余以及房间温度这样的密集量度值)的所有量度值在跨日期维度和可能的其他维度范围内,都是天生不可加的。在这些情况下,量度值可以进行有用的跨时间聚集,比如在时间周期数上进行平均。
; 2.2 库存事务
2.3 库存累积快照
; 3 值链的集成
业务处理之间的维度共享
4 数据仓库总线结构
4.1 数据仓库总线矩阵
总线矩阵的行与数据中心相对应。如果数据来源不相同,处理功能不相同,或者矩阵行所代表的内容不能放在单个迭代过程中合理地完成,就应该创建独立的矩阵行。
需按照数据来源而不是按照机构业务部门确定业务处理。
; 4.2 一致性维度
一致性维度要么是同一的,要么是具有最佳粒度性与细节性的维度在严格数学意义上的子集。
一致的维度具有一致的维度关键字、一致的属性列名字、一致的属性定义以及一致的属性值(将转化成一致的报表标签与分组标识)。
如果属性标签的标记不同或者包含不同的值,维度表就不是一致的(不被处理成一致的)。
堆积维度如果是基本层次上原子型维度严格意义上的子集,则堆积维度与原子型维度保持一致。
4.3 一致性事实
最必须在数据命名实践中接受规程的约束。如果不可能做到使事实完全保持一致,那么应该对不同的解释给出不同的名称。这样可以减少计算中使用不兼容的事实的可能性。
Original: https://blog.csdn.net/WYAN0_/article/details/122679126
Author: WYAN0_
Title: 数据仓库工具箱3