数据仓库工具箱3

大数据22

1 值链

数据仓库工具箱3

了解数据流通路径。

; 2 库存模型

2.1 周期库存快照

数据仓库工具箱3

快照数据量大,过于稠密会造成损害。
可降低快照频度。

记录静态水平(库存水平、财务账户结余以及房间温度这样的密集量度值)的所有量度值在跨日期维度和可能的其他维度范围内,都是天生不可加的。在这些情况下,量度值可以进行有用的跨时间聚集,比如在时间周期数上进行平均。

数据仓库工具箱3
数据仓库工具箱3

; 2.2 库存事务

数据仓库工具箱3

2.3 库存累积快照

数据仓库工具箱3

; 3 值链的集成

业务处理之间的维度共享

4 数据仓库总线结构

4.1 数据仓库总线矩阵

数据仓库工具箱3
总线矩阵的行与数据中心相对应。如果数据来源不相同,处理功能不相同,或者矩阵行所代表的内容不能放在单个迭代过程中合理地完成,就应该创建独立的矩阵行。

需按照数据来源而不是按照机构业务部门确定业务处理。

; 4.2 一致性维度

一致性维度要么是同一的,要么是具有最佳粒度性与细节性的维度在严格数学意义上的子集。
一致的维度具有一致的维度关键字、一致的属性列名字、一致的属性定义以及一致的属性值(将转化成一致的报表标签与分组标识)。
如果属性标签的标记不同或者包含不同的值,维度表就不是一致的(不被处理成一致的)。

堆积维度如果是基本层次上原子型维度严格意义上的子集,则堆积维度与原子型维度保持一致。

4.3 一致性事实

最必须在数据命名实践中接受规程的约束。如果不可能做到使事实完全保持一致,那么应该对不同的解释给出不同的名称。这样可以减少计算中使用不兼容的事实的可能性。

Original: https://blog.csdn.net/WYAN0_/article/details/122679126
Author: WYAN0_
Title: 数据仓库工具箱3