具有不同更新计划的事实表

时间:2010-10-12 20:11:46

标签: database-design data-warehouse

我有两组具有相同粒度级别的数据,例如发票编号。由于我们确认以前的发票收入,因此所需的大部分数据每天都会更新。但是,这些数据中的一部分每月通过一个单独的成本计算系统提供,然后通过附加信息提供给数据仓库。我应该创建一个包含两组数据的事实表,然后在导入其他数据时每月在事实表上运行一次更新,或者由于更新计划不同,我应该创建两个事实表。数据是相关的,许多查询(约35%)将需要来自两组数据的信息(当可用时)。系统每天将30,000行导入事实表中,其中包含大约38,000,000行,每月更新将影响660,000行。

1 个答案:

答案 0 :(得分:4)

如果在第二步中未修改已存在的度量,则可以将事实表视为“累积快照”。 该表描述了具有明确开始和最终工作流程的流程。在Kimball的数据仓库工具包中查找,或者只查看Google“Kimball累积快照事实表”。