数据仓库 - 在Fact表中存储历史数据

时间:2014-02-26 19:37:09

标签: data-warehouse dimensional-modeling fact

我是DataWarehousing的初学者。我们创建了一个数据集市,一个星型模式设计来加载季度数据。我们在该季度的业务批准时加载了当前数据。

现在我们需要返回并加载历史数据(3年,大约40GB)。加载此数据的维度与用于qaurterly加载的维度相同。但是,我们可以将这些历史数据加载到同一个事实表中,还是我们必须创建一个重复的事实表来单独加载历史数据?这是DW标准吗?我试图找到按照标准执行此操作的方法。

当前事实表是在load_cycle_date上分区的日期,它指定加载数据的季度。

非常感谢!

1 个答案:

答案 0 :(得分:0)

我不明白为什么获取历史数据并使用较旧的load_cycle_dates不适合您现有的表。这假设您能够将它们转换为此格式。这是基于多年来数据结构发生了多大变化。

您还需要了解其他方面:

  1. 您的所有尺寸都有足够的历史价值吗?示例:客户评级。可能有客户最终获得“差”评级,但事先并非如此。每次更改都需要有记录。另一种方法是从备份中提取数据。
  2. 审批流程 - 通常在开始之前不会发现大量数据差异。因此,可能会对应用程序进行更改以进行这些更正。您可能会发现某些报告在此“先前数据仓库”数据中运行时将不准确。
  3. 没有理由你不能在一个季度内完成这项工作并进行测试。这是你肯定知道的唯一方法。我使用的当前数据仓库在仓库启动之前经历了添加数据的相同过程。转换很常见。