数据仓库 - 非易失性与变更数据捕获

时间:2014-09-30 06:42:27

标签: data-warehouse

有人说数据仓库是非易失性的。这意味着不允许更新数据。

但是,有时候我们必须捕获数据的变化。例如,交易状态的变化。

然后更改数据捕获作为解决方案。

我的问题是,我们应该依赖数据仓库的基本概念,是非易失性的吗?如果我们应该,那么捕获数据变化的另一种选择是什么?

2 个答案:

答案 0 :(得分:2)

非易失性并不代表"没有更新"。累积快照事实表通常使用更新。非易失性更多地涉及数据不被丢弃的概念,它不是暂时的。即使存档旧数据,仍然可以在某个时刻检索它。至少这是我理解这条建议的方式。

我更愿意完全避免更新,主要是通过插入"更正事实"。例如,您有一个带有帐户余额的快照事实表。在某一天,帐户余额为1000;迟到的事实改变了这种平衡,它现在应该是1100.我不是更新先前插入的事实,而是插入一个值为100的校正事实,即先前已知值和新值之间的差值。但是,对于累积快照事实表,这可能是不可能或不推荐的。跟踪状态更改通常通过累积快照来建模,这需要更新。

答案 1 :(得分:0)

当我们说数据仓库是易变的时,仅表示数据在数据仓库中是稳定的。添加了更多数据,但从未删除数据。这使管理层能够获得一致的业务状况。