数据仓库与OLAP多维数据集?

时间:2013-09-20 12:20:50

标签: data-warehouse olap olap-cube

有人能解释数据仓库和OLAP多维数据集之间的真正区别吗?

对于同样的事情他们是不同的方法吗?

与其他人相比,其中一个被弃用吗?

其中一个是否存在任何性能问题?

欢迎任何解释

3 个答案:

答案 0 :(得分:84)

数据仓库是一种数据库,其设计使得分析数据更容易†(通常使用来自多个来源的数据)。它通常由事实表和维度表组成,通常是聚合表。

OLAP是一组操作,可以对数据集执行操作,例如旋转,切片,切割,钻取。例如,可以使用Excel数据透视表执行OLAP操作。

您可以拥有数据仓库而根本不使用OLAP(您只需运行报告)。

您还可以对数据仓库以外的其他内容执行OLAP操作,例如平面文件。

OLAP服务器是一种便于OLAP操作的服务器软件,例如缓存和查询重写。 OLAP操作通常以MDX表示,您的OLAP服务器可能会将MDX转换为数据库的常规SQL。或者它可能会违反自己的二进制文件格式。

  

对于同样的事情他们是不同的方法吗?

不,数据仓库是以易于分析的格式存储数据的地方,而OLAP是一种分析数据的方法。

  

与其他人相比,其中一个是否被弃用?

不,它们相互补充,因为数据仓库可以使用OLAP轻松分析数据,而OLAP可以使分析数据仓库更有用。

  

其中一个是否有任何性能问题?

是。数据仓库用于存储大量数据,因此查询需要时间。通过使用索引,缓存,partituoning以及预先聚合某些数据,可以提高性能。

另请参阅:https://dba.stackexchange.com/questions/45655/what-are-measures-and-dimensions-in-cubes

†而不是使交易更容易/更积分

答案 1 :(得分:3)

数据仓库保存您希望运行报告,分析等的数据

多维数据集通过将数据分组到定义的维度来组织此数据。您可以拥有多个维度(在Excel中考虑一个超级透视表)。

例如,在您的数据仓库中,您拥有所有销售,但运行复杂的SQL查询可能非常耗时。因此,从数据仓库中创建一个对数据进行索引和预计算的多维数据集。在您的多维数据集中,您可以拥有所有这些预先计算的维度:按月,按周,按销售人员,按客户,按地理区域,按产品颜色等进行销售。然后,您可以在多维数据集上运行OLAP查询以获得总计,平均值和(月,销售员,地区)或(颜色,地区)或(销售员,月份)的最大销售额。由于所有数据都经过预先计算和索引,因此查询速度非常快。

答案 2 :(得分:1)

  

对于同样的事情他们是不同的方法吗?

     

不,数据仓库是一个可以轻松分析存储数据的地方   格式,OLAP是一种分析数据的方法。

不,他们真的做同样的事情! OLAP比DWH更准确。 OLAP就像DWH中的聚合