我们的源数据看起来像这样(在excel电子表格上,实际上有更多列,但这说明了我们的问题):
Year Institution Weight AVG
2000 B1 13.90%
2000 B2 11.09%
2000 U1 11.73%
2000 U2 11.27%
2000 Total 2000 12.77%
2001 B1 14.24%
2001 B2 10.72%
2001 U1 11.77%
2001 U2 10.80%
2001 Total 2001 12.90%
在我的第一次尝试中,我迁移了除Totals之外的所有数据,然后我使用简单的平均值来聚合Weight AVG度量,但是我们都知道这不是聚合的正确值。如果我们有权重因子,我们可以创建一个正确聚合的自定义度量。
我们想要实现的是在聚合某些维度时显示相应的总计,在这种情况下,时间维度(不是默认值,如总和,计数甚至简单平均值,但实际权重AVG总计):
Year Weight AVG
2000 12.77%
2001 12.90%
如果我们尝试查看“机构”维度,则度量应显示空白值,因为源数据上没有“机构总计”:
Institution Weigh AVG
B1 -
B2 -
U1 -
U2 -
据我所知,我需要存储源上存在的每个总数并覆盖默认聚合以显示我们想要的内容,但是如何存储它(表 - 关系),以及如何相应地设计立方体?。
这也需要使用更多列,例如,如果我添加一个Inst.Type及其相应的总数:
Year Inst.Type Institution Weight AVG
2000 Type B B1 13.90%
2000 Type B B2 11.09%
2000 Type B Total B 11.02%
2000 Type U U1 11.73%
2000 Type U U2 11.27%
2000 Type U Total U 11.03%
2000 Total 2000 12.77%
2001 Type B B2 14.24%
2001 Type B Total B 14.24%
2001 Type U U1 10.80%
2001 Type U U2 10.30%
2001 Type U Total U 10.50%
2001 Total 2001 12.90%
我们可以在多维数据集上看到更多聚合,具体取决于可见的维度,例如:
Year Inst.Type Weight AVG
2000 Total B 11.02%
2000 Total U 11.03%
2001 Total B 14.24%
2001 Total U 10.50%
以及(再次):
Year Weight AVG
2000 12.77%
2001 12.90%
希望我明确表示,感谢所提供的任何意见。