如何考虑Myrrix中的重量

时间:2013-09-16 06:37:26

标签: machine-learning collaborative-filtering myrrix

我为Myrrix提供了以下输入:

11, 101, 1
11, 102, 1
11, 103, 1
11, 104, 1000
11, 105, 1000
11, 106, 1000

12, 101, 1
12, 102, 1
12, 103, 1
12, 222, 1

13, 104, 1000
13, 105, 1000
13, 106, 1000
13, 333, 1000

我正在寻找向用户推荐的项目11.期望首先推荐项目333(因为用户13和项目104,105,106的权重更高)。

以下是Myrrix的推荐结果:

11, 222, 0.04709
11, 333, 0.0334058

请注意,建议项目222的强度为0.047,但项目333的强度仅为0.033 ---与预期结果相反。

我也希望力量的差异更大(因为1000和1是如此不同),但显然当订单甚至不是我的预期时,这是没有意义的。

如何解释这些结果以及如何考虑重量参数?我们正在一个紧张的截止日期前与一个大客户合作,并会感谢任何指针。

1 个答案:

答案 0 :(得分:1)

很难根据一个小的合成数据集来判断。我认为最重要的因素是这里的参数 - 功能的特征是什么?拉姆达?我希望功能= 2。如果它更高,我认为你很快就过度适应这个,结果主要是它完全解释用户11不与222和333交互后留下的噪音。

这些数值非常低,表明这两种情况都不太可能,因此它们的顺序可能比任何东西都要多。如果从另一个随机起点重建模型,您会看到不同的结果吗?