Apache Mahout基于用户的推荐结果的顺序是不确定的

时间:2015-12-08 14:59:07

标签: mahout mahout-recommender

目前,我正在实施Mahout的基于用户的推荐系统,请参阅http://mahout.apache.org/users/recommender/userbased-5-minutes.html

最初,我认为我可以实现某种分页:用户查询第一页并获取前N个项目,他们查询第二个页面并获取下一个N项目,依此类推。由于Mahout不提供这样的功能,我想通过查询第1页上的N个项目,第2页上的2 * N个项目等来解决,然后只返回对查询页面正确的项目。

但是,当我使用例如10个项目运行推荐程序时,在下一个查询中我运行了20个项目的推荐程序,然后返回列表的顺序不同(这使得它无法实现)对我来说是分页)。怎么可能?当使用相同的数据查询时,它不应该返回相同的结果吗?

注意:基础数据没有改变。

1 个答案:

答案 0 :(得分:1)

大多数推荐人都有一个随机过程来对用于计算模型的数据进行下采样,以使其具有O(n)复杂度。如果希望下采样具有确定性,则可以提供固定的RNG种子值。如何执行此操作取决于您使用的推荐器的包装。

您使用的是内存版本,Hadoop版本还是Spark版本+搜索引擎?

最新的Mahout推荐代码完全集成到事件摄取,模型计算和实时服务this version这里RNG种子位于配置文件engine.json中。