从现有数据生成针对推荐系统的测试数据集

时间:2014-06-24 17:53:42

标签: scala apache-spark recommendation-engine

我正在尝试使用scala API为apache-spark构建推荐系统。

我有一个表格的数据集(用户,产品,评级),用于所有用户评价的所有项目。为了给出建议,我需要一个形式(U,P)的数据集,其中包含我的初始数据集中不存在的所有U,P对。 (用户,每个用户尚未购买的所有产品的产品对)。谁知道有任何直接的方法来做到这一点?

ps-您可以假设除了初始集合中的用户或项目之外没有其他用户或项目。

任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

相关问题