标签: scala apache-spark recommendation-engine
我正在尝试使用scala API为apache-spark构建推荐系统。
我有一个表格的数据集(用户,产品,评级),用于所有用户评价的所有项目。为了给出建议,我需要一个形式(U,P)的数据集,其中包含我的初始数据集中不存在的所有U,P对。 (用户,每个用户尚未购买的所有产品的产品对)。谁知道有任何直接的方法来做到这一点?
ps-您可以假设除了初始集合中的用户或项目之外没有其他用户或项目。
任何帮助将不胜感激。
答案 0 :(得分:0)
本教程对您非常有帮助:
http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html