scala - 从现有数据生成针对推荐系统的测试数据集

我正在尝试使用scala API为apache-spark构建推荐系统。

我有一个表格的数据集（用户，产品，评级），用于所有用户评价的所有项目。为了给出建议，我需要一个形式（U，P）的数据集，其中包含我的初始数据集中不存在的所有U，P对。（用户，每个用户尚未购买的所有产品的产品对）。谁知道有任何直接的方法来做到这一点？

ps-您可以假设除了初始集合中的用户或项目之外没有其他用户或项目。

任何帮助将不胜感激。