物品推荐服务

时间:2015-08-31 07:36:03

标签: service recommendation-engine collaborative-filtering

我应该使用MyMediaLite进行图书推荐服务。到目前为止,我已经使用Nutch crawler从网站上收集了书籍并将信息存储到hbase中。问题是我实际上并不完全理解这一切是如何起作用的。通过示例,我必须传递测试数据和训练数据文件,其中包含用户项ID对和评级。但是,类别和作者的其他信息呢?如何找到类似的"书籍,他们的信息等,没有关于用户的信息(到目前为止)?是否可以直接从hbase传递数据,而无需将其存储到文件然后导入? 或者对于这项工作更适合Apache Mahout或LibRec?

1 个答案:

答案 0 :(得分:0)

用户项目评级信息(通常在矩阵中)是协同过滤算法(用户 - 用户CF,项目 - 项目CF,矩阵分解等)的基础。您正在使用其他人的意见来形成建议。对于物品本身的内容没有天生的认可。为此,您需要某种基于内容的过滤算法或数据挖掘技术。这些通常用于您所描述的“用户冷启动”场景:您有很多关于项目的信息,但没有关于特定用户的偏好。

首先,考虑一下您的最终目标和您拥有的数据。根据您的产品需求和可用数据,您可以为您的目的选择正确的算法。我强烈推荐使用Coursera的RecSys课程来学习更多内容:https://www.coursera.org/learn/recommender-systems。它由该领域的领导者教授。