Mahout:如何格式化,加载和处理数据以进行分类?

时间:2012-05-22 17:42:42

标签: java mahout

JavaDocs和mahout快速入门页面非常糟糕。我在行动书中得到了Mahout的副本。我已经阅读了Mahout in Action书中的大量文章,它只关注Reccomender系统的格式化数据。

如何格式化包含分类数据的文件?

如何将其加载到mahout的DataModel中,还是有不同的数据模型进行分类? (我看到了一些关于矢量的东西)

您如何获取该数据模型并将其与您的分类系统合并?

1 个答案:

答案 0 :(得分:0)

(刚刚看到你的另一个问题。)

我认为这些文档一般都不好。只有像你这样的人添加文档才会变得更好。但是,Mahout不是一个产品,甚至也不是真正的图书馆。它是开发人员的代码,几乎必须用作代码。

大多数分类(我知之甚少)使用Vector,因此使用VectorWritable作为输入的Hadoop有线格式。

DataModel与分类器无关,没有对应物。这是推荐人的一部分。