MapR是否具有可扩展的机器学习算法。像Mahout一样?

时间:2012-01-16 12:52:28

标签: machine-learning mapreduce mahout

我特别想知道Map是否像Mahout一样拥有K Means聚类?

1 个答案:

答案 0 :(得分:5)

据我所知,MapR只是一个“更快”的Hadoop。没有包含算法。

所以你的工作应该兼容。

但实施自己的协议是什么? K-means非常简单。看我的博文: http://codingwiththomas.blogspot.com/2011/05/k-means-clustering-with-mapreduce.html

然而,我已经实现了一个带有BSP(批量同步并行)和Apache Hama的k-means集群,如果将它与本书中的Mahout基准测试结果进行比较,快几十倍:http://www.manning.com/ingersoll/(链接jira: https://issues.apache.org/jira/browse/MAHOUT-588) 以下是Apache Hama的k-means基准:http://wiki.apache.org/hama/Benchmarks

你可以在这里找到它: https://github.com/thomasjungblut/thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java