如何使用mapreduce执行决策树查找?我正在寻找一个优化版本

时间:2011-04-19 15:05:10

标签: decision-tree

我有数百万个节点的决策树,在HDFS上序列化。任何人都可以帮我提供一些指针,以便更好地进行序列化,以便我可以使用map reduce在Hadoop上更有效地执行搜索。

感谢。

1 个答案:

答案 0 :(得分:0)

为了遍历您的树,您需要将模型加载到内存中。加载后,执行实例的遍历非常简单快捷。您无法避免将模型存储到hdfs中,因此为了执行更好的遍历,您需要在主内存中做更好的事情。但正如我所说,树木遍历总是超级快。也许提供一些关于你的问题的更多信息会很好。您的问题是拥有数百万个新示例并预测其标签?