使用hadoop map连接非常大的数据集

时间:2012-06-12 10:09:14

标签: hadoop

使用hadoop map reduce对2个非常大的数据集执行连接的最佳方法是什么?像arraylists这样的分布式缓存或临时存储将无法存储中间数据,因为两个数据集都非常大。

0 个答案:

没有答案