如何在运行查询时使mysql比hadoop慢?

时间:2015-04-17 11:08:06

标签: mysql sql performance hadoop time

我想问一个有点奇怪的问题。我有一个hadoop项目,我想比较hadoop和mysql时间性能。我已经做了hadoop应用来计算一些东西。如果转换为SQL,该应用程序将成为COUNT查询并加入某些表。

首先,我尝试在SQL上使用大约100.000记录的小表,并查询大约0.3或0.4秒。所以,我想复制和扩大具有更多记录的表,以查看hadoop的功能而不是mysql。什么与重复数据我可以使hadoop大于mysql?或者我还能做些什么来证明hadoop时间性能比mysql还高?

1 个答案:

答案 0 :(得分:1)

为了获得比mysql更好的性能,您的数据大小应该非常大。例如,如果您的数据是1GB。你将并行运行16个Mappers。如果您的数据小于64 MB,您将使用单个Mapper,在这种情况下您不会看到性能提升。因此,请确保您的数据足以测试性能。