大型数据集和小型数据集之间的Impala IO性能差异

时间:2018-09-18 02:55:45

标签: io impala disk

我对不同大小的数据集(例如3T数据集和10T数据集)有一个相同的查询。 这两个数据集上查询的区别在于,小数据上的磁盘吞吐量比大数据集上的磁盘吞吐量小得多(小数据集上的平均磁盘速度为20MB / s,大数据集上的平均磁盘速度为80MB / s)。 有没有人遇到过这种现象?

0 个答案:

没有答案