蜂巢上非分区表的优点?

时间:2015-08-06 21:17:44

标签: hive

Hive上的非分区表是否有任何优点 - 与分区表相比它们的特殊用例?

如果有人能提供帮助,那就太棒了。 :)

1 个答案:

答案 0 :(得分:3)

让我们这样说:在数据库世界中,分区可以用来解决不同类型的问题。只要你没有明确的问题,不要打扰分区(即"如果它没有被破坏,就不要修复它") 。无论何时遇到问题,请让DB架构师找到解决方案 - 可能涉及分区,也许不会。

但是Hive不是典型的数据库。分区无处不在,只是因为它缺乏索引是一个粗略的解决方法......

(嗯,实际上ORC格式有自己的解决方法[存储每个条带的每列最小/最大值,这允许跳过无用条纹]因此分区对于该格式不那么重要)