如何根据日期范围过滤分区

时间:2018-06-05 12:13:15

标签: hive partitioning data-partitioning

我有一个hive表,它以UTC为y, m, d, h, min(y = 2018 / m = 06 / d = 05 / h = 10 / min = 00)进行分区。我将根据IST中的日期范围查询此表。例如。如果我想在IST中查询12-04-2018到16-06-2018的日期范围,那么我最终会得到一个复杂的过滤查询,它看起来像:

y=2018 && ( m=05 || (m=04 && d>12) || (m=04 && d=12 && h>18) || (m=06 && d<16) || (m=06 && d=16 && h<=18))

查询不完全正确,因为我在这里忽略了min。但它变得非常复杂。

是否有一种优雅的方法可以有效地仅查询所需的分区。我遇到了this帖子,但由于其数量不足以让我轻松重新分区我的数据。

0 个答案:

没有答案