如何从hadoop配置单元计算日期列(累计包括今天)的count(customer_id)

时间:2015-09-07 05:08:52

标签: hive

有没有什么方法可以获取今天的累计count(customer_id)日期和今天的日期,在Hive中?此格式的日期列:

20120907

我的数据集中有2列,customer_iddate

我的表格中还有分区,customer_id列中的一些值为NULL。我不确定是否有重复,所以我将使用

count(distinct(customer_id))

以下是我的数据示例。

customer_id  date
10001         20140901
10003         20141001
NULL          20150101
10007         20150102

如果您需要更多信息,请与我们联系。

0 个答案:

没有答案
相关问题