Hive查询 - 加入或子查询

时间:2014-12-02 07:29:16

标签: join subquery hive

我正在寻找一个高性能的查询。我有2张桌子:

  1. productviews(timecol TIMESTAMP, user_id STRING, product_id INT,location_city STRING)

  2. productactions(timecol TIMESTAMP, user_id STRING, product_id INT,location_city STRING,action STRING)

  3. 动作可以是例如购物车插页。

    我需要运行按location_city或product_id分组的查询:

    SELECT *,count(productviews),count(productactions),count(DISTINCT user_id)FROM xxx GROUP BY xxx

    有人有想法吗?

0 个答案:

没有答案