在PostgreSQL

时间:2016-09-29 20:47:51

标签: postgresql plpgsql dynamic-sql postgresql-9.3 crosstab

我已经看到有一些像这样的类似问题,但我不知道如何自己编码。请记住,我只是这个领域的初学者。

基本上我想像这样转动表格:

zoom |    day     | point         zoom | 2015-10-01 |  2015-10-02 | ......
------+-----------+-------  ---> ------+------------+-------------+
   1 | 2015-10-01 |   201            1 |    201     |     685     |
   2 | 2015-10-01 |    43            2 |     43     |     346     | 
   3 | 2015-10-01 |    80            3 |     80     |     534     | 
   4 | 2015-10-01 |   324            4 |    324     |     786     | 
   5 | 2015-10-01 |    25            5 |     25     |     685     |
   1 | 2015-10-02 |   685 
   2 | 2015-10-02 |   346 
   3 | 2015-10-02 |   534 
   4 | 2015-10-02 |   555 
   5 | 2015-10-02 |   786
   :
   :
   :

时间可能会有所不同。

左边的结果我得到了:

SELECT 
zoom,
to_char(date_trunc('day', time), 'YYYY-MM-DD') AS day,
count(*) as point
FROM province
WHERE time >= '2015-05-01' AND time < '2015-06-01'
GROUP BY to_char(date_trunc('day', time), 'YYYY-MM-DD'), zoom;

我已经读过,如果我使用count会有一些问题,而且如果我使用CASEGROUP BY会更好,但是我不知道如何CASE 1}}这个。

Crosstab本身不支持动态创建列名,但如果我理解正确的话,可以使用crosstab_hash实现。

这可能是一个不错的解决方案:http://okbob.blogspot.ca/2008/08/using-cursors-for-generating-cross.html但是我一直在尝试自己编程。

我必须经常使用这种旋转方式,因此我会在其背后提供任何帮助和其他解释。

EDIT1

我试图找出交叉表如何与日期一起工作,目前没有返回列的动态名称。稍后我将解释原因。这是主要问题。对于这个例子,我只使用2个日期。

基于@Erwin Brandstetter回答:

SELECT * FROM crosstab(
       'SELECT zoom, day, point
        FROM   province
        ORDER  BY 1, 2'
      , $$VALUES ('2015-10-01'::date), ('2015-10-02')$$)
AS ct (zoom text, day1 int, day2 int);

返回的结果是:

zoom |    day1    |    day2     | 
-----+------------+-------------+
   1 |    201     |     685     |
   2 |     43     |     346     | 
   3 |     80     |     534     | 
   4 |    324     |     786     | 

我想要得到这个

zoom | 2015-10-01 |  2015-10-02 | 
-----+------------+-------------+
   1 |    201     |     685     |
   2 |     43     |     346     | 
   3 |     80     |     534     | 
   4 |    324     |     786     | 

但我的查询无效:

SELECT *
FROM crosstab(
      'SELECT *
       FROM province
       ORDER  BY 1,2')
AS ct (zoom text, "2015-10-01" date, "2015-10-02" date);

ERROR:  return and sql tuple descriptions are incompatible

Edit1,Q1。为什么这不起作用,如何返回这样的结果?

我已经阅读了@Erwin Brandstetter为我提供的链接,特别是这个:Execute a dynamic crosstab query。我复制/粘贴了他的功能:

CREATE OR REPLACE FUNCTION pivottab(_tbl regclass, 
                                    _row text, _cat text, 
                                    _expr text,
                                    _type regtype)  
RETURNS text AS
$func$
DECLARE
   _cat_list text;
   _col_list text;
BEGIN
-- generate categories for xtab param and col definition list    
EXECUTE format(
 $$SELECT string_agg(quote_literal(x.cat), '), (')
        , string_agg(quote_ident  (x.cat), %L)
   FROM  (SELECT DISTINCT %I AS cat FROM %s ORDER BY 1) x$$
 , ' ' || _type || ', ', _cat, _tbl)
INTO  _cat_list, _col_list;

-- generate query string
RETURN format(
'SELECT * FROM crosstab(
   $q$SELECT %I, %I, %s
      FROM   %I
      GROUP  BY 1, 2
      ORDER  BY 1, 2$q$
 , $c$VALUES (%5$s)$c$
   ) ct(%1$I text, %6$s %7$s)'
, _row, _cat, _expr, _tbl, _cat_list, _col_list, _type
);

END
$func$ LANGUAGE plpgsql;

并使用查询

调用它
SELECT pivottab('province','zoom','day','point','date');

功能让我回复:

                         pivottab                         
----------------------------------------------------------
 SELECT * FROM crosstab(                                 +
    $q$SELECT zoom, day, point                           +
       FROM   province                                   +
       GROUP  BY 1, 2                                    +
       ORDER  BY 1, 2$q$                                 +
  , $c$VALUES ('2015-10-01'), ('2015-10-02')$c$          +
    ) ct(zoom text, "2015-10-01" date, "2015-10-02" date)
(1 row)

所以当我编辑查询并添加时; (很高兴;已经存在了)我得到了:

ERROR:  column "province.point" must appear in the GROUP BY clause or be used in an aggregate function

Edit1,Q2。任何想法如何解决这个问题?

Edit1,Q3。我想接下来的问题将是如何自动执行函数,这也是在同一个链接上提到的,但是却被之前的步骤所困扰。

1 个答案:

答案 0 :(得分:3)

您的示例的基本交叉表查询很简单:

SELECT * FROM crosstab(
       'SELECT zoom, day, point
        FROM   province
        ORDER  BY 1, 2'

     , $$VALUES ('2015-10-01'::date), ('2015-10-02')$$)
AS ct (zoom text, day1 int, day2 int);

包含动态列名或动态列数。 作为妥协,您可以拥有固定数量的列,只填充前导列。基本信息:

动态?

crosstab_hash无法帮助您处理动态列名称。它可以在不键入列定义列表的情况下重复使用,但不能用于动态列名称。例子:

对于真正动态的列名,您需要两次往返服务器。是使用第一个查询检索列名以构建第二个查询,还是创建游标或临时表或预准备语句。无论您尝试什么,都需要两次往返。 SQL希望在调用时知道返回类型。

最接近我的动态&#34;使用我在此相关答案中定义的自定义crosstab_n()函数进行调用:

或者你放弃了一个完全动态的交叉表查询的想法(因为,你知道,这是不可能的)并且使用两步工作流程,如上所述。

  1. 让函数生成交叉表查询文本。您可以使用此处提供的功能(并根据您的需要进行调整!):

    特别要删除GROUP BY 1, 2,因为您不会在交叉列表之前汇总行。

  2. 执行生成的功能。

  3. 为了完整性,Postgres中还有新的\crosstabview metacommand in psql 9.6 (刚刚发布) - 具有类似的功能,它可以显示动态列名(在psql中附加动态名称)客户端,而不是Postgres服务器。)