PostgreSQL GROUP BY与MySQL不同?

时间:2009-11-20 09:34:54

标签: sql mysql ruby-on-rails postgresql heroku

我一直在将一些MySQL查询迁移到PostgreSQL以使用Heroku。我的大多数查询都运行正常,但是当我使用group by时,我仍然遇到类似的重复错误:

  

错误:列“XYZ”必须出现在GROUP BY子句中或用于   聚合函数

有人能告诉我我做错了吗?


MySQL 100%工作:

SELECT `availables`.*
FROM `availables`
INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
GROUP BY availables.bookdate
ORDER BY availables.updated_at


PostgreSQL错误:

  

ActiveRecord :: StatementInvalid:PGError:ERROR:列   “availables.id”必须出现在GROUP BY子句中或用于   总功能:
  选择“availables”。* FROM“availables”INNER   在“房间”上加入“房间”.id =“availables”.room_id在哪里   (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN E'2009-10-21'   AND E'2009-10-23')GROUP BY availables.bookdate ORDER BY   availables.updated_at


生成SQL的Ruby代码:

expiration = Available.find(:all,
    :joins => [ :room ],
    :conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
    :group => 'availables.bookdate',
    :order => 'availables.updated_at')  


预期输出(来自MySQL查询):

+-----+-------+-------+------------+---------+---------------+---------------+
| id  | price | spots | bookdate   | room_id | created_at    | updated_at    |
+-----+-------+-------+------------+---------+---------------+---------------+
| 414 | 38.0  | 1     | 2009-11-22 | 1762    | 2009-11-20... | 2009-11-20... |
| 415 | 38.0  | 1     | 2009-11-23 | 1762    | 2009-11-20... | 2009-11-20... |
| 416 | 38.0  | 2     | 2009-11-24 | 1762    | 2009-11-20... | 2009-11-20... |
+-----+-------+-------+------------+---------+---------------+---------------+
3 rows in set

9 个答案:

答案 0 :(得分:107)

MySQL完全不符合标准的GROUP BY可以由Postgres'DISTINCT ON模仿。考虑一下:

MySQL的:

SELECT a,b,c,d,e FROM table GROUP BY a

这为a的每个值提供了1行(哪一个,你真的不知道)。实际上你可以猜到,因为MySQL不知道哈希聚合,所以它可能会使用排序......但它只会在a上排序,所以行的顺序可能是随机的。除非它使用多列索引而不是排序。好吧,无论如何,它没有被查询指定。

Postgres的:

SELECT DISTINCT ON (a) a,b,c,d,e FROM table ORDER BY a,b,c

这为a的每个值提供了1行,根据查询指定的ORDER BY,此行将是排序中的第一行。简单。

请注意,这里不是我正在计算的聚合。所以GROUP BY实际上毫无意义。 DISTINCT ON更有意义。

Rails与MySQL结合在一起,所以我对它产生的SQL在Postgres中不起作用并不感到惊讶。

答案 1 :(得分:16)

PostgreSQL比MySQL更符合SQL。输出中的所有字段(除具有聚合函数的计算字段)必须存在于GROUP BY子句中。

答案 2 :(得分:8)

MySQL的GROUP BY可以在没有聚合函数的情况下使用(这与SQL标准相反),并返回组中的第一行(我不知道基于什么标准),而PostgreSQL必须具有聚合函数列上的(MAX,SUM等),在其上发布GROUP BY子句。

答案 3 :(得分:4)

正确,修复此问题的解决方法是使用:选择并选择您希望用结果对象装饰的每个字段。

令人讨厌 - 但是分组的工作原理是什么,而不是MySQL如何通过猜测你的意思,如果你不在你的组中粘贴字段,那么它是如何工作的。

答案 4 :(得分:3)

如果我没记错的话,在PostgreSQL中你必须添加从GROUP BY子句将应用于 GROUP BY子句的表中提取的每一列。

答案 5 :(得分:2)

不是最漂亮的解决方案,但更改group参数以输出模型中的每一列都在PostgreSQL中工作:

expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => Available.column_names.collect{|col| "availables.#{col}"},
:order => 'availables.updated_at')

答案 6 :(得分:1)

根据MySQL“Debunking GROUP BY Myths”http://dev.mysql.com/tech-resources/articles/debunking-group-by-myths.html。 SQL(标准的2003版本)不要求查询的SELECT列表中引用的列也出现在GROUP BY子句中。

答案 7 :(得分:1)

对于其他人在postgresql中寻找任何字段(包括连接字段)的订购方式,请使用子查询:

SELECT * FROM(
SELECT DISTINCT ON(availables.bookdate) `availables`.* 
FROM `availables` INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id 
WHERE (rooms.hotel_id = 5056 
AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
) AS distinct_selected
ORDER BY availables.updated_at

or arel:

subquery = SomeRecord.select("distinct on(xx.id) xx.*, jointable.order_field")
      .where("").joins(")
result = SomeRecord.select("*").from("(#{subquery.to_sql}) AS distinct_selected").order(" xx.order_field ASC, jointable.order_field ASC")

答案 8 :(得分:0)

我认为.uniq [1]会解决你的问题。

[1] Available.select('...').uniq

查看http://guides.rubyonrails.org/active_record_querying.html#selecting-specific-fields