Question

我一直在将一些MySQL查询迁移到PostgreSQL以使用Heroku。我的大多数查询都运行正常，但是当我使用group by时，我仍然遇到类似的重复错误：

错误：列“XYZ”必须出现在GROUP BY子句中或用于聚合函数

有人能告诉我我做错了吗？

MySQL 100％工作：

SELECT `availables`.*
FROM `availables`
INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
GROUP BY availables.bookdate
ORDER BY availables.updated_at

PostgreSQL错误：

ActiveRecord :: StatementInvalid：PGError：ERROR：列   “availables.id”必须出现在GROUP BY子句中或用于   总功能：
  选择“availables”。* FROM“availables”INNER   在“房间”上加入“房间”.id =“availables”.room_id在哪里   （rooms.hotel_id = 5056 AND availables.bookdate BETWEEN E'2009-10-21'   AND E'2009-10-23'）GROUP BY availables.bookdate ORDER BY   availables.updated_at

生成SQL的Ruby代码：

expiration = Available.find(:all,
    :joins => [ :room ],
    :conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
    :group => 'availables.bookdate',
    :order => 'availables.updated_at')

预期输出（来自MySQL查询）：

+-----+-------+-------+------------+---------+---------------+---------------+
| id  | price | spots | bookdate   | room_id | created_at    | updated_at    |
+-----+-------+-------+------------+---------+---------------+---------------+
| 414 | 38.0  | 1     | 2009-11-22 | 1762    | 2009-11-20... | 2009-11-20... |
| 415 | 38.0  | 1     | 2009-11-23 | 1762    | 2009-11-20... | 2009-11-20... |
| 416 | 38.0  | 2     | 2009-11-24 | 1762    | 2009-11-20... | 2009-11-20... |
+-----+-------+-------+------------+---------+---------------+---------------+
3 rows in set

Answer 1

MySQL完全不符合标准的GROUP BY可以由Postgres'DISTINCT ON模仿。考虑一下：

MySQL的：

SELECT a,b,c,d,e FROM table GROUP BY a

这为a的每个值提供了1行（哪一个，你真的不知道）。实际上你可以猜到，因为MySQL不知道哈希聚合，所以它可能会使用排序......但它只会在a上排序，所以行的顺序可能是随机的。除非它使用多列索引而不是排序。好吧，无论如何，它没有被查询指定。

Postgres的：

SELECT DISTINCT ON (a) a,b,c,d,e FROM table ORDER BY a,b,c

这为a的每个值提供了1行，根据查询指定的ORDER BY，此行将是排序中的第一行。简单。

请注意，这里不是我正在计算的聚合。所以GROUP BY实际上毫无意义。 DISTINCT ON更有意义。

Rails与MySQL结合在一起，所以我对它产生的SQL在Postgres中不起作用并不感到惊讶。

Answer 2

PostgreSQL比MySQL更符合SQL。输出中的所有字段（除具有聚合函数的计算字段）必须存在于GROUP BY子句中。

Answer 3

MySQL的GROUP BY可以在没有聚合函数的情况下使用（这与SQL标准相反），并返回组中的第一行（我不知道基于什么标准），而PostgreSQL必须具有聚合函数列上的（MAX，SUM等），在其上发布GROUP BY子句。

Answer 4

正确，修复此问题的解决方法是使用：选择并选择您希望用结果对象装饰的每个字段。

令人讨厌 - 但是分组的工作原理是什么，而不是MySQL如何通过猜测你的意思，如果你不在你的组中粘贴字段，那么它是如何工作的。

Answer 5

如果我没记错的话，在PostgreSQL中你必须添加从GROUP BY子句将应用于 GROUP BY子句的表中提取的每一列。

Answer 6

不是最漂亮的解决方案，但更改group参数以输出模型中的每一列都在PostgreSQL中工作：

expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => Available.column_names.collect{|col| "availables.#{col}"},
:order => 'availables.updated_at')

Answer 7

根据MySQL“Debunking GROUP BY Myths”http://dev.mysql.com/tech-resources/articles/debunking-group-by-myths.html。 SQL（标准的2003版本）不要求查询的SELECT列表中引用的列也出现在GROUP BY子句中。

Answer 8

对于其他人在postgresql中寻找任何字段（包括连接字段）的订购方式，请使用子查询：

SELECT * FROM(
SELECT DISTINCT ON(availables.bookdate) `availables`.* 
FROM `availables` INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id 
WHERE (rooms.hotel_id = 5056 
AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
) AS distinct_selected
ORDER BY availables.updated_at

or arel:

subquery = SomeRecord.select("distinct on(xx.id) xx.*, jointable.order_field")
      .where("").joins(")
result = SomeRecord.select("*").from("(#{subquery.to_sql}) AS distinct_selected").order(" xx.order_field ASC, jointable.order_field ASC")

Answer 9

我认为.uniq [1]会解决你的问题。

[1] Available.select('...').uniq

查看http://guides.rubyonrails.org/active_record_querying.html#selecting-specific-fields

PostgreSQL GROUP BY与MySQL不同？

9 个答案:

MySQL的：

Postgres的：