GROUP_CONCAT与FIND_IN_SET,多个连接

时间:2015-11-09 13:29:10

标签: mysql performance join group-concat find-in-set

我想检索设置了某些过滤器的项目。 例如,红色或蓝色和小的列表项应仅返回项目apple。 ((红色(2)或蓝色(4))和小(5))=>苹果

我找到了2个解决方案,但在我看来这两个解决方案过于复杂。 第一个解决方案在我看来更优雅,因为当我想通过AND添加另一个过滤器时,它非常简单。而第二个解决方案将需要另一个JOIN。 我希望我忽略了一些东西,然后有一个更好的解决方案。

问题,

  1. 有更好的解决方案吗?
  2. 如果没有更好的解决方案 - 哪一个更快/推荐?
  3. 项目表

    | id | itemname |
    ├────┼──────────┤
    | 1  | apple    |
    | 2  | orange   |
    | 3  | banana   |
    | 4  | melon    |
    

    过滤表

    │ id │ filtername │
    ├────┼────────────┤
    │ 1  │ orange     │
    │ 2  │ red        │
    │ 3  │ green      │
    │ 4  │ blue       │
    │ 5  │ small      │
    │ 6  │ medium     │
    │ 7  │ big        │
    │ 8  │ yellow     │
    

    item_filter

    │ item_id │ filter_id │
    ├─────────┼───────────┤
    │ 1       │ 2         │
    │ 1       │ 3         │
    │ 1       │ 5         │
    │ 2       │ 1         │
    │ 2       │ 5         │
    │ 3       │ 6         │
    │ 3       │ 8         │
    │ 4       │ 3         │
    │ 4       │ 7         │
    

    基于GROUP_CONCAT和FIND_IN_SET

    的第一个解决方案

    sqlfiddle:http://sqlfiddle.com/#!9/26f99/1/0

    SELECT * FROM item
    JOIN (
        SELECT item_id, GROUP_CONCAT(filter_id) AS filters
        FROM item_filter
        GROUP BY item_id
    ) AS grp ON grp.item_id = item.id
    WHERE (FIND_IN_SET(2,filters) OR FIND_IN_SET(4,filters)) AND FIND_IN_SET(5, filters)
    

    第二种解决方案基于JOIN和where子句

    sqlfiddle:http://sqlfiddle.com/#!9/f0b95/1/0

    SELECT itemname FROM item
    JOIN item_filter as filter1 on item.id=filter1.item_id
    JOIN item_filter as filter2 on item.id=filter2.item_id
    WHERE (filter1.filter_id=2 or filter1.filter_id=4) and filter2.filter_id=5
    

2 个答案:

答案 0 :(得分:3)

我不是MySQL专家,但这是我的两分钱。

您应该使用MySQL EXPLAIN函数来获取有关如何执行查询的详细信息: http://dev.mysql.com/doc/refman/5.7/en/explain-output.html

但在此之前,您应该在关系表中添加一个复合键索引,即:item_filter表;如果没有这样做,EXPLAIN结果将无关紧要,因为后一个表格将针对每个查询进行全面扫描。

现在,在您的两个查询上运行解释,您会注意到您的第二个解决方案显然是性能最高的 (假设您已将索引添加到{{1} } table)

EXPLAIN

不详细说明:

  • 解决方案一执行两次表完整扫描,一次索引查找并读取17行(此外我不相信mysql> EXPLAIN SELECT * FROM item -> JOIN ( -> SELECT item_id, GROUP_CONCAT(filter_id) AS filters -> FROM item_filter -> GROUP BY item_id -> ) AS grp ON grp.item_id = item.id -> WHERE (FIND_IN_SET(2,filters) OR FIND_IN_SET(4,filters)) AND FIND_IN_SET(5, filters); +----+-------------+-------------+-------+---------------+---------+---------+------+------+--------------------------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-------------+-------+---------------+---------+---------+------+------+--------------------------------+ | 1 | PRIMARY | <derived2> | ALL | NULL | NULL | NULL | NULL | 4 | Using where | | 1 | PRIMARY | item | ALL | PRIMARY | NULL | NULL | NULL | 4 | Using where; Using join buffer | | 2 | DERIVED | item_filter | index | NULL | PRIMARY | 8 | NULL | 9 | Using index | +----+-------------+-------------+-------+---------------+---------+---------+------+------+--------------------------------+ 3 rows in set (0.00 sec) mysql> EXPLAIN SELECT itemname FROM item -> JOIN item_filter as filter1 on item.id=filter1.item_id -> JOIN item_filter as filter2 on item.id=filter2.item_id -> WHERE (filter1.filter_id=2 or filter1.filter_id=4) and filter2.filter_id=5; +----+-------------+---------+--------+---------------+---------+---------+--------------------+------+--------------------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+---------+--------+---------------+---------+---------+--------------------+------+--------------------------+ | 1 | SIMPLE | item | ALL | PRIMARY | NULL | NULL | NULL | 4 | | | 1 | SIMPLE | filter1 | ref | PRIMARY | PRIMARY | 4 | test.item.id | 1 | Using where; Using index | | 1 | SIMPLE | filter2 | eq_ref | PRIMARY | PRIMARY | 8 | test.item.id,const | 1 | Using index | +----+-------------+---------+--------+---------------+---------+---------+--------------------+------+--------------------------+ 3 rows in set (0.01 sec) mysql> GROUP_CONCAT性能影响。)

  • 解决方案2执行单个表全扫描,总共只读取6行。

检查 EXPLAIN加入类型文档以获取更多信息: http://dev.mysql.com/doc/refman/5.7/en/explain-output.html#explain-join-types

答案 1 :(得分:1)

第一个解决方案不会有用地使用索引。子查询将使用索引并返回大量记录,但这些记录将在没有索引的情况下进行检查。

例如,如果项目表上有10000行,则子查询将返回1000行。对于这10000行中的每一行,数据库将必须使用函数来检查过滤器。因为它是子查询的结果,所以它不会使用索引(而且,FIND_IN_SET不会使用索引)。

第二个解决方案应该更快(但正如你所说,添加新过滤器的灵活性较低。请注意,你可能希望item_filter表上的索引覆盖item_id和过滤器id(可能还有第二个索引) filter_id列)。

我希望MySQL会将其执行为: -

SELECT itemname 
FROM item_filter as filter2 
JOIN item_filter as filter1 on filter2.id = filter1.item_id
JOIN FROM item on item.id = filter1 .item_id
WHERE (filter1.filter_id=2 or filter1.filter_id=4) and filter2.filter_id=5

这样它可以首先使用最独特的索引,将其连接到第二个过滤器(使用对过滤器2和4的检查缩小的item_id上的索引)然后根据item_id加入项目(我会希望是主要的关键)。