使用嵌套选择优化查询

时间:2012-07-23 05:48:06

标签: postgresql query-optimization

是否可以优化以下查询? webdte.docto a是一个非常大的表,在所有查询的列上都有数百万个条目并运行索引。最终的排序顺序非常重要。

SELECT 
   id_doc,
   id_tip_doc,
   id_est_doc,
   folios.nro_fol,
   seleccionable
FROM
(
   SELECT distinct(nro_fol)
   FROM webdte.docto 
   WHERE
      id_tip_doc IN
      (
         SELECT distinct(id_tip_doc)
         FROM webdte.docto
         WHERE id_doc IN
         (
            SELECT id_doc
            FROM webdte.lib_doc
            WHERE id_lib = 37
         )
      ) AND
      id_doc IN
      (
         SELECT id_doc
         FROM webdte.lib_doc
         WHERE id_lib = 37
      )
) AS folios JOIN webdte.docto AS docs ON docs.nro_fol = folios.nro_fol
ORDER BY id_tip_doc, folios.nro_fol, id_est_doc;

对不起,这是我的第一个查询方法的解释。 Egalitarian的答案已经很好了,但也许它可以更快?谢谢!

Sort  (cost=13745.13..13805.42 rows=24115 width=22)"
  Sort Key: docs.id_tip_doc, docto.nro_fol, docs.id_est_doc"
  ->  Hash Join  (cost=9240.19..11492.84 rows=24115 width=22)"
        Hash Cond: (docto.nro_fol = docs.nro_fol)"
        ->  HashAggregate  (cost=4424.81..4665.91 rows=24110 width=6)"
              ->  Hash Semi Join  (cost=733.75..4364.54 rows=24110 width=6)"
                    Hash Cond: (docto.id_doc = lib_doc.id_doc)"
                    ->  Seq Scan on docto  (cost=0.00..2885.28 rows=105128 width=10)"
                    ->  Hash  (cost=432.38..432.38 rows=24110 width=4)"
                          ->  Seq Scan on lib_doc  (cost=0.00..432.38 rows=24110 width=4)"
                                Filter: (id_lib = 37)"
        ->  Hash  (cost=2885.28..2885.28 rows=105128 width=22)"
              ->  Seq Scan on docto docs  (cost=0.00..2885.28 rows=105128 width=22)"

2 个答案:

答案 0 :(得分:1)

我认为你可以简化为:

SELECT id_doc
      ,id_tip_doc
      ,id_est_doc
      ,nro_fol
      ,seleccionable
FROM   webdte.docto d
WHERE  EXISTS (
   SELECT 1
   FROM   webdte.docto   d0
   JOIN   webdte.lib_doc l USING (id_doc)
   WHERE  l.id_lib = 37
   AND    d0.nro_fol = d.nro_fol
   )
ORDER  BY id_tip_doc, nro_fol, id_est_doc;

由于EXISTS,不应该需要DISTINCT。如果nro_fol上有许多重复项,这可以加快查询速度 您的原始查询非常多余。

答案 1 :(得分:0)

我认为获取唯一id_tip_doc的where子句没有太大意义,因为你总是选择distinct(nro_fol)。虽然优化此查询的最佳方法之一是使用正确的索引,然后重新编写查询。

您可以创建以下索引(虽然它还取决于您的其他查询): 1. webdte.lib_doc:id_lib 2. webdte.docto:id_doc + nro_fol

select id_doc,id_tip_doc,id_est_doc,  folios.nro_fol ,seleccionable 

from(select distinct(nro_fol)          来自webdte.docto            哪里            id_doc in(从webdte.lib_doc中选择id_doc,其中id_lib = 37)        )对开页 在docs.nro_fol = folios.nro_fol上加入webdte.docto docs 按id_tip_doc,folios.nro_fol,id_est_doc;

排序