为什么CTE与Temp表相比这么慢?

时间:2020-07-27 11:01:12

标签: sql sql-server temp-tables

我有一个简单的存储 过程,其中有多个WITH 子句

一些代码是这样的:

WITH cteRowNums AS
(
    SELECT 
        ROW_NUMBER() OVER(ORDER BY fcmp.EmpUserID, fcmp.WorkCellID, fcmp.ActivityTS) AS RowNumber,
        fcmp.ActivityTS, 
        fcmp.ArtifactTypeID, 
        fcmp.ServerDateID, 
        fcmp.ServerHourID, 
        fcmp.EmpUserID, 
        fcmp.WorkCellID
        FROM dbo.FactCassetteMarkingProcessing fcmp
        WHERE ServerDateID >= '2007-01-01'
),
-- Make an attempt at identifying what each user did in their "session" by self-joining
cteJoinCurAndNext AS
(
SELECT
      [Current Row].ArtifactTypeID, 
      [Current Row].ServerDateID, 
      [Current Row].ServerHourID, 
      [Current Row].EmpUserID, 
      [Current Row].WorkCellID
FROM cteRowNums [Current Row] 
    LEFT OUTER JOIN cteRowNums [Next Row] ON [Next Row].RowNumber = [Current Row].RowNumber + 1
        WHERE [Current Row].ArtifactTypeID = 2
        OR ([Current Row].ArtifactTypeID = 1 AND [Next Row].ArtifactTypeID = 2 
                    AND [Current Row].EmpUserID = [Next Row].EmpUserID 
                    AND [Current Row].WorkCellID = [Next Row].WorkCellID)
),
-- Do some aggregations
cteAggregates AS    
(
SELECT 
    EmpUserID,
    ServerDateID,
    ServerHourID, 
    COUNT(NULLIF(ArtifactTypeID, 2)) AS SpecimensProcessedCount,  
    COUNT(NULLIF(ArtifactTypeID, 1)) AS BlocksProcessedCount 
    FROM cteJoinCurAndNext
    GROUP BY EmpUserID, ServerDateID, ServerHourID
)
SELECT * FROM cteAggregates

问题是,对于大约2,5百万行,这需要花费大量时间。我在40分钟取消了执行查询。

如果我使用temporary表更改这段代码,执行速度将大大加快。是否有任何方法仅使用CTEs即可获得几乎相同的性能

1 个答案:

答案 0 :(得分:8)

有两个原因。

可能更重要的原因是SQL Server没有实现CTE。因此,对于每个参考,SQL Server都会重新计算整个CTE。据我所知,SQL Server也不对执行DAG进行常见的子查询优化,因此它总是重新生成CTES(尽管每个实例的执行计划可能不同)。

第二个原因是临时表具有统计信息,这些统计信息可以通知查询计划以创建更好的计划。

我怀疑您可以简化逻辑。但是,您需要问一个 new 问题,并说明您要做什么以及示例数据和所需结果。

相关问题