Costo del operador de búsqueda de índice

9

Para la consulta de base de datos de ejemplo AdventureWorks a continuación:

SELECT 
    P.ProductID, 
    CA.TransactionID
FROM Production.Product AS P
CROSS APPLY
(
    SELECT TOP (1)
        TH.TransactionID
    FROM Production.TransactionHistory AS TH
    WHERE
        TH.ProductID = P.ProductID
    ORDER BY 
        TH.TransactionID DESC
) AS CA;

El plan de ejecución muestra un costo estimado del operador de 0.0850383 (93%) para la búsqueda de índice :

plan

El costo es independiente del modelo de estimación de cardinalidad en uso.

No es una simple adición del costo de CPU estimado y Costo estimado de I / O . Tampoco es el costo de una ejecución de la Búsqueda de índice multiplicado por el Número estimado de ejecuciones .

¿Cómo se llega a este número de costo?

Paul White 9
fuente

Respuestas:

10

La lógica de derivación de costo total es compleja, pero para el caso relativamente simple en la pregunta:

Entradas

  1. El número de veces que se ejecuta el operador
    Este es el número estimado de ejecuciones : 504

  2. La cardinalidad (número total de filas) en el índice
    La propiedad TableCardinality del operador Index Seek da esto: 113,443

  3. El número de páginas de datos en el índice: 201
    Este número se puede obtener de varias maneras, por ejemplo, de sys.allocation_units:

    SELECT 
        AU.data_pages
    FROM sys.allocation_units AS AU
    JOIN sys.partitions AS P
        ON P.hobt_id = AU.container_id
    WHERE
        AU.[type_desc] = N'IN_ROW_DATA'
        AND P.[object_id] = OBJECT_ID(N'Production.TransactionHistory', N'U')
        AND P.index_id = 
            INDEXPROPERTY(P.[object_id], N'IX_TransactionHistory_ProductID', 'IndexID');
  4. La densidad (1 / valores distintos ) del índice: 0.002267574
    Esto está disponible en el vector de densidad de las estadísticas del índice:

    DBCC SHOW_STATISTICS 
    (
        N'Production.TransactionHistory', 
        N'IX_TransactionHistory_ProductID'
    ) 
    WITH DENSITY_VECTOR;

    densidad

Cálculo

-- Input numbers
DECLARE
    @Executions float = 504,
    @Density float = 0.002267574,
    @IndexDataPages float = 201,
    @Cardinality float = 113443;

-- SQL Server cost model constants
DECLARE
    @SeqIO float = 0.000740740740741,
    @RandomIO float = 0.003125,
    @CPUbase float = 0.000157,
    @CPUrow float = 0.0000011;

-- Computation
DECLARE
    @IndexPages float = CEILING(@IndexDataPages * @Density),
    @Rows float = @Cardinality * @Density,
    @Rebinds float = @Executions - 1e0;

DECLARE
    @CPU float = @CPUbase + (@Rows * @CPUrow),
    @IO float = @RandomIO + (@SeqIO * (@IndexPages - 1e0)),
    -- sample with replacement
    @PSWR float = @IndexDataPages * (1e0 - POWER(1e0 - (1e0 / @IndexDataPages), @Rebinds));

-- Cost components (no rewinds)
DECLARE
    @InitialCost float = @RandomIO + @CPUbase + @CPUrow,
    @RebindCPU float = @Rebinds * (1e0 * @CPUbase + @CPUrow),
    @RebindIO float = (1e0 / @Rows) * ((@PSWR - 1e0) * @IO);

-- Result
SELECT 
    OpCost = @InitialCost + @RebindCPU + @RebindIO;

db <> violín

Resultado

Paul White 9
fuente
Buen trabajo, es bueno saber de dónde proviene el costo estimado, qué variables lo afectan y en qué proporción. ¿Es esta la mecánica para todas las versiones de SQL Server? Tal vez algunos cambios en las constantes?
EzLo
2
Este aspecto del costo no ha cambiado desde 2005 hasta donde yo sé.
Paul White 9