SQL compara datos de dos tablas

88

Tengo 2 tablas TableAy TableBque tienen el mismo formato de columna, por ejemplo, ambas tablas TableAy TableBtienen columnas

A B C D E F 

donde A y B son las claves primarias.

Cómo escribir SQL para verificar que si TableAy TableBque tienen las mismas claves primarias contiene exactamente el mismo valor en todas las columnas.

Significa que estas dos tablas tienen exactamente los mismos datos.

Nikky
fuente

Respuestas:

81

Debería poder "MENOS" o "EXCEPTO" dependiendo del tipo de SQL utilizado por su DBMS.

select * from tableA
minus
select * from tableB

Si la consulta no devuelve filas, los datos son exactamente iguales.

dietbuddha
fuente
5
Excelente sugerencia. Sin embargo, creo que esto podría no funcionar si tableB tiene filas adicionales, por lo que es posible que desee comparar los recuentos de filas además.
jzd
5
Revés. No funcionará si tableAtiene filas adicionales. Necesitaría (A EXCEPT B) INTERSECT (B EXCEPT A). Supongo que esto sería mucho menos eficiente que una unión estándar de pantano.
Martin Smith
la consulta devuelve dos conjuntos de resultados
BuZz
Esta consulta devolverá filas con NULLS si las hay.
Reeya Oberoi
5
@Franklin: no, solo debería devolver un conjunto de resultados. Si obtiene dos, use EXCEPT en lugar de MENOS.
MTS
56

Usando operadores relacionales:

SELECT * FROM TableA
UNION 
SELECT * FROM TableB
EXCEPT 
SELECT * FROM TableA
INTERSECT
SELECT * FROM TableB;

Cambie EXCEPTa MINUSpara Oracle.

Punto un poco delicado: lo anterior se basa en la precedencia del operador, que de acuerdo con el estándar SQL depende de la implementación, por lo que YMMV. Funciona para SQL Server, para el cual la prioridad es:

  1. Expresiones entre paréntesis
  2. INTERSECT
  3. EXCEPT y UNION evaluado de izquierda a derecha.
un día cuando
fuente
Para Oracle, debe usar paréntesis alrededor de UNION, paréntesis alrededor de INTERSECT y (como se indica) reemplazar EXCEPT con MINUS. HTH.
Doug Clutter
20

dietbuddha tiene una buena respuesta. En los casos en los que no tenga MENOS o EXCEPTO, una opción es hacer una unión entre las tablas, agrupar con todas las columnas y asegurarse de que haya dos de todo:

SELECT col1, col2, col3
FROM
(SELECT * FROM tableA
UNION ALL  
SELECT * FROM tableB) data
GROUP BY col1, col2, col3
HAVING count(*)!=2
jzd
fuente
Intenté usar esto (lo obtuve del Blog de SQL Server de Jeff ) pero me gustaría enumerar ambas filas de TableA y TableB para poder ver visualmente las diferencias en las filas. ¿Le importaría explicar cómo se hace?
Emmanuel F
@Agent, esto suena como una pregunta separada. Sugeriría incluirlo para que otros lo vean, en lugar de solo un comentario aquí.
jzd
Hecho. Y hecho. Comparar valores de 2 tablas y enumerar las filas que son diferentes . Ojalá obtenga excelentes resultados. :)
Emmanuel F
Esto funciona bien en entornos SQL limitados como Visual FoxPro, ¡gracias!
Kit Roed
1
Solo revisando esto. Vale la pena mencionar que las claves primarias garantizan registros únicos en las tablas. Que si una tabla (o consulta) puede tener filas duplicadas, se sugiere DISTINCT/ GROUP BYpara las subconsultas en la unión, para garantizar que solo haya un registro por tabla. De lo contrario, TableA podría tener 2 registros y TableB podría tener 0 y no cumplir con la condición HAVING.
vol7ron
8
SELECT c.ID
FROM clients c
WHERE EXISTS(SELECT c2.ID 
FROM clients2 c2
WHERE c2.ID = c.ID);

Devolverá todos los ID que sean iguales en ambas tablas. Para obtener las diferencias, cambie EXISTS a NO EXISTS.

imiz
fuente
3

Tomando el script de onedaywhen, lo modifiqué para mostrar también de qué tabla proviene cada entrada.

DECLARE @table1 NVARCHAR(80)= 'table 1 name'
DECLARE @table2 NVARCHAR(80)= 'table 2 name'
DECLARE @sql NVARCHAR (1000)

SET @sql = 
'
SELECT ''' + @table1 + ''' AS table_name,* FROM
(
SELECT * FROM ' + @table1 + '
EXCEPT
SELECT * FROM ' + @table2 + '
) x

UNION 

SELECT ''' + @table2 + ''' AS table_name,* FROM 
(
SELECT * FROM ' + @table2 + '
EXCEPT
SELECT * FROM ' + @table1 + '
) y
'

EXEC sp_executesql @stmt = @sql
Robert Sievers
fuente
2

solo para completar, un proceso almacenado usando el método except para comparar 2 tablas y dar el resultado en la misma tabla con 3 estados de errores, ADD, DEL, GAP table debe tener el mismo PK, usted declara las 2 tablas y campos para comparar de 1 o ambas tablas

Simplemente use como este ps_TableGap 'tbl1', 'Tbl2', 'fld1, fld2, fld3', 'fld4'fld5'fld6' (opcional)

/****** Object:  StoredProcedure [dbo].[ps_TableGap]    Script Date: 10/03/2013 16:03:44 ******/
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO

-- =============================================
-- Author:       Arnaud ALLAVENA
-- Create date: 03.10.2013
-- Description: Compare tables
-- =============================================
create PROCEDURE [dbo].[ps_TableGap]
    -- Add the parameters for the stored procedure here
    @Tbl1 as varchar(100),@Tbl2 as varchar(100),@Fld1 as varchar(1000), @Fld2 as varchar(1000)= ''
AS
BEGIN
    -- SET NOCOUNT ON added to prevent extra result sets from
    -- interfering with SELECT statements.

    SET NOCOUNT ON;
--Variables
--@Tbl1 = table 1
--@Tbl2 = table 2
--@Fld1 = Fields to compare from table 1
--@Fld2 Fields to compare from table 2
Declare @SQL varchar(8000)= '' --SQL statements
Declare @nLoop int = 1 --loop counter
Declare @Pk varchar(1000)= '' --primary key(s) 
Declare @Pk1 varchar(1000)= '' --first field of primary key
declare @strTmp varchar(50) = '' --returns value in Pk determination
declare @FldTmp varchar (1000) = '' --temporarily fields for alias calculation

--If @Fld2 empty we take @Fld1
--fields rules: fields to be compare must be in same order and type - always returns Gap
If @Fld2 = '' Set @Fld2 = @Fld1

--Change @Fld2 with Alias prefix xxx become _xxx 
while charindex(',',@Fld2)>0
begin
    Set @FldTmp = @FldTmp + (select substring(@Fld2,1,charindex(',',@Fld2)-1) + ' as _' + substring(@Fld2,1,charindex(',',@Fld2)-1) + ',')
    Set @Fld2 = (select ltrim(right(@Fld2,len(@Fld2)-charindex(',',@Fld2))))
end
Set @FldTmp = @FldTmp + @Fld2 + ' as _' + @Fld2
Set @Fld2 = @FldTmp

--Determinate primary key jointure
--rule: same pk in both tables
Set @nLoop = 1
Set @SQL = 'Declare crsr cursor for select COLUMN_NAME from INFORMATION_SCHEMA.KEY_COLUMN_USAGE where TABLE_NAME = '''
 + @Tbl1 + ''' or TABLE_SCHEMA + ''.'' + TABLE_NAME = ''' + @Tbl1 +  ''' or TABLE_CATALOG + ''.'' + TABLE_SCHEMA + ''.'' + TABLE_NAME = ''' + @Tbl1 
 + ''' order by ORDINAL_POSITION'
exec(@SQL)
open crsr 
fetch next from crsr into @strTmp
while @@fetch_status = 0
begin 
    if @nLoop = 1 
    begin 
        Set @Pk = 's.' + @strTmp + ' = b._' + @strTmp
        Set @Pk1 = @strTmp
        set @nLoop = @nLoop + 1 
    end 
    Else
    Set @Pk = @Pk + ' and s.' + @strTmp + ' = b._' + @strTmp
fetch next from crsr into @strTmp 

end 
close crsr
deallocate crsr

--SQL statement build
set @SQL = 'select case when s.' + @Pk1 + ' is null then ''Del'' when b._' + @Pk1 + ' is null then ''Add'' else ''Gap'' end as TypErr, '''
set @SQL = @SQL + @Tbl1 +''' as Tbl1, s.*, ''' + @Tbl2 +''' as Tbl2 ,b.* from (Select ' + @Fld1 + ' from ' + @Tbl1
set @SQL = @SQL + ' EXCEPT SELECT ' + @Fld2 + ' from ' + @Tbl2 + ')s full join (Select ' + @Fld2 + ' from ' + @Tbl2 
set @SQL = @SQL + ' EXCEPT SELECT ' + @Fld1 + ' from ' + @Tbl1 +')b on '+ @Pk 

--Run SQL statement
Exec(@SQL)
END
Arnaud ALLAVENA
fuente
2

Fuente: Use NATURAL FULL JOIN para comparar dos tablas en SQL por Lukas Eder

Enfoque inteligente de uso NATURAL FULL JOIN para detectar filas iguales / diferentes entre dos tablas.

Ejemplo 1 - bandera de estado:

SELECT t1.*, t2.*, CASE WHEN t1 IS NULL OR t2 IS NULL THEN 'Not equal' ELSE 'Equal' END
FROM t1
NATURAL FULL JOIN t2;

Ejemplo 2: filtrar filas

SELECT *
FROM (SELECT 't1' AS t1, t1.* FROM t1) t1 
NATURAL FULL JOIN (SELECT 't2' AS t2, t2.* FROM t2) t2 
WHERE t1 IS NULL OR t2 IS NULL -- show differences
--WHERE  t1 IS NOT NULL AND t2 IS NOT NULL    -- show the same

db <> demostración de violín

Lukasz Szozda
fuente
1

Mejora de la respuesta de dietbuddha ...

select * from
(
    select * from tableA
    minus
    select * from tableB
)
union all
select * from
(
    select * from tableB
    minus
    select * from tableA
)
IanMc
fuente
1

Puede encontrar diferencias de 2 tablas usando la combinación de insertar todo y combinación externa completa en Oracle. En sql, puede extraer las diferencias a través de una combinación externa completa, ¡pero parece que insertar todo / primero no existe en sql! Por lo tanto, debe usar la siguiente consulta en su lugar:

select * from A
full outer join B on
A.pk=B.pk
where A.field1!=B.field1
or A.field2!=B.field2 or A.field3!=B.field3 or A.field4!=B.field4 
--and A.Date==Date1

Aunque no se recomienda usar 'OR' en la cláusula where y generalmente produce un rendimiento más bajo, aún puede usar la consulta anterior si sus tablas no son masivas. Si hay algún resultado para la consulta anterior, son exactamente las diferencias de 2 tablas basadas en la comparación de los campos 1, 2, 3, 4. Para mejorar el rendimiento de la consulta, también puede filtrarla por fecha (consulte la parte comentada)

usuario3665906
fuente
0
    SELECT unnest(ARRAY[1,2,2,3,3]) 
    EXCEPT
    SELECT unnest(ARRAY[1,1,2,3,3])
UNION
    SELECT unnest(ARRAY[1,1,2,3,3])
    EXCEPT
    SELECT unnest(ARRAY[1,2,2,3,3])

¡El resultado es nulo, pero las fuentes son diferentes!

Pero:

(
    SELECT unnest(ARRAY[1,2,2,3])
    EXCEPT ALL
    SELECT unnest(ARRAY[2,1,2,3])
)
UNION
(
    SELECT unnest(ARRAY[2,1,2,3])
    EXCEPT ALL
    SELECT unnest(ARRAY[1,2,2,3])
)

trabajos.

Kamil Valenta
fuente
0

Tuve este mismo problema en SQL Server y escribí este script T-SQL para automatizar el proceso (en realidad, esta es la versión diluida, la mía escribió todas las diferencias en una sola tabla para facilitar los informes).

Actualice 'MyTable' y 'MyOtherTable' con los nombres de las tablas que desea comparar.

DECLARE @ColName varchar(100)
DECLARE @Table1 varchar(100) = 'MyTable'
DECLARE @Table2 varchar(100) = 'MyOtherTable'


IF (OBJECT_ID('tempdb..#col') IS NOT NULL) DROP TABLE #col
SELECT  IDENTITY(INT, 1, 1) RowNum , c.name
INTO    #col
FROM    SYS.Objects o 
        JOIN SYS.columns c on o.object_id = c.object_id
WHERE   o.name = @Table1 AND NOT c.Name IN ('List','Columns','YouWantToIgnore')

DECLARE @Counter INT = (SELECT MAX(RowNum) FROM #col)

    WHILE @Counter > 0

        BEGIN
            SET @ColName = (SELECT name FROM #Col WHERE RowNum= @Counter)
                EXEC ('SELECT  t1.Identifier
                        ,t1.'+@ColName+' AS '+@Table1+@ColName+'
                        ,t2.'+@ColName+' AS '+@Table2+@ColName+'
                FROM    '+@Table1+' t1
                        LEFT JOIN '+@Table2+' t2 ON t1.Identifier = t2.Identifier 
                WHERE   t1.'+@ColName+' <> t2.'+@ColName)
            SET @Counter = @Counter - 1 
        END
Cyndi Baker
fuente
0

Escribí esto para comparar los resultados de una vista bastante desagradable que porté de Oracle a SQL Server. Crea un par de tablas temporales, #DataVariances y #SchemaVariances, con diferencias en (lo adivinó) los datos de las tablas y el esquema de las tablas en sí.

Requiere que ambas tablas tengan una clave principal, pero puede colocarla en tempdb con una columna de identidad si las tablas de origen no tienen una.

declare @TableA_ThreePartName nvarchar(max) = ''
declare @TableB_ThreePartName nvarchar(max) = ''
declare @KeyName nvarchar(max) = ''

/***********************************************************************************************

    Script to compare two tables and return differneces in schema and data.

    Author: Devin Lamothe       2017-08-11

***********************************************************************************************/
set nocount on

-- Split three part name into database/schema/table
declare @Database_A nvarchar(max) = (
    select  left(@TableA_ThreePartName,charindex('.',@TableA_ThreePartName) - 1))
declare @Table_A nvarchar(max) = (
    select  right(@TableA_ThreePartName,len(@TableA_ThreePartName) - charindex('.',@TableA_ThreePartName,len(@Database_A) + 2)))
declare @Schema_A nvarchar(max) = (
    select  replace(replace(@TableA_ThreePartName,@Database_A + '.',''),'.' + @Table_A,''))

declare @Database_B nvarchar(max) = (
    select  left(@TableB_ThreePartName,charindex('.',@TableB_ThreePartName) - 1))
declare @Table_B nvarchar(max) = (
    select  right(@TableB_ThreePartName,len(@TableB_ThreePartName) - charindex('.',@TableB_ThreePartName,len(@Database_B) + 2)))
declare @Schema_B nvarchar(max) = (
    select  replace(replace(@TableB_ThreePartName,@Database_B + '.',''),'.' + @Table_B,''))

-- Get schema for both tables
declare @GetTableADetails nvarchar(max) = '
    use [' + @Database_A +']
        select  COLUMN_NAME
             ,  DATA_TYPE
          from  INFORMATION_SCHEMA.COLUMNS
         where  TABLE_NAME = ''' + @Table_A + '''
           and  TABLE_SCHEMA = ''' + @Schema_A + '''
    '
create table #Table_A_Details (
    ColumnName nvarchar(max)
,   DataType nvarchar(max)
)
insert into #Table_A_Details
exec (@GetTableADetails)

declare @GetTableBDetails nvarchar(max) = '
    use [' + @Database_B +']
        select  COLUMN_NAME
             ,  DATA_TYPE
          from  INFORMATION_SCHEMA.COLUMNS
         where  TABLE_NAME = ''' + @Table_B + '''
           and  TABLE_SCHEMA = ''' + @Schema_B + '''
    '
create table #Table_B_Details (
    ColumnName nvarchar(max)
,   DataType nvarchar(max)
)
insert into #Table_B_Details
exec (@GetTableBDetails)


-- Get differences in table schema
            select  ROW_NUMBER() over (order by
                        a.ColumnName
                    ,   b.ColumnName) as RowKey
                 ,  a.ColumnName as A_ColumnName
                 ,  a.DataType as A_DataType
                 ,  b.ColumnName as B_ColumnName
                 ,  b.DataType as B_DataType
              into  #FieldList
              from  #Table_A_Details a
   full outer join  #Table_B_Details b
                on  a.ColumnName = b.ColumnName
             where  a.ColumnName is null
                or  b.ColumnName is null
                or  a.DataType <> b.DataType

        drop table  #Table_A_Details
        drop table  #Table_B_Details

            select  coalesce(A_ColumnName,B_ColumnName) as ColumnName
                 ,  A_DataType
                 ,  B_DataType
              into  #SchemaVariances
              from  #FieldList

-- Get differences in table data
declare @LastColumn int = (select max(RowKey) from #FieldList)
declare @RowNumber int = 1
declare @ThisField nvarchar(max)
declare @TestSql nvarchar(max)



create table #DataVariances (
    TableKey            nvarchar(max)
,   FieldName           nvarchar(max)
,   TableA_Value        nvarchar(max)
,   TableB_Value        nvarchar(max)
)

delete from #FieldList where A_DataType in ('varbinary','image') or B_DataType in ('varbinary','image') 

while @RowNumber <= @LastColumn begin
    set @TestSql = '
        select  coalesce(a.[' + @KeyName + '],b.[' + @KeyName + ']) as TableKey
             ,  ''' + @ThisField + ''' as FieldName
             ,  a.[' + @ThisField + '] as [TableA_Value]
             ,  b.[' + @ThisField + '] as [TableB_Value]
          from  [' + @Database_A + '].[' + @Schema_A + '].[' + @Table_A + '] a 
    inner join  [' + @Database_B + '].[' + @Schema_B + '].[' + @Table_B + '] b
            on  a.[' + @KeyName + '] = b.[' + @KeyName + ']
         where  ltrim(rtrim(a.[' + @ThisField + '])) <> ltrim(rtrim(b.[' + @ThisField + ']))
            or (a.[' + @ThisField + '] is null and  b.[' + @ThisField + '] is not null)
            or (a.[' + @ThisField + '] is not null and  b.[' + @ThisField + '] is null)
'

insert into #DataVariances
exec (@TestSql)

set @RowNumber = @RowNumber + 1
set @ThisField = (select coalesce(A_ColumnName,B_ColumnName) from #FieldList a where RowKey = @RowNumber)

end

drop table #FieldList

print 'Query complete.  Select from #DataVariances to verify data integrity or #SchemaVariances to verify schemas match.  Data types varbinary and image are not checked.'
Devin Lamothe
fuente
0

La mayoría de las respuestas parecen ignorar la cuestión planteada por Kamil. (Ahí es donde las tablas contienen filas idénticas, pero se repiten diferentes en cada tabla). Desafortunadamente, no puedo usar su solución, porque estoy en Oracle. Lo mejor que se me ha ocurrido es:

SELECT * FROM
   (
   SELECT column1, column2, ..., COUNT(*) AS the_count
   FROM tableA
   GROUP BY column1, column2, ...
   MINUS
   SELECT column1, column2, ..., COUNT(*) AS the_count
   FROM tableB
   GROUP BY column1, column2, ...
   )
UNION ALL
   (
   SELECT column1, column2, ..., COUNT(*) AS the_count
   FROM tableB
   GROUP BY column1, column2, ...
   MINUS
   SELECT column1, column2, ..., COUNT(*) AS the_count
   FROM tableA
   GROUP BY column1, column2, ...
   )
Mark W. Bolme
fuente
0

Comparar T1 (PK, A, B) y T2 (PK, A, B).

Primero, compare los conjuntos de claves primarias para buscar valores de clave faltantes en ambos lados:

SELECT T1.*, T2.* FROM T1 FULL OUTER JOIN T2 ON T1.PK=T2.PK WHERE T1.PK IS NULL OR T2.PK IS NULL;

Luego enumere todas las discrepancias de valores:

SELECT T1.PK, 'A' AS columnName, T1.A AS leftValue, T2.A AS rightValue FROM T1 JOIN T2 ON T1.PK=T2.PK WHERE COALESCE(T1.A,0) != COALESCE(T2.A,0)
UNION ALL
SELECT T1.PK, 'B' AS columnName, T1.B AS leftValue, T2.B AS rightValue FROM T1 JOIN T2 ON T1.PK=T2.PK WHERE COALESCE(T1.B,0) != COALESCE(T2.B,0)

A y B deben ser del mismo tipo. Puede utilizar ESQUEMA DE INFORMACIÓN para generar SELECCIONAR. No olvide el COALESCE para incluir también los resultados IS NULL. También puede usar FULL OUTER JOIN y COALESCE (T1.PK, 0) = COALESCE (T2.PK, 0).

Por ejemplo, para columnas de tipo varchar:

SELECT concat('SELECT T1.PK, ''', COLUMN_NAME, ''' AS columnName, T1.', COLUMN_NAME, ' AS leftValue, T2.', COLUMN_NAME, ' AS rightValue FROM T1 JOIN T2 ON T1.PK=T2.PK WHERE COALESCE(T1.',COLUMN_NAME, ',0)!=COALESCE(T2.', COLUMN_NAME, ',0)')
FROM INFORMATION_SCHEMA.COLUMNS 
WHERE TABLE_NAME='T1' AND DATA_TYPE IN ('nvarchar','varchar');
Ludovic Aubert
fuente
0

Podemos comparar datos de dos tablas de tablas DB2 utilizando la consulta simple a continuación,

Paso 1: - Seleccione qué columnas necesitamos comparar de la tabla (T1) del esquema (S)

     SELECT T1.col1,T1.col3,T1.col5 from S.T1

Paso 2: - Utilice la palabra clave 'Menos' para comparar 2 tablas.

Paso 3: - Seleccione qué columnas necesitamos comparar de la tabla (T2) del esquema (S)

     SELECT T2.col1,T2.col3,T2.col5 from S.T1

Resultado final:

     SELECT T1.col1,T1.col3,T1.col5 from S.T1
     MINUS 
     SELECT T2.col1,T2.col3,T2.col5 from S.T1;

Si la consulta no devuelve filas, los datos son exactamente iguales.

Madhushankar MJ
fuente
-1

En MySQL, donde no se admite "menos", y teniendo en cuenta el rendimiento, esta es una

query:
SELECT 
t1.id, 
t1.id 
FROM t1 inner join t2 using (id) where concat(t1.C, t1.D, ...)<>concat(t2.C, t2.D, ...)
Jehad Keriaki
fuente
-1

Una consulta alternativa mejorada basada en la respuesta de dietbuddha e IanMc. La consulta incluye una descripción para mostrar de manera útil dónde existen filas y dónde faltan. (NB: para SQL Server )

(
    select 'InTableA_NoMatchInTableB' as Msg, * from tableA
    except
    select 'InTableA_NoMatchInTableB' , * from tableB
)
union all
(
    select 'InTableB_NoMatchInTableA' as Msg, * from tableB
    except
    select 'InTableB_NNoMatchInTableA' ,* from tableA
)
Terry C
fuente
-1
SELECT * 
FROM TABLE A
WHERE NOT EXISTS (SELECT 'X' 
                  FROM  TABLE B 
                  WHERE B.KEYFIELD1 = A.KEYFIELD1 
                  AND   B.KEYFIELD2 = A.KEYFIELD2 
                  AND   B.KEYFIELD3 = A.KEYFIELD3)
;

'X' es cualquier valor.

Cambie las tablas para ver las diferentes discrepancias.

Asegúrese de unir los campos clave en sus tablas.

O simplemente use el operador MINUS con 2 sentencias de selección, sin embargo, MINUS solo puede funcionar en Oracle.

HEXU55
fuente
menos no se admite en todas las implementaciones. (por ejemplo, el servidor utiliza excepto el servidor).
Sir maldice mucho