Prueba exacta de Fisher en datos emparejados

9

Dado casos con cáncer de pulmón y controles pareados (sin cáncer de pulmón) (emparejamiento basado en edad, sexo, etc.). Para tratar de encontrar evidencia entre el efecto de fumar en el cáncer de pulmón, utilicé la prueba exacta de Fisher en la tabla de contingencia. Sin embargo, esto no tuvo en cuenta que los controles y los casos coincidían. 4040

Entonces, me preguntaba si hay una manera de usar la prueba exacta de Fisher que tenga en cuenta la coincidencia entre los dos grupos.

Gert
fuente

Respuestas:

8

Necesita la prueba de McNemar ( http://en.wikipedia.org/wiki/McNemar%27s_test , http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3346204/ ). El siguiente es un ejemplo:

Se estudian 1300 pts y 1300 controles coincidentes. El estado de fumar se presenta de la siguiente manera:

             Normal   
           |no  |yes|
Cancer|No  |1000|40 |
      |Yes |200 |60 |

Cada entrada de la tabla muestra información sobre un PAR CASO-CONTROL: 1000 significa en 1000 pares de casos y controles, ninguno era fumador. 40 es el número de pares de casos y controles donde el control era fumador y el paciente con cáncer no, y así sucesivamente. El siguiente código R se puede utilizar para generar esta tabla y hacer la prueba de McNemar.

mat = as.table(rbind(c(1000, 40), c( 200, 60) ))
colnames(mat) <- rownames(mat) <- c("Nonsmoker", "Smoker")
names(dimnames(mat)) = c("Cancer", "Normal")
mat
#                  Normal
#              Nonsmoker Smoker
# Cancer
#  Nonsmoker      1000     40
#  Smoker          200     60


mcnemar.test(mat)

#        McNemar's Chi-squared test with continuity correction
#
#data:  mat
#McNemar's chi-squared = 105.34, df = 1, p-value < 2.2e-16

La prueba de McNemar también se usa para evaluar el efecto de una intervención en una variable de resultado binaria. El par de resultados de antes y después se presenta y prueba como se indicó anteriormente.

Editar: ejemplo extendido dado por @gung, si el estado de fumar aparece en su marco de datos mydf de la siguiente manera:

pairID  cancer  control
1       1       1
2       1       1
3       1       0
...

La prueba de McNemars se puede hacer con los siguientes comandos R:

> tt = with(mydf, table(cancer, control))
> tt
      control
cancer 0 1
     0 5 1
     1 3 2

> mcnemar.test(tt)

        McNemar`s Chi-squared test with continuity correction

data:  tt
McNemar`s chi-squared = 0.25, df = 1, p-value = 0.6171
rnso
fuente
¿Qué prueba usa para múltiples controles por caso, digamos 10 controles por caso?
eXpander
Esto merecería una pregunta y discusión por separado. Creo que se puede emparejar cada caso con la media de sus controles y luego se puede usar la prueba de McNemar.
rnso
5

Tiene razón en que la prueba exacta de Fisher es inapropiada para sus datos. Tendrá que volver a formar su tabla de contingencia. La nueva tabla será para pares , por lo que parecerá tener la mitad de los datos representados (en su caso 40 en lugar de 80). Por ejemplo, imagine que sus datos se ven así (cada conjunto de sujetos emparejados está en su propia fila e 1indica un fumador):

cancer  control
1       1
1       1
1       0
1       0
1       0
0       1
0       0
0       0
0       0
0       0
0       0

Entonces su antigua tabla de contingencia podría haber sido:

       cancer  control
smoker 5       3
non    6       8

Su nueva tabla de contingencia se verá así:

            control
cancer    smoker  non           
  smoker  2       3
  non     1       5

La primera tabla de contingencia sumaba 22 (el número total de sujetos en su estudio), pero la segunda tabla de contingencia suma 11 (el número de pares coincidentes).

Con sus datos representados de esta manera, lo que le interesa es si las proporciones marginales son las mismas. La prueba para eso es la prueba de McNemar . He explicado la prueba de McNemar aquí y aquí .

gung - Restablece a Monica
fuente
1
Tenga en cuenta que la prueba de McNemar para datos dicotómicos es equivalente a la prueba de signos. Por lo tanto, el OP puede usar la prueba de signos (con permutación o prueba de importancia de Monte Carlo, si es necesario).
ttnphns
1
@ttnphns, lo discuto en los hilos vinculados donde explico la prueba de McNemar en detalle.
gung - Restablece a Monica
1

No debería ser necesario utilizar una prueba por parejas. la coincidencia de las poblaciones determina que la distribución de covaraites (edad, ...) es la misma en las dos poblaciones así que no "distorsiona" la imagen.

La prueba compara los medios de las poblaciones, por lo que no es necesario un emparejamiento de individuos. esto solo se requiere para mediciones "repetidas", por ejemplo, comparar menas antes y después del tratamiento de la misma población.

tikacp
fuente
0

Si y no:

probablemente su caso cae dentro del caso de Pearce (2015) : el punto en el artículo es que las variables que usa para seleccionar el control deben controlarse en el estudio y no en la prueba. Eso podría ser difícil debido a la N = 80.

Espero que esto ayude :)

Giovanni Iacopetti
fuente