Necesita la prueba de McNemar ( http://en.wikipedia.org/wiki/McNemar%27s_test , http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3346204/ ). El siguiente es un ejemplo:
Se estudian 1300 pts y 1300 controles coincidentes. El estado de fumar se presenta de la siguiente manera:
Normal
|no |yes|
Cancer|No |1000|40 |
|Yes |200 |60 |
Cada entrada de la tabla muestra información sobre un PAR CASO-CONTROL: 1000 significa en 1000 pares de casos y controles, ninguno era fumador. 40 es el número de pares de casos y controles donde el control era fumador y el paciente con cáncer no, y así sucesivamente. El siguiente código R se puede utilizar para generar esta tabla y hacer la prueba de McNemar.
mat = as.table(rbind(c(1000, 40), c( 200, 60) ))
colnames(mat) <- rownames(mat) <- c("Nonsmoker", "Smoker")
names(dimnames(mat)) = c("Cancer", "Normal")
mat
# Normal
# Nonsmoker Smoker
# Cancer
# Nonsmoker 1000 40
# Smoker 200 60
mcnemar.test(mat)
# McNemar's Chi-squared test with continuity correction
#
#data: mat
#McNemar's chi-squared = 105.34, df = 1, p-value < 2.2e-16
La prueba de McNemar también se usa para evaluar el efecto de una intervención en una variable de resultado binaria. El par de resultados de antes y después se presenta y prueba como se indicó anteriormente.
Editar: ejemplo extendido dado por @gung, si el estado de fumar aparece en su marco de datos mydf de la siguiente manera:
pairID cancer control
1 1 1
2 1 1
3 1 0
...
La prueba de McNemars se puede hacer con los siguientes comandos R:
> tt = with(mydf, table(cancer, control))
> tt
control
cancer 0 1
0 5 1
1 3 2
> mcnemar.test(tt)
McNemar`s Chi-squared test with continuity correction
data: tt
McNemar`s chi-squared = 0.25, df = 1, p-value = 0.6171
Tiene razón en que la prueba exacta de Fisher es inapropiada para sus datos. Tendrá que volver a formar su tabla de contingencia. La nueva tabla será para pares , por lo que parecerá tener la mitad de los datos representados (en su caso 40 en lugar de 80). Por ejemplo, imagine que sus datos se ven así (cada conjunto de sujetos emparejados está en su propia fila e
1
indica un fumador):Entonces su antigua tabla de contingencia podría haber sido:
Su nueva tabla de contingencia se verá así:
La primera tabla de contingencia sumaba 22 (el número total de sujetos en su estudio), pero la segunda tabla de contingencia suma 11 (el número de pares coincidentes).
Con sus datos representados de esta manera, lo que le interesa es si las proporciones marginales son las mismas. La prueba para eso es la prueba de McNemar . He explicado la prueba de McNemar aquí y aquí .
fuente
No debería ser necesario utilizar una prueba por parejas. la coincidencia de las poblaciones determina que la distribución de covaraites (edad, ...) es la misma en las dos poblaciones así que no "distorsiona" la imagen.
La prueba compara los medios de las poblaciones, por lo que no es necesario un emparejamiento de individuos. esto solo se requiere para mediciones "repetidas", por ejemplo, comparar menas antes y después del tratamiento de la misma población.
fuente
Si y no:
probablemente su caso cae dentro del caso de Pearce (2015) : el punto en el artículo es que las variables que usa para seleccionar el control deben controlarse en el estudio y no en la prueba. Eso podría ser difícil debido a la N = 80.
Espero que esto ayude :)
fuente